2022년 12월 20일 Karlo API가 세상에 공개 되었다는 반가운 소식 전해드립니다. 카카오브레인은 AI 아티스트 Karlo를 대중에게 공개하기로 결정하고 Karlo의 API를 카카오디벨로퍼스에 업로드했습니다.

카카오브레인의 Karlo(칼로) API는, 사용자가 입력한 문장과 이미지를 기반으로 새로운 이미지를 만드는Text-Image 생성형 AI입니다. Karlo는 1억 8천만 장 규모의 이미지-텍스트 학습을 통해 사용자가 묘사한 내용을 이해하고, 픽셀 단위로 완전히 새로운 이미지를 생성합니다. 또한 사용자가 원하는 콘셉트에 맞춰 사물, 배경, 조명, 구도, 다양한 화풍 창작의 기반을 지원합니다.

칼로는 주어진 텍스트나 이미지의 맥락을 이해해 여러 가지 작업을 해낼 수 있습니다. Karlo의 기반 기술 ‘Diffusion Model’은 텍스트의 맥락을 고려해 새롭게 이미지를 픽셀단위로 완성 시켜나가는 방식으로 기존에 쓰이던 패치단위 조합 기술과는 다른 방식입니다. 아래 이미지는 실제 랜덤 노이즈로 출발해 이미지가 완성되어 나가는 과정을 요약한 것이랍니다.

Karlo에 텍스트 프롬프트를 입력했을 때 실제 랜덤 노이즈로 출발해 이미지가 완성되어 나가는 과정

이미지 생성하기

Karlo의 프롬프트에서 생성할 이미지를 묘사하는 제시어를 입력하면 Karlo는 그것을 바탕으로 새로운 이미지를 생성합니다. 제시어로 ‘계절’과 같은 시기적 특징을 반영하도록 하거나, 특정 작가의 스타일을 사용하도록 지정할 수도 있습니다.

이미지 변환하기

기준이 되는 이미지를 바탕으로 프롬프트의 내용을 이해해 새로운 이미지를 생성하는 과정입니다. Karlo는 기준이 되는 이미지에 무엇이 어떻게 그려져 있는지를 먼저 파악한 후, 거기에 다른 특징과 구도를 적용해 새로운 이미지를 그려냅니다.

이미지 편집하기

Karlo가 입력된 텍스트에 따라 이미지의 일부 영역을 사용자 의도에 맞게 편집하는 과정입니다. 이미지에서 편집하고 싶은 부분을 표시해 함께 프롬프트로 전달하면, Karlo는 해당 부분을 주변과 어울리도록 편집해 새로운 이미지를 생성합니다. 프롬프트의 제시어가 있다면, 요구사항에 맞춰 사물을 대입하거나 변경해 이미지를 편집하기도 합니다.

카카오 디벨로퍼스에서는 하나의 계정당 총 60건 API를 사용할 수 있는데요. 무료 사용 회수를 모두 소진했다면 카카오브레인에서 출시한 이미지 생성 서비스 ‘B^ DISCOVER’ 앱에서도 Karlo를 체험하실 수 있습니다.


추가 테스트를 하거나 Karlo와 본격적인 협업을 진행하고 싶다면 공식 메일 계정 contact@kakaobrain.co.kr을 통해 문의해 주세요!

Karlo API 바로 가기