1917년 뉴욕의 한 전시장, 미술계를 뒤집어 놓을 작품이 등장해요. R-Mutt란 서명과 함께 웬 변기가 하나 전시장에 놓인 건데요. 당시 주최측은 공산품을 작품으로 볼 수 없다며 전시를 거부했지만, 이 일은 미술계에 엄청난 파장을 일으켰어요. 네, 모두가 잘 알고 있는 마르셀 뒤샹의 <샘> 이야기입니다. 이 사건 이후 무언가를 발견하고 선택해 메시지를 던지는 것만으로도 예술이 될 수 있다는 인식이 자리잡았어요.

기술이 발전하며 이러한 인식에는 한 차례 더 변화가 생겼어요. 새로운 소재와 기술을 적극적으로 활용한 여러 창작 시도가 이뤄지기 시작했거든요. 힘들게 원본을 옮기는 대신 3D 스캔, 프린팅 기술을 활용해 복사본을 전세계에 전시하기도 해요. 이렇듯 예술은 이제 작품 자체의 심미성보다 그 너머의 ‘소통’에 더 관심이 많아요. 세상을 향해 메시지를 던지고 더 많은 사람과 이야기 나누길 원하죠. 

최근 화제인 AI 이미지 생성 모델도 이와 비슷한 맥락을 가져요. 비록 예술 작품이라기 보단 작업에 의한 결과물에 가깝다고 할 수 있겠지만, 미술이나 디자인을 전공하지 않아도 창작 활동을 할 수 있도록 했다는 점에서 중요한 의미가 있습니다. 오늘은 창작의 경계와 허들을 낮추고 사람과 기술 그리고 예술을 잇는 AI 이미지 생성 모델, ‘칼로(Karlo)’를 여러분에게 소개해드릴게요. 

| 더 똑똑하고 정교해진 AI 아티스트

칼로(Karlo)는 카카오브레인의 초거대 AI 이미지 생성 모델입니다. 올해 7월 공개된 칼로 2.0은 기존의 칼로 1.4 모델을 대폭 업그레이드해 더 풍성하고 향상된 기능을 제공하는데요. 약 3억 장 규모의 이미지-텍스트를 학습해 세계 최고 수준의 언어 이해력을 갖춘 점이 가장 큰 특징이에요. 학습 규모를 대폭 늘린 덕분에 칼로 1.4에 비해 칼로 2.0은 복잡한 프롬프트(명령어)도 명확히 이해하고, 픽셀 단위로 완전히 새로운 이미지를 빠르게 생성할 수 있어요. 뿐만 아니라 사물, 배경, 조명, 구도 등을 지정해 공간감과 입체감을 높이고, 동물의 털과 같은 텍스처의 세밀함도 보강되었습니다.

칼로의 특장점은 화풍이 다양하다는 거예요. 예를 들어 미드저니는 결과물에서 특정 화풍이 보이는데, 칼로는 화풍이 다채로워요. 르네 마그리트나 클로드 모네의 화풍으로 그려달라고 하면 구현해내요. ‘부자 호랑이’와 ‘가난한 호랑이’처럼 추상적인 텍스트를 줘도 이해하고 생성하고요. – 김세훈 칼로 2.0 총괄디렉터(2023.07)

이미지 생성 속도와 해상도 역시 향상되었어요. 이제 3초면 최대 2048x2048px 해상도의 이미지를 만들어낼 수 있어요. 무료로 생성할 수 있는 이미지 수는 기존 500장에서 무려 60만 장까지 확대했답니다. 이는 일반 스타트업 기업이나 개발자가 사용할 수 있는 글로벌 최대 수준의 무료 이미지 생성 횟수예요. 

칼로 1.4칼로 2.0
생성 속도 6초3초
해상도1024*10242048*2048
API 무료제공500장60만장

| 칼로가 선택한 길

이렇게 좋은 칼로 2.0, 어떻게 쓸 수 있냐고요? 카카오브레인은 칼로 2.0 API를 카카오디벨로퍼스를 통해 무료로 공개했어요. 누구나 저작권 걱정 없이 사용할 수 있죠. 칼로 1.4에 이어 칼로 2.0의 공개 API를 선택한 데에는 국내외 플랫폼에 기술을 개방·공유하고 ‘오픈 커뮤니티’를 형성해 생태계와 시장 자체의 영향력을 키우겠다는 카카오브레인의 의지가 담겨 있어요. 

카카오브레인은 생각하지 못한 물음(UNTHINKABLE QUESTION)을 던지고 사람과 기술 간 대화를 이어나가려 해요. 이 대화로부터 기술이 발전할 수 있고, 나아가 모두의 생활을 변화시킬 수 있다고 믿거든요. 칼로를 통해 이루고 싶은 목표도 마찬가지예요. 특정 그룹이나 전문가만을 대상으로 칼로를 선보일 생각은 앞으로도 없습니다. 칼로가 선택한 길은, 누구나 언제든 자유롭게 참여하고 대화할 수 있는 아주 크고 넓은 길이에요. 재미로 사용하는 사람부터 전문적 스킬을 가진 사람까지, 다양한 스펙트럼의 사용자를 모두 포용함으로써, 사람과 기술을 잇는 커뮤니케이터가 되는 것이 칼로의 목표입니다. 

(생성 AI는) 앞으로 모두가 쓰게 될 거예요. 카카오브레인 사옥이 어디있는지 궁금한 사람, 30장 짜리 PPT 자료를 10분 내로 만들어야 하는 사람 모두가요. 세상의 정보를 얻는 방식, 일하는 방식이 바뀌고 있어요. 나만 이걸 왜, 어떻게 써야 하는지 모르면 나중에 쫓아가기 어렵지 않을까요.

범용성을 끌어올리는 것도 (칼로의) 중요한 목표예요. 다양한 부가가치를 창출하는 데 바탕이 되는 좋은 ‘백본Backbone 모델’, 즉 육수를 만드는 거죠. 음식 베이스가 되는 육수가 좋으면 다양한 음식을 만들 수 있잖아요. 저희가 만든 칼로가 범용모델로서 다양한 제품의 베이스가 된다면 10억 인구, 더 많은 인류에 영향을 줄 수 있지 않을까 생각해요. – 이동훈 칼로 2.0 연구팀장(2023.07)

📍 ’칼로의 꿈’ 시리즈 다른 콘텐츠 보기

→ ② 이미지 생성 AI, 현실 세계에서 직접 경험해보세요

→ ③ 여러분의 목소리, 연구·개발자만큼이나 중요해요