세상을 바꾸는 질문을 던지는 사람들의 이야기 :: 2023 카카오브레인 설명회

“카카오브레인은 뭐하는 곳이야?”

혹시 이런 질문, 듣거나 해본 적 있나요? 그렇다면 잘 찾아오셨습니다. 오늘 그 질문에 가장 완벽한 답을 들려 드릴게요. 지난 3월 2일, 온라인으로 카카오브레인 설명회가 열렸습니다. 이날 설명회에는 카카오브레인이 어떤 비즈니스를 어떤 목표를 가지고 또 어떻게 이어가고 있는지, 진지하고 때론 유쾌하게 이야기 나눌 수 있는 시간이었어요. 그날의 이야기를 한눈에 볼 수 있도록 정리했습니다.


AI가 공기처럼 당연한 세상

Large-scale AI(초거대 AI)는 인간의 생애주기와 유사한 부분이 있어요. 인간은 출생 이후, 자연어, 인식, 학습, 추론 등을 통해 지능을 발전시켜 나가는데 이러한 과정은 초거대 AI의 학습 방식과 유사합니다. 유아기의 인간이 다양한 경험과 자극을 받으며 지적 능력을 확보해 나가는 것처럼 초거대 AI는 데이터와 알고리즘을 통해 기능적인 뼈대를 형성해요. 이후 인간은 다양한 경험과 지식을 축적하며 발전하는데, 초거대 AI 역시 데이터를 끊임없이 학습함으로써 추론 역량을 향상시켜 나가죠. 이제 AI는 소리나 이미지, 사물을 잘 인식하는 것을 넘어서 끊임없는 학습을 통해 추론 역량을 향상시켜 나가고 있으며, 사람 수준의 창의력을 가진 ‘생성 모델’의 시대로 접어들게 되었어요.

생성 모델(Generative AI)이란 학술적으로는 샘플 데이터의 확률을 찾는 AI를 뜻합니다. 다른 모델로는 식별 모델(Discriminative AI)이 있는데, 식별 모델은 입력 데이터와 특정 클래스의 라벨 데이터를 학습해 판별 경계를 찾아내는 방식으로 작동해요. 쉽게 말해 데이터를 분류하는 데 사용되죠. 반면 생성 모델은 학습 데이터셋에서 데이터의 패턴을 파악하고, 그 패턴과 유사한 새로운 데이터를 생성할 수 있어요. 인식을 뛰어 넘어 훨씬 높은 수준의 태스크도 해결할 수 있는 모델인 셈이에요. 최근 화제인 ChatGPT,  DALL-E 2 모두 이런 패러다임 속에서 탄생했어요. 카카오브레인도 마찬가지입니다. AI가 모두의 일상에 자연스럽게 스며들어 마치 공기처럼 당연해질 세상을 카카오브레인은 준비하고 있어요.


AI 경쟁력의 3차원: 인프라, 데이터, 알고리즘

“카카오브레인은 뭐하는 곳이야?” 이제 이 질문에 답해볼게요. 카카오브레인은 ‘Large-scale Generative AI(초거대 생성 모델)를 만드는 회사’입니다. 사람의 뇌(Brain)처럼 생각하고 행동하는 AI를 통해 기존에 없던 질문을 던지며 인류가 지금까지 풀지 못했던 난제에 도전해요. 

이런 카카오브레인에는 크게 세 가지 비즈니스 축이 있어요. 텍스트를 기반으로 이미지를 만드는 Text to Image 모델인 ‘Karlo’, 의료 영상을 보고 판독문을 생성하는 Image to Text 분야의 ‘헬스케어’, 2년 전부터 오픈 소스를 공개하며 계속 기술을 고도화하고 있는 Text to Text 언어모델 이렇게요. 그리고 이 세 가지를 강력하게 서포트하는 브레인 클라우드팀이 있습니다.

2017년, 카카오의 AI 연구전문 자회사로 출발한 카카오브레인은 이제 글로벌 AI 시장에서도 탄탄한 경쟁력을 갖춘 기업으로 자리잡았어요. 카카오브레인의 AI 경쟁력은 대규모 AI 모델 보유, 데이터셋 구축, 강력한 인프라 구축 이렇게 세 가지 차원으로 설명할 수 있는데요.

  • 먼저, 대규모 AI 모델 차원의 경우 헬스케어나 칼로 팀의 연구실적을 얘기할 수 있어요. 멀티모달 및 이미지·텍스트 관련 연구에서 좋은 성과가 꾸준히 나오고 있고, 그 성과들을 각 사업에 적극적으로 연동하고 있습니다.
  • 데이터 차원에서도 경쟁 우위를 차지하고 있어요. 작년 여름 공개한 국내 최대 규모의 이미지·텍스트 데이터셋 ‘코요(Coyo)’나 헬스케어 분야에서는 대학 병원과 의료영상 분야에서의 초거대 AI 모델 연구를 위한 공동 연구 계약 체결을 진행해오고 있습니다.
  • 마지막으로 인프라에서는 카카오브레인이 보유한 최신 GPU 뿐만 아니라, 최근 언어모델 팀을 중심으로 개개인이 SuperPOD(NVIDIA의 AI 슈퍼컴퓨터)에 준하는 인프라를 가질 수 있을 정도로 투자 규모를 늘리려 하고 있어요.

초거대 AI는 앞으로 기존 서비스를 발전시키는 수준이 아니라 사용자 경험(UX)을 완전히 바꿔놓을 거예요. 저는 이런 변화가 모든 것을 리셋해버릴 만큼의 파급력이 있다고 믿어요. 카카오브레인은 바로 그 ‘리셋 모먼트’를 준비하는 조직이에요. 카카오에 도움을 주는 AI 연구개발사 정도가 아닌, 넥스트 카카오가 되는 것이 카카오브레인의 목표입니다. (CEO Curtis)


누구도 경험하지 못했던 변화의 시작, KoGPT

초거대 AI 언어모델을 잘 하려면 앞서 얘기한 세 가지 경쟁력, 데이터 인프라 알고리즘이 중요해요. 카카오브레인은 이 세가지 경쟁력을 갖춘 선구 연구그룹 중 한 곳이에요. 한국어라는 차별점과 초거대 AI 언어모델에 대한 제반 기술을 탄탄히 보유하고 있죠. 2년 전엔 자체 개발한 KoGPT라는 언어모델을 선보였고, 얼마 전 KoGPT를 누구나 쓸 수 있도록 API를 공개하기도 했어요. 

이렇게 소스를 공개하는 이유는 카카오브레인이 ‘오픈 커뮤니티’를 추구하기 때문이에요. 최근 전세계적으로 관심을 끌고 있는 ChatGPT도 갑자기 등장한 것 같겠지만, 사실 구글의 트랜스포머라는 기술 위에서 만들어졌어요. 그리고 그 트랜스포머는 또 다른 기술을 기반으로 합니다. 이렇듯 인공지능 생태계는 서로 기술과 정보를 공유하며 성장하고 있어요. 카카오브레인도 이 생태계 일원으로서 언어모델 관련 성과를 커뮤니티에 계속 공유하고, 특히 올 봄에는 300억 수준의 대규모 언어모델을 확보할 예정입니다.

이젠 아무도 AI를 두고 ‘창작은 안 될 거야’라고 하지 않아요. 대신 ‘창작하는 데 어떻게 쓰지?’를 묻는 세상이 되었죠. ChatGPT를 보면 언어모델이 우리 생활에 어디까지 영향을 미칠지 가늠조차 되지 않아요. 어쩌면 우리가 경험한 그 어떤 기술보다도 더 큰 변화를 불러올지도 몰라요. 카카오브레인은 이런 언어모델이 세상에 긍정적인 변화를 만들도록 노력할 거예요. 그리고 이 변화에 모두가 동참할 수 있도록 꾸준히 메시지를 던질 겁니다. ‘우리 이 문제를 같이 풀어보자’고요. 

카카오브레인이 만든 결과물들은 사실 초거대 AI에 필요한 데이터의 수집부터 가공 및 학습, 그리고 운영까지가 한 데 모인 집약체거든요. 세계적으로 보더라도 이렇게 풀스택(Full Stack)에 가까운 종합 AI 기술 역량을 보유한 곳은 많지 않다고 생각해요. 적어도 국내에서는 압도할 수 있는 경쟁력을 가져가기 위해 투자를 아끼지 않을 예정입니다. (CTO Lucas)


창작하고 편집하는 AI, Karlo

칼로(Karlo)는 카카오브레인이 2022년 선보인 T2I(Text to Image) 생성 모델이에요. 최근 더 좋은 품질의 이미지를 생성하기 위한 기술과 국문으로 프롬프트를 입력할 수 있는 칼로 한국어 버전을 위한 기술 확보를 위해 노력하고 있어요.

지금까지 칼로를 기반으로 두 개 제품이 출시되었는데요. 첫 번째는 비디스커버(B^ DISCOVER)라는 앱이에요. 몇 가지 제시어로 세상에 없는 이미지를 만들고 이를 공유하는 데 특화된 제품이랍니다. 최근 업데이트를 통해 추가된 ‘AI 프로필’은 사용자의 사진 하나로 다양한 배경 및 콘셉트의 이미지 100개를 약 1분 내로 그려주는 기능이에요. 올해 상반기에는 이렇게 생성된 프로필 이미지에 사용자의 목소리와 모션을 입혀 영상을 만들어주는 ‘AI 모션 서비스’도 선보일 예정이에요.

두 번째는 비에디트(B^ EDIT)이라는 제품이에요. 비에디트는 텍스트로 이미지를 생성하는 것뿐만 아니라, 이미지 내 일부분을 편집하는 인페인팅과 자동으로 이미지 바깥 영역을 채우는 아웃페인팅 기능이 포함된 일종의 편집 도구예요. 현재 오픈베타 서비스를 시행하고 있어요. 

칼로의 제품과 기술이 선택받는 것도 중요하지만, 우리나라 기업들이 AI 기술을 활용해 그들의 제품과 경쟁력을 키울 수 있도록 돕는 것도 카카오브레인의 중요한 미션이에요. 카카오브레인은 이 미션을 수행하기 위해 ‘칼로 100X’란 프로그램을 진행하고 있는데요. 프로젝트에 선정된 기업에게는 카카오브레인의 AI 기술과 인프라는 물론, 필요하다면 금전적인 투자도 제공해 기업이 100배 이상의 가치를 창출할 수 있도록 지원해요. 이를 통해 버티컬 비즈니스 영역에서 이미지 생성 AI가 어떻게 적용될 수 있는지 함께 탐구하고, 나아가 스타트업과 카카오브레인이 상생할 수 있는 기회를 더 많이 만들어 나갈 예정입니다. 

Q. 칼로 사업실 혹은 카카오브레인만의 조직문화가 있을까요?

“소통이 굉장히 많아요. 칼로 사업실엔 연구자, PO, 기획자, 디자이너, 개발자, 마케터 등 다양한 분이 있는데, 중요한 의사결정을 내려야 할 때 이 구성원이 다같이 모여서 얘기를 나누고 결정하는 경우가 많아요. 다양한 관점에서 다양한 의견을 수용하는 이런 문화가 카카오브레인의 성장 비결 아닐까 싶어요.” (칼로사업실 실장 Zane)

“연구자로서는 역할이 국한되지 않는다는 걸 많이 느껴요. 연구개발부터 서비스, 나아가 기획이나 마케팅까지 파이프라인이 잘 구성되어 있기 때문에 제가 개발한 모델이 기능화 되어 서비스로 출시되고 사용자 피드백을 받는 등 프로세스 전반에 참여할 수 있어요. 이런 점이 실제로 일하면서도 좋았던 부분이고, 저희만의 차별화된 조직문화인 것 같아요.” (리서치 디렉터 Sam)


Q. 앞으로 어떤 동료와 함께하고 싶나요?

“Sam처럼 AI 연구자의 경험과 전문성이 있는 동료도 필요하고, 사용자 관점에서 생각하고 가치 전달을 책임지는 서비스 경험이 있는 동료도 필요해요. 저처럼 사용자 가치를 위한 프로덕트를 정의하는 PO 역할도 물론 필요하고요. 무엇보다 카카오브레인, 그리고 칼로 사업실은 원팀으로 일하는 곳이기 저희와 함께 원팀이 되어주실 분이면 좋겠어요.” (비디스커버 서비스팀 리더 Joy)


“제 경우 개발 백그라운드가 없어요. 디자인을 전공하고 기획을 했었는데요. AI라는 분야가 아직도 가능성이 무궁무진하고 미지의 세계이기도 해서, 어떤 스킬이 필요하다기 보단 탐구에 대한 의지나 호기심이 중요한 것 같아요. 그런 분이라면 주변에서 많이 도와주시기 때문에 지식을 습득하고 함께 일하는 데 큰 문제는 없을 거라고 생각합니다.” (전략팀 리더 San)


진단과 치료의 효율성을 극대화하다, Healthcare

카카오브레인 헬스케어는 기본적으로 초거대 AI 기술을 통해 진단과 치료 분야에 혁신을 일으키는 팀이에요. 핵심 비즈니스로는 의료 진단 최적화 솔루션인 AI CAD와 AI를 통해 시간을 줄이고 성공률은 높인 AI 신약 개발이 있어요.

우리가 병원에 가면 여러 검사를 하잖아요. 이때 의료진은 검사 결과에 대한 해석을 포함해 질병이나 상태를 진단하는 판독문을 작성합니다. 컴퓨터를 활용한 진단모델을 통칭하여 AI CAD(Computer Aided Diagnosis)라고 부르고 있는데요. 카카오브레인은 판독문을 자동으로 생성해줄 수 있는 AI CAD 소프트웨어를 만들고자 해요. 사실 의료진의 의사결정을 돕는 비슷한 소프트웨어가 이미 시장에 몇 있지만, 한정된 문제만을 풀고 있고 일부 환경에서만 제대로 작동하는 등의 한계가 있는 상황이에요. 헬스케어 팀은 이런 한계를 카카오브레인만의 강점으로 해결합니다. 

우선 이미지와 텍스트를 페어링해 학습할 수 있는 초거대 AI 기술을 보유하고 있다는 점이 가장 큰 강점이에요. 그리고 이 AI가 꾸준히 학습하며 발달할 수 있도록 전 세계 최대 규모의 흉부 엑스레이 데이터셋을 갖추고 있다는 점도 중요해요. 마지막으로 국내외 11개 이상의 병원과 공동연구를 진행해 사용자의 피드백과 AI의 학습이 반복되는 데이터 선순환 구조를 만들고자 노력하고 있어요. 이런 일련의 과정은 결국 고객의 신뢰로 이어질거라 기대하고 있습니다. 

AI CAD와 함께 AI 신약개발 연구에도 박차를 가하고 있어요. 일반적으로 신약을 개발하는 데 평균 10년의 시간과 2.7조의 비용이 드는 반면, 성공률은 약 9%정도밖에 되지 않아요. 카카오브레인 헬스케어는 초거대 AI를 활용해 신약 개발에 드는 기간을 50%이상 단축하고, 성공률을 300% 이상 높이는 것을 목표로 하고 있어요. AI 신약 개발사인 갤럭스(Galux)와 투자 및 공동연구개발 계약을 맺고 이 목표를 달성하기 위해 열심히 연구하고 있습니다.

Q. GPU를 포함해 어느정도의 인프라가 일하는 데 제공되나요?

“카카오브레인은 설립초기인 2017년부터 브레인 클라우드를 자체 구축하여 운영하고 있어요. 자체 클라우드만으로도 충분히 임팩드 있는 연구를 수행할 수 있지만, 만약 부족하다면 구글 TPU, MS Azure, 아마존 AWS 등 외부 클라우드도 사용할 수 있는 환경이에요. 다시 말해, 상상하는 모든 연구를 수행할 수 있는 충분한 인프라를 제공해 드린다고 생각하시면 될 것 같아요.”(AI-CAD 연구팀 리터 Peter)

Q. 헬스케어 도메인 지식이 없어도 카카오브레인 연구팀에 지원해도 될까요?

“AI 신약 연구팀에는 물질 개발을 몇 년 동안 연구하셨던 분도 계시고, 바이오 인포메틱스를 하셨던 분도 계시고, 딥러닝 연구만 하셨던 분도 있어요. 혼자 하는 게 아니라 이렇게 다양한 분이 함께 가치를 만들어가고 있기 때문에 당연히 지원하실 수 있습니다.” (AI 신약 연구팀 리더 Rian)

“내부적으로 이미 도메인 지식과 경험이 잘 정리되어 있어요. 그리고 온보딩 프로세스가 굉장히 잘 되어 있죠. 즉, 어떤 분이라도 입사하게 되면 저희가 헬스케어 도메인 지식을 단기간에 압축적으로 끌어올려드릴 수 있단 뜻이에요.” (CHO Zeron)


“사실 이 분야는 아주 빠르게 변화하고 있는 분야거든요. 그러다 보니 지식의 소비 속도도 매우 빠르고요. 그래서 배경지식도 중요하겠지만, 얼마나 문제를 잘 해결할 수 있느냐도 중요한 것 같아요. ‘어떤 문제든지 맡겨만 주면 잘 풀 수 있다’고 스스로 생각한다면 카카오브레인에서 빠르게 성장할 수 있을 거예요.” (AI-CAD 연구팀 리터 Peter)


상상할 수 없는 세상을 위한, 생각하지 못한 질문

‘우리는 초거대 AI의 미래를 예측할 수 없지만, 이 기술의 발전은 우리가 새로운 창조적인 방식으로 생각하고 일할 수 있게 만들어 줄 것입니다. 하지만 이러한 발전을 위해서는 계속해서 연구와 개발이 이루어져야 하며, 이를 통해 인간과 인공지능이 상호작용하면서 더 나은 미래를 만들어 나갈 수 있을 것입니다.’

위 문장은 ‘초거대 AI 관련 아티클의 마무리 문단은 어떻게 쓰면 좋을까?’라는 질문에 대한 ChatGPT의 답변 일부예요. 꽤 그럴듯하지 않나요? 이마를 짚고 홀로 고민에 빠지는 대신, AI에게 의견을 구하고 거기서 아이디어를 얻는 일이 놀랍지 않은 시대가 되었어요. 몇 년 전만해도 상상할 수 없는 일이었죠. 답변 그대로 AI를 통해 완전히 새로운 방식으로 생각하고 일할 수 있게 된 거예요. 초거대 AI가 또 어떤 변화를 불러올지 미처 다 예측할 수 없겠지만, 한 가지 분명한 건 모든 변화와 혁신의 시작엔 사람의 ‘질문’이 있다는 사실이에요. 

카카오브레인도 마찬가지입니다. 카카오브레인의 혁신은 모두 사람의 ‘물음’에서 시작해요. AI 없이는 상상할 수 없는 세상을 위해, 이전에 생각하지 못한 많은 물음이 필요하다는 걸 잘 알고 있죠. 그 물음이 있는 한 카카오브레인은 계속 성장할 거예요. 카카오브레인과 함께 끝없는 성장을 경험하며 세상을 바꿀 새로운 물음을 던질 크루를 언제나 기다립니다.