2023년 8월 7일~9일, 카카오브레인은 국내 컴퓨터비전 연구의 최전선인 ‘한국컴퓨터비전학회(KCCV, Korean Conference on Computer Vision) 2023’에 다녀왔습니다. 컴퓨터비전은 컴퓨터를 이용해 정지 영상 또는 동영상으로부터 의미 있는 정보를 추출하는 컴퓨터 과학의 연구 분야예요. 특히 인공지능 기술 개발에 중추적인 역할을 하는데요, 최근 Chat GPT 등 생성형 AI의 활성화로 다양한 시도가 활발히 일어나는 분야입니다.
카카오브레인은 최근 컴퓨터비전 분야에서 괄목할 만한 성장을 기록하고 있습니다. 지난 6월에는 세계 최고 권위의 인공지능 학회 ‘CVPR(Computer Vision and Pattern Recognition) 2023’에 참여해 논문 6건을 발표하고, 이미지 캡셔닝 챌린지에서 3위를 차지하기도 했어요. 이처럼 카카오브레인은 언어모델과 이미지 생성 모델, 언어와 이미지를 동시에 이해하고 생성하는 Multimodal에 관심을 두고 연구·개발을 하고 있습니다.
카카오브레인에게 이번 KCCV 학회가 더욱 특별했던 건, 학회 행사에 처음으로 카카오브레인의 홍보 부스를 세웠기 때문이었어요. 카카오브레인의 연구 방향과 실적을 공유하고, 또 앞으로 함께 나아갈 동료를 찾고 싶은 마음이 컸거든요. 3일간 ‘칼로(Karlo)’, ‘헬스케어’, ‘언어모델’ 3개 팀의 연구원이 부스에 참여하여 각 사업부의 연구 내용과 프로덕트를 소개하는 시간을 가졌습니다. 총 600여 명이 방문하고, 100명 이상이 상담을 진행할 만큼 활발한 시간이었어요. 학회에서 카카오브레인이 어떤 연구 내용을 소개했는지, 카카오브레인 부스에서는 어떤 질문들이 오갔는지 소개할게요.
칼로(Karlo)
칼로(Karlo)는 카카오브레인의 초거대 AI 이미지 생성 모델로, 약 3억 장 규모의 이미지-텍스트를 학습해 세계 최고 수준의 언어 이해력을 갖춘 점이 큰 특징입니다. 2022년 12월 칼로 1.0을 공개한 데 이어, 올해 7월 칼로 2.0을 공개했습니다. 칼로 2.0은 1.0 때보다 학습 규모를 늘린 덕분에 복잡한 프롬프트(명령어)를 명확히 이해하고, 다양한 화풍을 세밀하게 구현할 수 있어요.
현재 카카오브레인은 칼로 2.0 API를 무료로 공개한 상태입니다. 기술을 공유하고 오픈 커뮤니티를 형성해 AI 생태계를 가꿔나가고 싶은 마음 때문이에요. 물론 현재 수준에서 고도화해 나가면서, 수익을 창출하는 방법도 함께 고민하고 있는데요, 개인화된 T2I(Text to Image)를 중심으로 하는 비즈니스 모델을 구상하고 있어요.
KCCV 학회에서는 Video Action Recognition, 3D 생성 등 인접한 분야의 연구를 진행하는 분들이 칼로 팀을 찾아 주셨습니다. 이미지 생성 모델 연구에 경험이 없어도 팀에 합류할 수 있는지를 궁금해하신 분들이 많았어요. 칼로 팀에서는 representation learning에 대한 깊은 이해가 필요하기 때문에, recognition task에서 중요한 문제를 해결한 경험이 있다면 생성 모델 설계 시에도 도움받을 수 있을 거라고 답했어요. 또, 3D 분야 역시 앞으로 개발해 나갈 중요한 분야라 판단하기 때문에 관련 경험이 있는 분들을 적극적으로 모실 예정이라고 해요.
헬스케어: AI-CAD 솔루션 & 신약개발
헬스케어 팀에서는 의료 진단 최적화 솔루션 ‘AI CAD(Computer Aided Diagnosis)’ 사업을 준비 중이에요. 학습된 AI가 엑스레이 이미지를 스스로 판독하고, 질병을 진단하여, 이에 맞는 판독문을 작성해 주는 솔루션입니다. 최근에는 흉부 엑스레이 이미지를 의학 리포트와 효율적으로 매칭하여 질병 검출률을 효율적으로 증가시킨 유의미한 결과를 발표하기도 했어요.
기존 헬스케어 분야에서 컴퓨터비전 기술을 활용할 때는 classification, detection 등 supervised 방식으로 학습하여, 데이터 라벨링에 큰 비용과 시간이 드는 문제가 있었습니다. 또, 라벨링한 일부 질병에 대해서만 학습이 가능하다는 한계도 있었어요. 카카오브레인의 AI CAD는 대량의 데이터를 unsupervised 학습하기 때문에, 이론적으로는 그 안에 담긴 모든 질병과 패턴을 학습할 수 있습니다. 다양한 장비와 다양한 환경에서 촬영된 엑스레이 영상을 대규모로 수집하여, 촬영 장비·환경·환자 상태에 구애받지 않는 모델을 개발하는 것이 목표입니다.
현재 AI CAD 모델은 내부에서 테스트 데이터를 구성하고, 판독문의 퀄리티를 가늠하는 자체 평가 시스템을 개발하여 사용 중입니다. 영상의학과를 전공한 크루가 정성평가를 함께 진행하여 신뢰도를 측정하고 있어요.
AI CAD는 의사보다 더 유능해지는 게 아니라, 영상의학과 전문의가 필요한 판독문을 보다 스마트하게 지원하는 것을 목표로 해요. 엑스레이 분야에서 유의미하고 신뢰할 만한 성과를 거둔다면 CT, MRI, 초음파 등 다른 의료영상 분야로도 적용할 수 있을 것으로 예측합니다.
한편 헬스케어 팀의 또 다른 축은 ‘AI 신약 개발’입니다. 카카오브레인은 신약 개발 스타트업 ‘갤럭스’와 손잡고 AI 기반 항체 신약 설계 플랫폼을 구축하고 있어요. 항암제를 만드는 것을 목표로, AI 모델을 활용하여 효율적인 비용으로 항암 효능을 지닌 후보 물질을 발굴하는 연구를 진행하고 있습니다.
이러한 과정에서 단백질 구조 예측 프레임워크 ‘솔벤트(Solvent)’를 개발하는 성과를 거두기도 했습니다. 솔벤트는 단일서열 기반의 단백질폴딩 모델을 지원하여, 빠른 속도로 단백질 구조를 예측합니다. 헬스케어 팀은 솔벤트를 활용해 신약 설계 단계에서 소요되는 시간을 단축하여 AI 신약 개발 생태계 발전에 기여하고자 해요.
언어모델: 카카오브레인 초거대 언어모델(Large Language Model)
카카오브레인 초거대 언어모델(Large Language Model)은 한국어를 이해해 사용자가 원하는 결과를 보여주는 초거대 AI 언어 생성 모델입니다. 언어 생성 모델은 주어진 문장의 순서파악이나 긍부정등 내용의 이해와, 내용 요약 또는 결론 예측, 질문에 대한 답변, 다음 문장 작성 등 언어와 관련된 모든 과제를 수행할 수 있어요. 단순히 한국어를 잘하는 수준에 그치지 않도록, 영어를 기반으로 하는 전 세계 모델과 직접 비교하면서 성능을 높이고 있습니다.
이렇게 언어모델을 자체적으로 개발하는 이유를 궁금해하는 분들이 많습니다. 카카오브레인은 API 비용이 많이 든다는 문제와 내부 데이터를 외부에 보내는 문제를 해결하기 위해 내재화가 필요하다고 판단했어요. 또, 내재화를 통해 계속해서 기술을 축적해야 더 뛰어난 언어모델을 만들 수 있다고 생각하기 때문에 자체적으로 언어모델을 개발하고 있습니다.
이처럼 ‘칼로’, ‘헬스케어’, ‘언어모델’ 팀은 컴퓨터비전을 비롯한 다양한 AI 분야에서 활발히 연구·개발을 진행하고 있어요. 원활한 연구를 위해 충분한 개발 환경을 갖추는 것 역시 조직의 큰 관심사입니다. 카카오브레인은 회사 설립 초기부터 연구 환경과 데이터에 초점을 맞추고 투자하고 있는데요, 그 결과로 ‘브레인 클라우드’라는 자체 클라우드 플랫폼을 갖추게 되었습니다.
브레인 클라우드는 딥러닝 연구 개발에 특화된 플랫폼입니다. 다수의 GPU를 손쉽고 효율적으로 활용할 수 있으며 multi-node 학습에 최적화되어 있어요. 또, 엔지니어링 노하우를 시스템화하여 모든 연구자가 large-scale의 연구·개발에 접근할 수 있도록 지원합니다.
카카오브레인과 새로운 도전을 꿈꾼다면
한편 KCCV 학회 부스에서는 연구에 대한 관심과 더불어, 카카오브레인 채용과 영입 과정을 문의하는 분들도 많았습니다. 이에 인재영입팀에서도 부스에 상주하며 카카오브레인의 인재상과 채용에 관한 궁금증을 풀어드리려 했어요. 자주 묻고 답한 질문을 소개합니다.
Q. 카카오브레인에서 리서처를 영입할 때, 지원자의 어떤 면을 중요하게 평가하나요?
Research-oriented 포지션의 경우, 논문 실적을 중심으로 하는 Academic track record가 가장 중요합니다. 논문을 몇 개나 발표했는지보다, 논문에서 어떤 문제를 해결하려 했는지를 주목하는 편입니다. 또한, 가설을 세우고 검증하는 과정을 얼마나 체계적으로 훈련했는지도 중요하게 평가합니다.
Engineering-oriented 포지션의 경우, 알고리즘의 기본적인 동작 원리를 이해하고 이를 엔지니어링 관점으로 개선하는 역량을 중요하게 생각합니다. 재현이 어려운 고난이도 모델을 개발한 경험이나, 대규모 데이터를 효과적으로 처리해 본 경험을 높이 평가합니다.
Q. 특히 카카오브레인 헬스케어 팀에 관심이 많습니다. 원하는 인재상이 있나요?
우선 AI와 딥 러닝 분야의 역량을 갖춰야 합니다. Large-scale을 다루게 되니, Multi-gpu, Multi-node를 학습한 경험이 있거나 개념을 이해하고 있는 게 좋습니다.
또한 의료 분야에 대한 지식이 있는 분을 선호합니다. 반드시 단백질 등 현재 연구 분야와 관련 있어야 할 필요는 없습니다. 상세 Domain은 입사 후 적응할 수 있는 부분이기 때문에, 다량의 데이터를 다뤄 보았고 모델링할 수 있다면 팀에 적합한 분이라 생각합니다.
Q. 카카오브레인의 리서처로 입사하기 위해서는 무엇을 준비해야 하나요? 어떤 학위가 필요한가요?
기본적으로 학력 및 학위의 제한은 없습니다. 다만, 관련 학위가 반드시 필요한 직무인 경우에는 채용 공고의 필수자격요건에 해당 학위를 기재하고 있으니 확인해 주세요. 해당 학위가 없더라도 이와 상응하는 경험을 보유한 경우 적극적으로 검토하고 있습니다.
Q. 카카오브레인의 리서처 직무에서는 인턴 또는 전문연구요원을 영입하고 있나요?
인턴의 경우, 팀에서 필요할 경우 상시로 영입을 진행합니다. 대부분 Research-oriented 포지션으로, 연구 주제를 선정하고 이를 논문화하는 것을 목표로 합니다. 회사에서 제품화하려는 모델 개발에 참여하는 경우도 있습니다.
전문연구요원의 경우, 영입을 진행하지 않습니다. 카카오브레인은 카카오를 모회사로 둔 상호출자 제한 기업집단으로, 대기업으로 분류됩니다. 대기업에는 현역 입영대상자의 전문연구요원 신규 T/O가 배정되지 않아, 아쉽게도 영입을 진행하지 않고 있습니다.
KCCV 학회 속 카카오브레인을 자세히 소개해 드렸는데 어떠셨나요? 카카오브레인은 앞으로도 연구 및 비즈니스 주제와 관련된 다양한 학회에 참가하여 더 많은 분과 만나고자 합니다. 또, 오늘 소개한 내용은 ‘MICCAI 학회’에 제출하여 올해 10월 논문으로 발표될 예정이니, 카카오브레인 SNS 채널을 확인해 주세요.
카카오브레인에서는 오늘도 다양한 인공지능 연구가 활발히 진행되고 있습니다. 나아가 AI를 실생활에 적용할 실제 프로덕트를 만들기 위해, 카카오 공동체나 외부 파트너사와의 협업 역시 적극적으로 발굴하고 있어요. 카카오브레인의 여정에 합류하여 함께 도전하고 싶은 분들은 카카오브레인 온라인 리플릿 페이지에서 자세한 연구 주제와 영입 중인 포지션을 확인하세요!
📩 영입 관련 문의 apply@kakaobrain.com