2023년 9월 20일, 카카오브레인(kakaobrain)의 AI신약연구팀 그리고 인재영입팀이 대전 KAIST에 다녀왔습니다. 카카오브레인이 대학교 캠퍼스 내에서 처음으로 주최한 기업/채용설명회였기 때문에 더욱 의미 있던 시간이었는데요. 본원 창의학습관 409호에서 열린 카카오브레인의 기업/채용설명회에서는 과연 어떤 주제로 이야기들이 오고 갔을까요? AI신약연구 그리고 영입 프로세스에 대해 약 60여명의 학생분들과 이야기를 나눈 그 현장 스케치를 담아봤습니다.

‘카카오브레인에서는 정말 약을 만드는 사람을 뽑나요?’ 아마 많은 분들이 가장 궁금해하시는 부분일텐데요, 카카오브레인은 AI를 활용해 다양한 비즈니스를 전개해 나가고 있습니다. 그 중 신약연구 분야는 도메인 특수성이 두드러지다보니 생소하게 생각하시는 분들도 많은데요. 그래서 카카오브레인의 인재영입팀과 AI신약연구팀에서 관련 전공 KAIST 석-박사 과정 학생을 대상으로 기업/채용설명회를 마련했어요. 2시간 동안 카카오브레인 AI신약연구팀의 리더와 AI 연구원이 직접 카카오브레인의 전반적인 사업영역 및 AI 신약연구에 대해 밀도 있게 설명하는 시간을 가졌고, 이를 바탕으로 현장에서 약 20개가 넘는 질문을 받아 답변하는 시간을 가졌습니다.

💊 Drug Discovery meets AI!

AI는 정말 중요합니다. 산업 전반에 걸쳐 난제들을 풀어내고 있는 AI의 중요성에 아마 모든 분들이 공감하실텐데요, 문제에 접근하고 해결하는 방법이었던 기존의 실험, 시뮬레이션에 더하여 AI는 강력한 문제해결을 위한 도구로서 다양한 분야에 사용되고 있고 늘 새로운 혁신을 일으키고 있어요. 그렇기 때문에 AI를 왜 하는지에 대한 질문보다는, 이러한 흐름 속에서 ‘신약개발(Drug Discovery)이 AI를 어떻게 만나게 되었는지’에 대한 이야기가 필요할 것 같아요.

신약개발이라는 도메인의 범위는 굉장히 넓고, 이를 위한 접근법은 굉장히 다양하지만, AI 신약에서 주목하고 있는 분야는 크게 1)저분자 화합물 신약과 2)단백질(펩타이드) 신약입니다. 카카오브레인의 AI신약연구팀은 단백질(펩타이드)신약 중, 항체를 연구하고 있습니다.

물질개발과 신약개발의 과정은 상당히 유사한 부분이 많습니다. 많으면 수억 개의 후보군들 가운데 좋은 필터를 가지고 괜찮은 후보를 추리는 과정을 거듭해서 좋은 물질을 얻어내는 과정인데, 대략적인 통계에 따르면 만 개에서 겨우 하나가 나올까 말까 한, 그래서 성공하기는 매우 어렵지만 성공한다면 그야말로 초대박이 날 수 있는 기술 분야입니다.

전통적인 신약 개발은 Wet Lab(실험실), Computational Method, Bioinformatics 또는 Simulation 방법이 대세였다면, 2013-14년부터 분자 및 그래프에 AI를 활용하기 시작했고, 혁신적인 시작은 구글 딥마인드에서 알파폴드2(Aplhafold2)를 발표했을 때부터라고 생각해요. 알파폴드2를 기반으로 아이소모픽 랩스(Isomorphic Labs)가 출범되었고, 이후 더 많은 빅테크 회사들에서 AI를 신약연구 및 개발에 활용하고 있습니다. 신약연구 자체가 데이터 집약적이기 때문에 큰 모델과 많은 데이터 학습을 위해서는 많은 양의 계산자원과 이를 잘 다룰 수 있는 기술력이 필요합니다. 이에, 빅테크회사들에서는 Large-Scale AI로 문제를 해결하고 있습니다. 딥마인드 이외에도 최근 마이크로소프트에서 EvoDiff라는 디퓨전 모델을 시퀀스에 적용했다는 소식 등 AI를 활용하여 신약연구 및 개발을 활발히 진행하고 있는 전세계적 트렌드에 직면하고 있습니다.

특히, 글로벌 제약사들의 동향 역시 중요한 부분인데, 이미 글로벌 제약사들에서는 AI를 활용한 연구사업부를 가지고 있으며, 몇 천억 규모의 투자가 들어오고 있기도 합니다. 매우 활발한 투자와 협업을 기반으로 다양한 AI 신약연구 전문가들을 영입하고 있고, 오픈 소스들을 많이 공개하고 있어서, 발전의 속도는 더욱 빨라지고 있고 있습니다. AI 신약연구는 이제 하나의 굳건한 필드가 되었고, 하나의 산업이 되었습니다.

💊 AI신약연구팀 in 카카오브레인

AI 신약연구가 현재 전세계적으로 핫한 트렌드이지만, 이 와중에 카카오브레인은 굉장히 일찍 시작한 선두주자라고 볼 수 있어요. 딥마인드의 알파폴드2 이후부터가 하나의 시점이라고 본다면, 그 시점 이후부터 구조기반 단백질 디자인을 위한 팀을 내부적으로 만들고, AI를 활용한 연구를 진행해 왔습니다. 다들 IT 회사에서 무슨 신약을 만드냐고 하시는데, 적당한 수준에서 하는 것이 아닌 진짜 약을 만들려고 하고 있습니다. 카이스트에서 기업/채용 설명회를 주최한 목적도 이를 더욱 알리기 위해서 입니다.

AI를 잘 하기 위해서는 기본적으로 인프라(Infrastructure), 데이터(Data), 모델(Model) 3가지의 요소가 필요한데요. AI신약연구팀 역시 아래의 3가지를 중점으로 이야기 드릴 수 있습니다.

  • 인프라(Infrastructure): 카카오브레인은 AI 연구 및 머신러닝을 위한 최적의 환경 제공을 위해 Brain Cloud(브레인클라우드)라고 하는 강력한 GPU 인프라를 보유했고, 고수준의 분산학습 인터페이스를 보유하고 있습니다. 예를들면, 단백질 연구만을 위한 GPT 언어모델을 만든다고 할 때, 이를 수행하기 위한 모든 것들이 카카오브레인 내에 잘 구축되어 있습니다.
  • 데이터(Data): 시퀀스와 단백질 구조에 있어서는 공개된 데이터들을 적극적으로 활용하고 있으며, 전략적 투자사인 AI신약개발 스타트업 갤럭스(Galux)와 긴밀한 공동연구를 진행하고 있습니다. 특히, AI 기술을 기반으로 사람의 몸에 있는 항체를 잘 디자인해서 항원을 타겟할 수 있는 항체 디자인의 End-to-End 과정이 잘 구축되어 있습니다. 여기에 갤럭스의 글로벌 도메인 역량이 더해져 신약을 만들 수 있는 플랫폼을 갖추고 있습니다.
  • 모델(Model): 카카오브레인은 글로벌 AI 신약연구의 흐름 대비 이른 시기부터 AI를 접목한 신약연구를 수행한만큼 AI 기반 단백질 디자인을 위한 모델과 코드베이스들을 확보해 왔습니다. 단백질 구조 예측 모델에 대한 연구 진입 장벽을 낮추기 위해 최근 ‘솔벤트(Solvent)’의 학습 코드도 깃허브에 추가 공개하기도 했는데요. AI를 기반한 신약 개발 연구자분들이 보다 쉽고 빠르게 연구 태스크를 진행할 수 있도록 돕고, AI신약 개발 생태계 발전에 기여하고자 학습 코드 공개를 결정했습니다.(솔벤트 상세보기)

이러한 토대 속에서 카카오브레인의 AI신약연구팀은 End-to-End AI 기반 항체설계플랫폼을 구축해 오고 있으며, 현존하는 최신의 공개 모델 대비 어떤 특장점을 가지고 있는지를 실험적으로 검증하고 있습니다. 그래서 AI 신약연구팀은 국내에서 그치는 것이 아닌, 처음부터 글로벌 신약연구의 탑티어를 목표로 달려 나가고 있어요.


🙋🏻‍♀️ AI신약연구팀, 이런 부분이 궁금해요.

뒤이어 진행된 Q&A 시간을 통해 더욱 심도 있는 대화를 나눌 수 있었는데요. 연구와 업무 뿐만 아니라 회사에 잘 적응하기 위한 역량, 인재상 등 회사문화와 영입에 대한 이야기도 함께 나누었습니다. 그 중 몇가지를 뽑아 소개합니다.

Q. 카카오브레인은 AI 기업인데 신약개발을 하는 부분에 여전히 의구심이 들어서요. 실제로 신약을 개발하는 것이 목표인가요 아니면 플랫폼 개발이 목표인건가요?

A. 실제로 신약을 개발하는 것이 목표입니다. 갤럭스와 실제 타깃을 두고 신약 개발을 하고 있고 디자인을 하고 있습니다. 사실 플랫폼이라는 단어가 AI/IT 회사에서 쓰느냐 제약회사에서 쓰느냐 느낌이 다른데요. 저희가 쓰는 플랫폼은 카카오톡 같은 플랫폼이 아닌 신약 개발을 위한 플랫폼, 하나의 소프트웨어와 같다고 생각하시면 됩니다.

Q. 플랫폼을 개발한다고 하셨는데, 모든 약물에 대해서 적용되나요?

A. 플랫폼의 일반성은 넓을 수록 좋아서 목표로 하고 있기는 하지만, 현 단계에서는 항체에 집중하고 있습니다.

Q. 카카오브레인, 혹은 AI신약연구팀이 수익 창출과 좋은 연구 중 어느 것에 목표를 두고 있나요?

A. 둘 다 입니다. 사기업이다보니 수익 창출이 우선될 수 밖에 없지만, 좋은 연구를 통해 기업의 지속가능성을 가져갈 수 있을 것이라고 생각합니다.

Q. 카카오브레인, AI신약연구팀은 논문도 발행하고 계신가요?

A. 네, 많이 내고 있어요. 사실 다음 달에도 4-5개가 공개될 예정이고, 다음 주에도 흥미로운 논문들이 많이 공개될 예정이니 많은 관심 부탁드립니다.

Q. AI는 새로운 흐름과 기술이 무척 빠르게 나오는데, 그런 흐름에 어떻게 대비하시나요?

A. 트위터, 링크드인과 같은 SNS를 자주 활용합니다. 또한 회사 내부에서 AI 와 관련된 뉴스들이 자주 공유되기 때문에 뉴스를 자주 접하고 있습니다. 다양한 방법을 활용해서 AI 흐름과 기술을 놓치지 않도록 많은 노력을 하고 있어요.

Q. AI 신약연구를 할 때 석박사로서 회사에 잘 적응하기 위해 필요한 역량이 있다면 무엇이 있을까요?

A. 태도적인 측면에서는 self-motivation이 중요합니다. 본인이 원해서 스스로 움직이는 능동적인 태도가 결과적으로도 좋고, 팀 분위기도 그렇기 때문에 새로 오실 분들도 동기부여가 스스로 잘 되는 분들이셨으면 좋겠습니다. 테크니컬한 역량으로는 프레임워크 하나 정도는 잘 다룰 수 있어야겠습니다. 저희의 주 업무는 특정한 논문이 나왔을 때 실제로 적용해보고, 개선하며, 새로운 것을 만드는 것이기 때문에 프레임워크를 잘 활용할 수 있어야 합니다. 또한 협업이 잘 되는 분이셨으면 좋겠습니다. 대화가 잘 통해야하며 착했으면 좋겠어요. (웃음) 착한 기준은 다양하겠지만, 저는 배려가 서로 잘 되는 분이셨으면 좋겠습니다.

새로운 것들이 많이 쏟아져 나오는데, 이것을 빨리 흡수해서 소화할 수 있는 능력이 중요하다고 생각합니다. 또한 협업이 중요하다고 말씀하셨는데, 내가 습득한 것을 팀원들에게 전파하는 역량도 중요해요. 또한 파이토치, 텐서플로우 등 다양한 툴과 최신 모델 그리고 알고리즘의 특징을 알고 계셨으면 좋겠어요. 모델에 대한 이해가 있어야 업무를 잘 수행할 수 있거든요.

Q. 도메인과 인공지능이 다양하게 섞인 인재상을 제시해주셨는데 현재 구체적으로 팀에 어떤 분이 필요한가요? 또 현재 팀에는 어떤 분들이 모여계시나요?

A. 현재 팀에는 분자 시뮬레이션을 전공하신 분, 게임회사에서 AI를 하신 분, 그리고 제약회사에서 오신 분 등 다양한 도메인에서 역량 있는 분들이 모여 있습니다. 구체적으로 어떤 사람이 필요한지는 정해놓고 있지 않고 넓게 보고 있습니다. 새로 들어오신 분이 도메인과 인공지능 중 어떤 분야에 더 중점을 두는지에 따라 향후 목표를 다르게 가져가고자 합니다.

💌 인재영입 문의 apply@kakaobrain.com

🔗 오픈 포지션 확인하러 가기