3월7일(화), 3월9일(목) 일정으로 카카오 공동체와 함께하는 ‘Cloud Innovation Week for Kakao’ 이름의 테크 세션이 카카오아지트 본사 4층에서 열렸습니다. Cloud Innovation Week는 구글이 협력사와 기술을 교류하고, 협력사가 구글 클라우드 서비스를 더 깊이 알 수 있는 세미나인데요. 국내외 구글러 세션 스피커들을 모시고 컨퍼런스 형태로 본 테크세션을 진행하는 이 행사는 GKE(‘Google Kubernetes Engine’) Day for Kakao, AI/ML Day for Kakao로 양일간 진행되었습니다.
시작하기 30분 전부터 행사장인 4층 북아지트는 카카오 공동체 크루로 가득차기 시작했습니다. 시작하고 나서는 늦게 참여한 분들을 위해 온라인 중계로 마련된 지하 1층 역시 자리가 없었을 정도요.
Google Cloud Customer Experience Account 리더 서승원 님의 진행으로 시작한 Cloud Innovation Week for Kakao. 서승원님은 “이번 Innovation Week에서는 구글이 전 세계 유저의 성장과 발전을 위해 고민하고 있는 다양한 혁신 기술의 이면을 상세하게 접할 수 있도록 준비했다”며 행사의 문을 열었습니다.
첫 세션은 카카오브레인 리서치 디렉터 Sam이 스타트를 끊었습니다. Sam은 “구글과 함께한 카카오브레인의 이미지 생성 모델 ‘Karlo’ 알아보기”라는 타이틀로 카카오브레인의 이미지 생성형 AI 모델 Karlo(이하, 칼로)의 개발 스토리를 위주로 40분간 이야기를 풀어나갔습니다.
칼로는 사용자가 입력한 문장과 이미지를 기반으로 새로운 이미지를 만들어내는 Text-Image 생성형 AI 모델입니다. 2억 8천만 장 규모의 이미지-텍스트 데이터쌍 학습을 통해 사용자가 묘사한 프롬프트(Prompt, 제시어)를 이해하고 픽셀 단위로 완전히 새로운 이미지를 생성해내는 데요. 원하는 콘셉트에 맞춰 사물과 배경, 조명과 구도 등 다양한 화풍을 지원합니다.
Sam은 기존의 패치 단위 조합 기술과는 달리 텍스트의 맥락을 고려해 랜덤 노이즈에서 이미지를 완성하며 픽셀 단위로 새롭게 완성해 나가는 칼로의 기반 기술 ‘Diffusion Model’을 설명하며 이 과정에서 구글 클라우드의 협력 과정을 자세히 설명했습니다.
두 번째 세션은 구글 클라우드 머신러닝 팀의 솔루션 리더 김태형 님의 시간. “알파고 시절부터 LaMDA 까지, 구글의 AI/ ML 컴퓨팅 인프라 Cloud TPU 따라잡기”가 타이틀인 두 번째 발표는 2021년 구글 I/O에서 발표한 3D 토폴로지 구조에 1개의 Pod 당1.1 ExaFLOPS를 기록한 4.0 버전 칩 등 구글이 2016년 5월 데이터 분석 및 딥러닝용 NPU를 모아놓은 하드웨어 TPU의 역사를 알아보는 시간이었습니다.
TPU는 특정 조건에서는 GPU에 비해 10배 이상이 빠르며 레이턴시(latency) 문제를 효과적으로 해결해 주는데요. 김태형 님은 ‘Cloud TPU를 활용하면 비교적 규모가 작은 학습에서 쓰이던 TPU를 스케일업 할 때 코드 체인지 할 필요 없이 자연스럽게 확장할 수 있어 머신러닝에 최적인 디바이스’라고 설명했습니다.
세 번째 세션 발표는 “챗GPT가 과연 성능이 좋아서 인기 인걸까요?”라는 Google Developer Expert 박찬성 님의 질문으로 시작했습니다. 박찬성 님은 ‘Large Language Model’ 서비스의 어려움과 그를 해결하기 위한 컴퓨터 네트웍스 지능화와 하드웨어 추상화 등 다양한 연구에 관해 설명하며, ‘머신러닝 민주화’에 대한 개념과 ‘챗GPT가 머신러닝 민주화에 얼마나 영향을 미치는가’에 대해 강조했습니다.
그렇다면 챗GPT가 어떻게 머신러닝 민주화에 영향을 미치는 것일까요? 자신들의 연구를 논문화해 공개한 머신러닝과 AI 연구는 많았습니다. 챗GPT는 모델 구현체나 가중치는 공개하지 않았지만 단순 논문만이 아닌, 모델을 사용할 수 있는 실제 서비스를 구현해 공개했고 서비스를 플랫폼 외부에서도 사용할 수 있게 해서 많은 사람들이 머신러닝과 AI에 관련된 서비스를 경험하고 익숙하게 받아들일 수 있도록 하는 데 큰 기여를 할 것이라고 박찬성 님은 설명했습니다.
챗GPT는 AI라는 새로운 기술의 잠재력을 대중이 체감할 수 있게 해주는 일종의 큰 사건이었습니다. 챗GPT는 어떤 한 회사의 기술력이라기보다 AI 분야의 다양한 연구들이 서로 노력하며 돌파구를 찾으려는 어떤 노력의 결과물이었거든요.
챗GPT 역시 Large Language Model 연구의 결과인데요. 앞으로 Large Language Model이 우리가 사는 세상을 어떻게 바꿔놓을까요? 박찬성 님은 “아직 리서치 초기 단계”라며 학계와 대중은 Large Language Model에 대한 이해도를 높은 수준으로 끌어올리는 것이 중요하다고 강조했습니다. Large Language Model에서 ‘Large’는 단순히 거대한 모델’을 의미하는 것이 아닙니다. 박찬성 님은 Large의 의미는 “우리가 사는 세상을 잘 이해하는 것”을 의미한다며, 덩치가 크든 작든 “AI 모델이 우리가 사는 세상을 잘 이해하는 것이 최고의 Large Language Model”이라는 말을 마지막으로 세션을 마무리 지었습니다.
마지막 세션은 구글 클라우드 본사의 Large Language Model 팀원들이 구글의 언어 모델 개발 프레임워크 ‘T5X’에 대한 개괄과 활용 방안 등을 온라인으로 설명해 주었습니다.
LLM(Large Language Model)은 최근 몇 년 사이 모델이 천문학적으로 커졌는데요. 이제는 1,000억을 넘어 조 단위 파라미터도 등장할 예정이라고 합니다. 이렇게 신경언어모델의 스케일을 키우면 모델의 성능은 좋아집니다만 할당 연상 자원도 기하급수적으로 늘어나게 되죠. 이럴 때 T5X를 활용하면 먼저 작은 모델로 학습해 그 가능성을 검증한 후 스케일을 손쉽게 스케일업 할 수 있어 프로젝트의 검증과 이후 투자에 대한 계획을 손쉽게 세울 수 있다고 구글 클라우드의 솔루션 아키텍트 엔지니어 라제쉬 타램은 강조했습니다. 이후 라제쉬는 SeqIO에 대한 시연을 직접 보이며 T5X의 사용 범위와 가능성을 확인할 수 있도록 했습니다.
Cloud Innovation Week for Kakao에 참여한 카카오 공동체 크루들은 발표에 집중하면서도 쉬는 시간 구글 클라우드 맨과 사진을 찍거나 행사장에 마련된 ‘인생네컷’을 찍는 등 행사 자체를 즐기는 모습을 보였습니다. 행사 마지막에 ‘Kahoot’으로 진행된 럭키 드로우 퀴즈 역시 모두 참여해 열띤 경쟁을 벌였습니다.
카카오브레인을 포함한 카카오 공동체는 뛰어난 성능을 가진 자체 클라우드 인프라 ‘브레인 클라우드’를 활용해 생성형 AI를 비롯한 다양한 연구와 서비스로 AI 생태계에 기여하고 있습니다. 구글 클라우드를 함께 활용해 양사의 노하우가 담긴 빛나는 결과물을 만들어내기도 하죠. 앞으로도 양사는 꾸준히 협력을 이어나가며 AI 생태계가 더욱 빠르게 발전하는데 최선을 다하겠습니다.