[Our Stories] 화성, 로봇, 그리고 초거대 AI 언어 모델 개발에 이르기까지… 도가미 마사히토 AI 개발 부서장의 이야기

2021.07.22 ALL

 

라인 주식회사의 도가미 마사히토(Togami Masahito) AI 개발 부서장은 화성 덕분에 AI의 중요성을 알게 되었다고 한다. 마사히토 씨가 도쿄대학교에서 항공 및 우주공학 박사 과정을 밟으며 화성 표면 탐사 로봇을 설계하는 리서치 프로젝트에 참여할 때의 일이다. 

화성 탐사 로봇은 화성 표면의 바위와 구덩이 같은 장애물을 회피하며 험준한 지형을 탐사해야 한다. 문제는 화성이 너무 먼 곳에 있어 인간이 탐사선에 조종 명령을 전달할 경우, 명령이 화성에 도착하기까지 10분이나 걸린다는 것이었다. 10분이면 탐사선에 이미 문제가 생겼을 시간이다.

마사히토 씨는 “화성 탐사 로봇이 탐사 중에 갑자기 지표면의 구덩이를 맞닥뜨린다면, 로봇은 스스로 실시간으로 생각해 대응을 해야 합니다. 시각 피드 등에 기반하여 좌표를 식별할 정도로 똑똑해야 하는 것이죠”라고 설명하며, “바로 그때 AI가 놀랍다고 생각했습니다”라고 회고했다. 

 

로봇과 함께 보낸 유년기

마사히토 씨는 AI에 푹 빠지기 이전에 먼저 로봇에 열광했던 유년 시절의 추억을 소개했다. 마사히토 씨가 아직 어린아이였던 1970년대는 일본의 팝 컬처로 ‘아톰’을 비롯해 로봇 캐릭터가 큰 인기를 끌었던 때였다. 마사히토 씨는 언젠가는 진짜 로봇을 만들겠다는 꿈을 꾸며, 당시 실물 크기의 로봇을 만들고자 30개의 티슈갑을 풀로 붙여 만들어보기도 했다고 설명했다. 

당시 아이들의 크리스마스 선물로 건담이나 그랑프리 리모컨 조종 자동차 등이 들어 있는 모델 키트가 가장 인기였는데, 마사히토씨는 이런 키트 조립에 특히나 조예가 깊었다. 그는 “저는 이웃집 형들로부터 키트 조립하는 법을 배웠어요. 라인 트레이서와 레이스트랙 조립에 푹 빠졌죠”라고 유년시절을 회상했다. 

 

 

로봇에서 AI로

한편, 학교를 졸업한 후 마사히토 씨의 관심사는 로봇에서 AI로 나아갔고 특히 ‘발화 기술’에 매료되었다. 마사히토 씨는 88건의 리서치 논문을 발표했으며, 이 중 다수가 음성 합성과 음성 인식 관련 내용이다. 현재 일본은 이 분야에서 선도적인 지위를 차지하고 있다. 

“일본인들은 말할 줄 아는 로봇에 대한 집착이 있어요. 그래서 이 분야에 엄청나게 많은 자원을 쏟아부었고 가장 선도적인 국가가 됐답니다.” 

마사히토 씨는 연구에 있어 실용성을 중시했다. 즉, 기술이 사람들의 일상생활을 실제로 어떻게 개선할 수 있을지에 대한 방법을 모색했다. 노이즈캔슬링 기술 연구에 시간을 투자했으며, 이 기술을 화상회의에 적용하기도 했다. 일례로, 마사히토 씨는 수신 사운드의 각도를 식별하여 발화자의 음성을 배경의 노이즈에서 분리해 내는 독자적인 방법을 개발하는 데 기여하기도 했다. 덕분에 음질이 대폭 개선됐다.

 

 

아이디어를 빠르게 현실화하는 곳, 라인

스탠퍼드대학교에서 초빙 교수로 18개월을 보낸 후, 마사히토 씨가 새로운 것에 뛰어들 준비가 되었다고 느꼈을 때 즈음 라인에서 근무 할 수 있는 기회가 찾아왔다. 마사히토 씨는 “라인 분위기는 실리콘 밸리와 비슷해요. 문화적으로 굉장히 '수평적’이죠. 라인은 엘리베이터에서 다른 사람들이 먼저 내리도록 CEO가 문을 잡아주는 분위기의 회사에요”라고 평했다.

또한, 마사히토 씨는 라인이 실용적인 결과를 만들어내는 속도와 집중력이 무척 흥미로웠다고 전했다. “라인 직원들은 새로운 것들을 만들어내고 새로운 구상을 떠올리는 데 동기부여가 되어 있습니다. 직급 체계가 복잡하지 않아 구상을 신속하게 행동으로 옮길 수도 있죠. 라인의 가장 뛰어난 부분은 그저 순수한 리서치에 그치지 않고, 아이디어를 서비스 또는 프로덕트의 형태로 만들어내는 데 있습니다”라고 전했다.

마사히토 씨는 라인의 AI 개발 부서장으로서 최근 그 어느 때보다 진보한 AI 기술을 집중적으로 탐구하고 있다. 라인의 최대 AI 프로젝트 중에는 일본어를 대상으로 한 ‘초대규모 언어 모델링’도 있다. 최첨단 딥러닝 시스템인 GPT-3에 비견할 수 있는 프로그램을 통해, 라인의 초대규모 언어 모델은 100억 페이지 이상의 일본어 데이터를 처리하고 있다. 라인의 서비스를 ‘보다 똑똑하게’, 그리고 보다 사용자 친화적으로 만들 수 있는 차세대 AI 기술을 개발하는 것이 목표다. 

 

아래 영상을 통해 마사히토 씨가 참여 중인 초대규모 언어 모델링에 대해 알아보고, 일본어의 특성으로 인한 챌린지와 해결 과정에 대해서도 살펴보세요.