사투리·신조어도 '척척' 번역, 파파고의 비결은…

이해인 기자
2016.12.20 03:18

'파파고 아빠' 김준석 네이버랩스 리더…"웹툰·동영상 보고 스스로 학습"

김준석 네이버랩스 리더./ 사진=네이버

“인공신경망 번역(NMT) 시스템이 적용된 파파고는 네이버 웹툰과 브이 동영상, 지식인 글들을 보고 스스로 학습해요. 지방 사투리나 ‘핵잼’ 같은 신조어까지 알아듣는 비결이 여기에 숨어 있습니다.”

지난 8월 국내 정보기술(IT)업계가 술렁였다. 네이버랩스가 선보인 애플리케이션 ‘파파고’ 때문이다. 파파고는 한국어, 영어, 중국어, 일본어를 지원하는 통번역 앱이다. ‘느그 아버지 뭐하시노’ 같은 사투리까지 완벽하게 알아듣고 번역해낸다. 높은 서비스 품질에 IT업계는 물론 통번역 업계까지 주목하고 있다.

‘파파고 아빠’ 김준석 네이버랩스 리더는 “파파고는 네이버에서 네이버랩스(기술연구조직)가 설립된 후 처음으로 시장에 내놓은 제품”이라며 “최근 5년간 네이버가 진행해온 기술개발의 집약체”라고 설명했다.

파파고에 활용된 요소기술은 △음성인식 △음성합성 △기계번역 △문자인식 등이다. 네이버는 2011년 음성인식 시스템을 개발하기 시작, 이후 음성합성까지 차례로 개발했다. 최근에는 네이버랩스에서 자체 개발한 NMT 방식을 파파고에 적용함으로써 번역의 정확성을 높였다.

그동안 기계 번역은 문법을 규칙으로 만들어 번역하는 기술과 다양한 언어 자료를 통계화해 번역하는 기술(SMT)이 주로 활용돼왔다. 네이버가 파파고에 적용한 NMT 방식은 인공신경망을 통해 마치 사람이 번역하는 것과 비슷하게 작동한다. 언어를 쪼개지 않고 한번에 전체 문장 단위로 번역하는 것. 이를 통해 ‘나는 아침에 아침을 먹었다’처럼 같은 단어가 한 문장 안에 반복될 때 각각의 뜻을 적확하게 번역해 낼 수 있다.

파파고가 하나의 언어를 정복하는 데 걸리는 시간은 단 3일. 단 양질의 데이터 확보가 전제돼야한다. 네이버는 더 똑똑한 파파고를 만들어내기 위해 네이버에서 생산되는 다양한 데이터를 학습시키고 있다. 사전에 나올법한 딱딱한 문장이 아닌 사람이 번역한 듯한 자연스러운 번역이 가능한 비결이다.

김 리더는 “인공신경망이 적용된 프로그램은 마치 사람처럼 학습하는 데이터에 따라 품질이 다르다”며 “파파고는 실제 사람들이 현재 사용하는 언어를 이해할 수 있게 하기 위해 네이버 브이, 지식인, 웹툰 등의 다양한 데이터를 학습에 활용하고 있다”고 설명했다.

네이버가 파파고의 가능성에 거는 기대는 크다. 기계가 언어를 번역해 주면서 해외 관광이나 쇼핑 등에서의 불편을 큰 폭으로 해소할 수 있기 때문이다. 실제 최근 인터넷 쇼핑이나 화장품, 정부기관에서도 제휴 ‘러브콜’이 쏟아지고 있다.

특히 파파고는 네이버 서비스를 더 다양한 국적의 사용자가 이용할 수 있게 하는 기반이기도 하다. 네이버의 글로벌 시장 공략에 빠질 수 없는 서비스다. 네이버는 내년 중 스페인어, 프랑스어, 인도네시아어, 태국어, 중국어(번체), 베트남어 등 6개 언어를 추가 지원한다. NMT 기술을 네이버 서비스 전반으로 확장, 실용화에도 박차를 가한다.

김 리더는 “파파고는 언어통일을 꿈꾸며 만들어진 세계공용어 에스페란토어로 앵무새라는 뜻”이라며 “인터넷이 거리의 장벽을 없앴지만, 아직 남아있는 언어 장벽은 기계번역이 허물어줄 것”이라고 밝혔다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>