알파고 '버그'의 진실…알고리즘 오류? 프로그램 한계?

알파고 '버그'의 진실…알고리즘 오류? 프로그램 한계?

김지민 기자
2016.03.15 03:00

"계산 과정 상 한계·오버피팅 가능성"…"알파고 능력 향상되는 건 시간문제..사람이 이긴 마지막 경기 될 수도"

/사진=13일 제4국 후 기자간담회에 참석한 이세돌 프로바둑기사 9단, 데미스 하사비스 딥마인드 대표, 데이비드 실버 알파고 개발총괄(사진 왼쪽부터) /제공=구글
/사진=13일 제4국 후 기자간담회에 참석한 이세돌 프로바둑기사 9단, 데미스 하사비스 딥마인드 대표, 데이비드 실버 알파고 개발총괄(사진 왼쪽부터) /제공=구글

바둑천재를 3번 연속 이기며 승승장구하던 알파고가 4번째 대국 만에 패했다. 이세돌 9단이 버그(프로그램 오류)로 인지할 정도로 치명적인 악수를 둔 게 패인이다. 과연 어떤 문제가 있었던 걸까.

지난 13일 이세돌 프로바둑 기사 9단이 인공지능(AI)바둑 프로그램 알파고를 상대로 첫 승을 거두자 알파고 개발사인 구글 딥마인드 대표와 알파고 개발을 총괄했던 엔지니어는 “알파고의 한계를 알았고 단점이 노출됐다”고 오류를 깨끗이 인정했다.

전문가들 사이에서는 알고리즘 자체의 문제라기보다는 프로그램상 한계로 보는 견해가 대세다. 또 알파고는 졌지만 구글 입장에서는 프로그램을 한 단계 진일보시킬 수 있는 새로운 기회가 됐다는 점에서 수확이 더 많은 게임이었다.

◇단순 프로그램 오류보다는 계산과정 상 한계·오버피팅 가능성=이 9단은 대국 직후 가진 기자회견에서 “알파고는 생각지 못한 수가 나왔을 때 일종의 버그(프로그램 오류) 형태로 몇 수가 진행됐고 대처능력이 떨어지는 것을 느꼈다”고 말했다. 이날 알파고는 79수를 시작으로 4수 넘게 떡수(이상한 착수를 일컫는 말)를 두면서 기존에 보여줬던 천재적인 기량으로 기대할 수 없는 패턴을 보였다.

통상 정보기술(IT)업계에서 버그는 ‘개발자가 명백한 실수를 해서 생긴 프로그램 상 오류’라는 의미로 해석된다. 알파고의 착수가 버그로 인식할 정도로 황당했던 건 맞지만 알고리즘 상의 문제는 아닐 것이라는 게 전문가들의 추정이다. 알파고의 탐색 알고리즘인 몬테카를로 트리검색(MCTS)의 한계라는 것. 김현기 한국전자통신연구원(ETRI) 지식마이닝연구실장은 “MCTS는 상대와 내가 두는 상황을 시뮬레이션으로 돌려 내가 이길 확률이 높은 결과 값을 찾아가는 과정인데 알파고가 질 확률이 높은 상황에서는 계산 시간이 더 많이 걸릴 수밖에 없다”고 지적했다.

그나마 알파고는 MCTS만 활용하던 기존 AI바둑프로그램과 달리 정책망과 가치망을 통한 딥러닝을 MCTS에 처음으로 결합하면서 경우의 수를 적절히 제한하며 승률 계산 능력을 향상시켰다는 평가다. 하지만 이길 가능성이 낮아지면서 계산과정이 복잡해졌고 ‘오차’까지 막아내지 못했다는 것. 정지훈 경희사이버대 교수는 “후반으로 갈수록 형세가 불리해지면서 무리하게 수를 찾는 과정이 나타났다”며 이를 불리한 국면에서 상대를 따라잡을 때 나타나는 엉킴현상이라고 풀이했다. 이 9단이 “알파고가 백보다는 흑을 조금 힘들어한다”고 느낀 것도 이런 맥락에서 이해할 수 있다는 지적이다.

추형석 소프트웨어정책연구소 선임연구원은 “알파고가 MCTS가 검색할 수 있는 범위를 적절히 제한해줬다는 점에서 큰 공로를 세웠지만 승률을 찾는 과정에서 어느 한쪽으로 치우친 시뮬레이션이 작동했을 가능성 등 여러 과제를 남겼다”고 말했다.

딥러닝을 통해 인간이라면 굳이 학습하지 않았을 부분까지 학습하면서 발생한 ‘오버피팅(Overfitting·과적합)’의 결과라는 분석도 나온다. 데미스 하사비스 딥마인드 대표도 지난 11일 카이스트 강연에서 “대국 전 불안했던 것은 많은 수의 훈련을 하면서 생긴 알파고의 오버피팅 가능성”이라고 언급했다. 정 교수는 “알파고가 신경망을 통해 정책결정을 하는 과정에서 고수라면 들여다보지 않아도 될법한 부분들에 대한 데이터까지 영향을 미치면서 오버피팅이 발생한 것이라 볼 수 있다”고 추정했다.

/사진=8일 오전 서울 포시즌스 호텔에서 열린 대국 관련 기자회견에 참석한 이세돌 9단과 에릭 슈미트 구글 회장(사진 왼쪽부터) /이동훈 기자
/사진=8일 오전 서울 포시즌스 호텔에서 열린 대국 관련 기자회견에 참석한 이세돌 9단과 에릭 슈미트 구글 회장(사진 왼쪽부터) /이동훈 기자

◇구글에겐 패한 것이 ‘득’…프로그램 업그레이드하면 人 이길 것=알파고의 약점은 노출됐지만 대국 결과가 프로그램 성능 향상에 있어 큰 자원이 될 것이란 점에서 구글 입장에선 결코 ‘슬픈 패배’가 아니다. 알파고 개발을 총괄한 데이비드 실버 박사는 “이번 대국으로 알파고의 허점과 한계를 알 수 있었다”며 “오늘은 굉장히 소중한 지식을 얻었다”고 말했다.

이지수 한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅본부 책임연구원은 “알파고가 4국에서도 이겼으면 알파고의 한계를 가늠할 수 없었겠지만, 전날 대국을 통해 알파고가 판세를 가려내는 인간의 직관 능력에는 미치지 못한다는 점을 알게 됐을 것”이라고 지적했다. 이날 알파고는 이 9단이 ‘신의 한 수’로 불리는 78수 이후부터 혼란을 거듭하며 이 9단에게 확실히 밀리고 있음을 고스란히 보여줬다.

구글이 이번 대국 기보와 데이터 로그기록, 신간 분배 및 가중치 방식을 업그레이드해 나가면 지난 대국에서 보여준 한계를 머잖아 뛰어넘을 수 있을 것으로 전문가들은 예상했다. 이 연구원은 “알파고의 능력이 향상되면 사람이 기계를 상대로 이기는 마지막 대국으로 기록될 수도 있다”고 말하며 AI 발전 가능성에 무게를 실었다.

딥러닝 기반 의료영상 서비스 업체 백승욱 루닛 대표는 “알파고의 학습 과정에서의 맹점이 고스란히 드러난 경기였다”며 “AI의 한계에 대해 짚어보게 된 계기가 됐다는 점 자체만으로 앞으로 AI연구에 큰 기여를 한 것”이라고 말했다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>

공유