23년차 검찰 음성분석관도 "전화사기 일단 끊는 수밖에요" 이유는

23년차 검찰 음성분석관도 "전화사기 일단 끊는 수밖에요" 이유는

정경훈 기자, 김창현 기자
2023.02.11 13:30

[MT리포트-신종범죄의 습격 1부: 딥보이스, AI 범죄 잡는 AI]④김경화 대검 음성분석실장 인터뷰

김경화 대검 음성분석실장. /사진=김창현 기자
김경화 대검 음성분석실장. /사진=김창현 기자

"딥보이스 사기 전화가 오면요? 검찰 직원들도 '일단 끊는 방법밖에 없지 않겠냐'고 하던데요."

김경화 대검찰청 음성분석실장(감정관·언어학 박사)은 지난 10일 머니투데이 인터뷰에서 '인공지능(AI)으로 합성·변조된 목소리를 진짜 목소리와 구분하기가 정말 힘드냐'는 질문에 이렇게 말했다.

김 실장은 2000년부터 대검 음성분석실에서 근무한 검찰 내 대표적인 음성분석 전문가다. 대검 음성분석실에선 주로 전화 통화상 목소리가 실제 피의자의 목소리와 동일한지, 녹음파일이 조작됐는지를 가려내는 일을 한다.

김 실장은 "'국제 음성신호처리학회'에서 매년 훈련된 감정관들이 참여하는 합성음 탐지 챌린지를 여는데 구분율이 점점 떨어진다"며 "전문가들도 식별하기 어려워지는 상황"이라고 전했다. AI 음성 합성·변조 기술이 경력 20년 이상의 내로라하는 전문가도 맨귀로는 진위를 파악하기 힘들 정도로 발전했다는 얘기다.

AI 음성 기술 자체가 나쁜 것은 아니다. 이를테면 네이버는 지난해 돌아가신 부모님의 목소리로 글을 읽어주는 '엄마의 목소리를 부탁해'라는 캠페인을 진행해 뜨거운 호응을 받았다. 하지만 실제 목소리와 구분이 힘든 AI 목소리가 범죄에 악용됐을 때는 파괴력이 크다.

해외에서는 돈을 노린 딥보이스 일당이 CEO(최고경영자)의 목소리를 흉내내 거액을 가로챘다는 뉴스가 심심찮게 보도된다. 국내에서도 보이스피싱 전화를 받은 사람 사이에서 아들·딸 목소리로 전화가 왔다는 경험담을 내놓는 이들이 적잖다. 검찰에 따르면 보이스피싱 피해액은 지난해에만 5438억원에 달했다. 아직까지는 어색한 보이스피싱 범죄의 음성이 '내가 잘 아는 사람'의 목소리로 바뀔 때 피해가 어느 만큼 커질 수 있는지는 예상하기조차 어렵다.

김 실장은 "정치인이나 연예인의 목소리를 합성해 말한 적도 없는 말을 한 것처럼 대중을 속이면 사회적으로 큰 혼란이 생길 수도 있다"고 말했다. 지난해엔 AI가 제작한 볼로디미르 젤렌스키 우크라이나 대통령의 '항복 선언' 영상이 유튜브에 퍼져 논란이 됐다. 김 실장은 "SNS(소셜네트워크서비스)에서 짧게는 몇 분, 몇 초 분량의 음성과 영상을 따도 가짜 음성과 영상을 만들 수 있다"며 "유명인이 아니라 일반 시민들도 딥보이스 음성합성·변조로 명예훼손·허위사실 유포 같은 사건의 피해자가 될 가능성이 크다"고 말했다.

딥보이스 탐지가 가능해지면 이런 사건으로 범인으로 몰린 사람이 누명을 벗을 수 있고 진범을 잡아낼 증거를 확보할 수도 있다. 대검은 2019년부터 딥보이스 기술과 국내외 전문가를 파악하면서 의견을 청취, 관련 연구를 준비했다. 아직 시장 수요가 많지 않아 정부가 나서야 한다는 판단에서다.

김 실장은 "민간 기업 입장에서 통합형 탐지 기술 개발을 해도 팔 곳이 결국 검찰 등 몇몇 기관밖에 없을텐데 개발 유인이 적지 않겠냐"며 "빠르게 발전하는 합성·변조 기술에 맞춰 탐지 기술을 개발하려면 충분한 인력과 예산 지원이 필요하다"고 말했다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>

정경훈 기자

안녕하세요. 정치부 정경훈 기자입니다.

김창현 기자

안녕하세요. 증권부 김창현 기자입니다.

공유