국내 연구팀이 법률, 금융 등 전문 분야에서 일반인도 이해하기 쉬운 수준으로 신뢰도 높은 설명을 제공하는 AI(인공지능)를 개발했다.
ETRI(한국전자통신연구원)은 권오욱 지능정보연구본부 언어지능연구실장이 이끄는 연구팀이 '설명 가능한 전문가 의사결정지원 AI 기술'을 개발했다고 19일 밝혔다.
'검색증강생성(RAG)'이라 불리는 이번 기술은 대규모 언어모델(LLM)에서 질문에 대한 답변을 생성하기 전, 외부의 신뢰할 수 있는 지식 데이터베이스를 검색하고 참조해 응답을 생성하는 기술이다. AI가 검색 근거의 적합성, 활용성, 정답의 적합성 등에 대해 '자기 검증'한 뒤 답변한다.
연구팀은 우선 한국어에 최적화된 '토큰화 적용 언어 이해 모델(MoBERT)'을 개발했다. 언어모델이 이해할 수 있는 단위(토큰)인 형태소 단위로 한국어를 분리해 AI를 학습했다. 이를 기반으로 검색에 특화된 데이터를 추가 학습시킨 뒤 다양한 문맥 정보를 통해 유사한 검색 대상까지 계산할 수 있도록 성능을 높였다.
이렇게 제작된 AI는 사용자가 던진 질문에 대한 관련 지식을 검색해 정답을 제공한다. 이와 동시에 검색한 지식과 생성한 정답의 적합성을 자체 검증해 그 결괏값을 보여준다.
연구팀이 AI 성능을 테스트하기 위해 진행한 실험에서 특정 인물(가수 장기하)을 검색하자 AI는 여러 학습 데이터를 기반으로 얻은 인물의 약력을 문장화해 내놨다. 이어 자신이 내놓은 답변을 문장 단위로 분해한 후 검색증강기술을 통해 답변 중 '사실 비율'은 어느 정도인지, 틀린 문장은 어떤 것인지 분석했다. 예를 들어 요약된 약력 중 '장기하는 2011년 대한민국 대중문화예술상에서 대통령상을 수상하는 등 많은 성공을 거뒀습니다'라는 문장은 틀렸다고 표시된다. 록 밴드 '장기하와 얼굴들'은 당시 대통령상이 아닌 문화체육관광부 표창을 받았다.
연구팀은 "학습 데이터의 부정확성이나 AI가 주어진 맥락에 근거하지 않고 잘못된 답변을 내놓는 현상인 '할루시네이션(hallucination)'을 크게 줄였다"며 "특정 분야에 적용하면 훨씬 더 정확하고 신속한 답변이 가능할 것"이라고 설명했다.
특히 법률자원 지원 분야에 AI를 적용할 경우 효과가 클 것으로 봤다. 변호사, 법무사, 의뢰인이 법과 관련된 내용을 입력하면 AI가 관련 판례와 법률을 검색해 분석한 후 법률 행위를 추론해 주는 식이다. 또 복잡한 판례를 입력해도 일상 용어로 쉽게 풀어내, 해석 결과가 사실인지 일반인 수준에서도 검증할 수 있다는 설명이다. 복잡하고 어려운 내용이 많은 금융 상담 분야에도 적용할 수 있을 것으로 봤다.
권 실장은 "AI가 생성한 결과가 전문적인 내용인 경우, 내용을 이해하는 게 어렵기 때문에 사실 ·거짓 구분도 불가능하다"며 "이번 기술은 법률, 금융 등의 전문 상담 분야에서 AI를 활용하는 데 큰 도움이 될 것"이라고 밝혔다.
연구팀이 개발한 '사실성 검증 기술'은 오픈소스 소프트웨어 웹사이트인 '깃허브(GitHub)'에 공개됐다. 현재 에프앤유신용정보와 함께 기술이전을 통한 금융 분야 상담 AI 사업화를 목표로 개념증명(PoC)을 진행 중이다.
이번 과제는 과학기술정보통신부와 정보통신기획평가원(IITP)의 지원을 받아 수행됐다.