"모호하면 되묻는다" 네이버, 환각 현상 잡은 'AI 검색' 기술 공개

이정현 기자
2026.07.05 10:00

네이버, '탐색에서 실행까지, 차세대 AI 기술이 만드는 네이버 AI 검색' 을 주제로 테크 딥톡 세션

이기창 네이버클라우드 하이퍼스케일 AI 모델 이사가 발표하고 있다. 2026.07.03./사진제공=네이버

네이버(NAVER)가 AI 할루시네이션(환각) 현상을 잡은 획기적 기술을 공개했다.

네이버는 지난 2일 서울 서초구 D2SF 강남 사옥에서 '탐색에서 실행까지, 차세대 AI 기술이 만드는 네이버 AI 검색'을 주제로 테크 딥톡 세션을 열었다. 이날 세션에서는 △대화형 AI 검색 'AI탭' 최적화 모델 △AI를 안전하고 효율적으로 운영하는 하네스 엔지니어링(Harness Engineering) △AI의 시각적 이해를 확장하는 멀티모달 기술 등 차세대 AI 검색을 구현하는 핵심 기술이 공개됐다.

이번에 공개한 AI탭 최적화 모델은 할루시네이션 현상을 대폭 개선한 것이 특징이다. 답을 낼 수 없는 질문에 대해 추가 조건을 되물었을 때, 보상을 부여해 모델 성능을 높였다. 즉, AI가 모호한 요청을 임의로 해석해 답변하지 않고 추가 질문을 통해 사용자의 의도를 명확하게 확인하는 Clarify RL(Clarify Reinforcement Learning, 명료성 강화학습) 기술로 할루시네이션 현상을 개선했다. 아티피셜애널리시스(Artificial Analysis)의 지식·환각 평가 벤치마크(AA-Omniscience)기준, 해당 특화 모델의 할루시네이션 비율은 기존 HCX (하이퍼클로바X) 대비 최대 30%포인트 감소한 것으로 나타났다.

AI탭에 적용한 이 모델은 기존 하이퍼클로바X(HCX)에 기반해 AI 검색 서비스를 위해 개발된 경량 모델로, 네이버의 데이터·서비스 시나리오·사용자 피드백을 모델 설계 전반에 반영한 프로덕트 네이티브 LLM(거대언어모델)이다.

이 모델은 서비스 효율성을 극대화하기 위해 데이터, 아키텍처, 트레이닝 3대 축을 중심으로 개발됐다. 네이버는 문서 품질 필터를 통해 학습 데이터의 품질을 높였고, 복잡한 사용자 요청과 최적의 답변을 매핑하는 '서비스형 데이터 수집 파이프라인'을 구축해 검색·쇼핑·플레이스·생활정보 분야의 고품질 데이터를 사전 학습 단계부터 반영했다.

트레이닝 단계에서는 강화학습에 투입되는 컴퓨팅 자원이 기존 HCX 대비 2배 이상 확대됐다. 유저 시뮬레이터와 네이버의 검색·예약 등 실제 서비스를 연계한 강화학습 환경을 구축해, 모델이 여러 도구를 활용해 사용자의 과업을 끝까지 수행하도록 학습시켰다.

네이버는 에이전틱 검색 서비스 AI탭을 안정적으로 구동하는 핵심 기술 '하네스 엔지니어링'도 공개했다. AI 검색이 에이전트로 확장될수록 사용자가 검색을 통해 해결하려는 과업이 다양하고 복잡해진다. 이에 답변 품질뿐 아니라 응답 속도, 비용 효율성, 안정성까지 함께 관리되는 것이 중요하다.

AI탭에 적용된 하네스 엔지니어링은 AI가 부적절한 답변을 하지 않도록 제어하는 동시에, 필요한 정보를 스스로 찾고 적절한 도구를 활용해 사용자의 요청을 끝까지 수행하도록 설계됐다. 안전 필터, 사용자 의도 이해 및 긴 대화 맥락 관리, 검색·쇼핑·플레이스 등 서비스 연계 추론, 출처 제공 및 실행 연결의 네 단계로 동작한다.

마지막으로 네이버는 검색창 전면에 배치된 스마트렌즈를 중심으로 한 멀티모달 기술 고도화 전략도 함께 공개했다. 멀티모달은 이미지를 AI가 이해할 수 있는 표현(임베딩)으로 변환해 텍스트뿐 아니라 이미지와 영상 등 다양한 형태의 정보를 이해·활용할 수 있도록 하는 기술이다.

이기창 네이버클라우드 하이퍼스케일 AI 모델 이사는 "AI탭에 적용된 모델은 학습 데이터 구축부터 모델 설계, 강화학습까지 전 과정을 네이버 서비스에 맞춰 최적화한 것이 특징"이라고 말했다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>