HWP 퇴출 아닌 'AI 원료化'…한컴, 문서 기업에서 데이터 기업으로

김평화 기자
2026.04.26 07:00

정부, 공공문서 HWPX 전환 추진…개방형 포맷이 여는 문서 AI 시장
36년 한글 문서가 AI 학습 데이터로…한컴의 위기이자 기회

한글과컴퓨터(한컴)가 문서 작성 소프트웨어 기업에서 'AI 데이터 인프라' 기업으로 빠르게 전환한다. 정부가 공공부문에서 HWP 파일 첨부를 단계적으로 제한키로 한 결정을 새로운 시장을 여는 발판으로 삼겠다는 각오다.

26일 정지환 한컴 최고기술개발자(CTO)는 "한글 문서는 한국 사회의 맥락이 축적된 데이터 자산"이라며 "개방형 포맷 전환과 AI 활용 기술을 통해 국내 AI 경쟁력 강화에 기여하겠다"고 밝혔다.

한국형 AI를 만들려면 한국어 텍스트만으로는 부족하다. 한국 행정·산업 현장의 맥락을 담은 구조화 데이터가 필요하다. 36년간 공공 영역에 축적된 HWP 한글 문서에는 법률, 정책, 행정, 산업 자료가 집약돼 있다. 한국 사회의 제도와 언어, 업무 방식이 반영된 고품질 데이터다. 문제는 기존 HWP가 구조적으로 AI가 읽고 가공하기 어려운 포맷이라는 점이다.

이에 국가인공지능전략위원회가 행정안전부·문화체육관광부와 함께 공공 문서 유통 채널의 개방형 포맷 전환에 나섰다. 공무원 간 문서 유통 시스템인 온나라시스템은 오는 5월부터, 대민 소통 채널인 공직자통합메일은 10월부터 단계적으로 HWP 파일 첨부를 제한하고 대신 XML 기반 개방형 포맷인 HWPX 사용을 확대키로 했다.

공공기관의 HWPX 전환이 본격화되면 기존 HWP 문서를 변환·정비하는 수요가 커진다. 문서를 AI 학습과 검색·분석에 활용하려는 수요도 함께 늘어난다.

한컴은 이미 이 흐름에 대응하는 기술 '한컴 데이터 로더'를 준비해 왔다. 한컴 데이터 로더는 HWP·HWPX 문서를 RAG(검색증강생성) 등 AI 활용에 적합한 구조화 데이터로 변환한다. 문서 SDK와 온프레미스 연계 기술은 데이터 외부 반출이 어려운 공공·금융 환경에서 문서 기반 AI를 구현하는 데 활용된다.

한컴이 과학기술정보통신부의 독자 AI 파운데이션 모델 프로젝트에서 LG AI연구원 컨소시엄 파트너사로 참여하는 것도 같은 맥락이다. 문서 플랫폼과 응용 AI 서비스 역량을 바탕으로 공공·기업 영역에서 독자 AI 모델 확산을 맡고 있다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>