
국가인공지능전략위원회가 '한국형 독자 AI 파운데이션 모델(이하 독파모) 개발 프로젝트' 성공의 핵심 요소인 데이터 확보에 관한 애로사항을 청취하기 위해 국가대표 AI 기업들을 불러 모았다.
위원회는 LG AI연구원, 업스테이지, SK텔레콤(77,800원 ▼700 -0.89%), 모티프테크놀로지스 등 국가대표 AI 기업들과 간담회를 개최했다고 2일 밝혔다. LG AI연구원은 합리적인 규제 정비가 필요하다고 강조했다. 이어 향후 저작권을 포함한 정부의 다양한 제도 개선 노력에 힘입어 글로벌 경쟁력을 갖춘 독파모 개발에 박차를 가하겠다고 밝혔다.
업스테이지는 한국어 AI 경쟁력 강화를 위한 데이터 인프라 구축을 요청했다. 구체적으로 △국립중앙도서관 납본 도서 데이터화 △텍스트·데이터 마이닝(TDM) 면책 규정 등 저작물 활용 규정 마련 △국가 자격시험 풀이 해설 등 전문가 사고 과정 중심의 데이터셋 구축 등을 언급했다.
SKT는 데이터 확보·활용 전반의 개선 방안을 제시했다. 특히 정부가 제공하는 공동 활용 데이터를 별도 재가공 없이 학습에 직접 적용할 수 있도록 검증·정제 체계가 고도화될 필요가 있다고 밝혔다. 또 △도메인 특화 데이터 확보 △공신력 있는 한국어 평가 데이터셋 확충 △공공 생산 데이터 활용 촉진을 위한 라이선스 문제 해소 △민감 정보 처리에 대한 민간 부담 완화 지원 등을 건의했다.
모티프테크놀로지스는 개별 기업이 대규모 한국어 사전학습 데이터를 독자적으로 구축하기 어려운 현실을 지적했다. 모티프는 SKT와 마찬가지로 '고품질 한국어 사전학습 데이터셋'이 필요하다고 주장했다. 또 정부 지원 사업이 원천 데이터 확보 중심이라는 점을 지적하며 실제 AI 모델 학습에 필요한 데이터 후처리·가공 지원을 확대해달라고 요청했다.
임문영 상근부위원장은 "독파모 프로젝트의 성공이 AI 기본사회 구현의 출발점"이라며 "데이터 확보 문제는 특정 부처·기관의 역할이 아닌 범국가 차원의 숙제인 만큼 관련 역량을 결집하고 속도감 있는 실효적 지원을 추진하겠다"고 밝혔다.
한편 위원회는 지난 2월25일 제2차 전체 회의를 통해 '대한민국 인공지능 행동계획'을 의결했다. 행동계획에는 △범용 AI 파운데이션 모델 확보 등 독파모 지원 △국가 데이터 통합플랫폼 기반 민간·공공데이터 품질 고도화 △AI 데이터 공유 생태계 활성화 △개인정보·미개방 산업 데이터 활용 규제 정비 등 과제가 포함돼있다.