[더벨]크라우드웍스, '국대 AI' 정예팀 합류

[더벨]크라우드웍스, '국대 AI' 정예팀 합류

김인규 기자
2026.02.24 13:47
크라우드웍스가 대한민국 AI 기술 자립을 이끌 국가대표 AI 프로젝트에 합류했다고 발표했다. 과학기술정보통신부의 독자 AI 파운데이션 모델 개발 사업에 모티프테크놀로지스 컨소시엄의 데이터 공급 핵심 파트너로 참여하게 되었다. 3000억 파라미터급 추론형 거대언어모델의 고품질 데이터 공급을 책임지며, 자체 개발한 비정형 문서 데이터 전처리 솔루션을 투입하여 AI-Ready 데이터로 변환한다. 이번 합류를 통해 글로벌 빅테크와 경쟁할 수 있는 독자 AI 모델 개발을 뒷받침하겠다고 전했다.

더벨'머니투데이 thebell'에 출고된 기사입니다.

인공지능(AI) 테크 기업 크라우드웍스(3,255원 ▼65 -1.96%)가 대한민국 AI 기술 자립을 이끌 ‘국가대표 AI’ 프로젝트'에 합류한다고 24일 밝혔다.

최근 과학기술정보통신부의 ‘독자 AI 파운데이션 모델(독파모) 개발 사업’ 추가 공모에 모티프테크놀로지스(모티프) 컨소시엄이 선정됐다. 크라우드웍스는 이 컨소시엄에 데이터 공급 핵심 파트너로 참여하며 LG AI연구원, SK텔레콤, 업스테이지 컨소시엄과 함께 국내 AI 생태계를 선도할 4대 정예팀의 일원으로 활동하게 됐다.

이번 사업에서 크라우드웍스는 모티프 컨소시엄이 추진 중인 3000억(300B) 파라미터급 ‘추론형 거대언어모델(LLM)’의 고품질 데이터 공급을 책임진다. 모델의 지능적 사고 역량을 극대화하기 위해 단순 가공을 넘어 ‘단계별 추론(Chain-of-Thought) 특화 학습 데이터셋’ 구축에 핵심 역량을 집중한다.

특히 자체 개발한 비정형 문서 데이터 전처리 솔루션인 ‘알피 날리지 컴파일러(Alpy Knowledge Compiler)’를 전격 투입한다. 이를 통해 표, 차트 등 복잡한 구조를 가진 비정형 문서를 정교하게 파싱해 AI가 이해할 수 있는 ‘AI-Ready’ 데이터로 변환한다. 이는 추론형 모델이 다양한 전문 지식을 안정적으로 학습하고 단계별로 추론하는 능력을 구현하는 데 핵심 동력이 될 전망이다.

크라우드웍스는 이번 정예팀 합류 이전부터 ‘국대 AI’ 정예팀에 학습 데이터를 지속적으로 공급해 왔다. 지난해 하반기에는 저작권 문제를 해결한 도서 데이터 등을 제공해 왔으며 한국 사회의 언어적·문화적·시대적 맥락을 정교하게 반영한 ‘방송영상 이해 데이터셋’ 구축 사업까지 성공적으로 완료해 실전 역량을 검증받았다.

크라우드웍스 관계자는 “추론형 LLM의 지능은 얼마나 논리적이고 정교한 데이터를 학습하느냐에 달려 있는 만큼 크라우드웍스의 역할이 중요해지고 있다”며 “그동안 국내 빅테크들과 협업하며 검증받은 데이터 정제 기술과 고품질 데이터 구축 노하우를 결집해 글로벌 빅테크와 경쟁할 수 있는 독자 AI 모델 개발을 뒷받침하겠다”고 전했다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>

공유