더벨'머니투데이 thebell'에 출고된 기사입니다.
인공지능(AI) 테크 기업 크라우드웍스(2,365원 ▼385 -14%)가 비정형 데이터를 AI-Ready 데이터로 전환하는 AI 데이터 파서 ‘알피 날리지 컴파일러(Alpy Knowledge Compiler)’의 데모 서비스를 자사 홈페이지를 통해 공개했다고 4일 밝혔다.
‘알피 날리지 컴파일러’는 기업 내 여러 시스템에 흩어져있는 비정형 문서를 RAG 기반 AI 서비스에 최적화된 AI-Ready 데이터로 변환하는 지능형 AI 데이터 파서이다.
‘알피 날리지 컴파일러’는 문서 복잡도를 정량적으로 평가하는 특허 기술을 기반으로 전처리 자동화 수준을 정밀하게 조정할 수 있는 것이 차별화된 특징이다. 파싱(Parsing) 이전 단계에서 문서를 복잡도에 따라 분류해 자동 처리 대상과 전문가 정밀 파싱이 필요한 문서를 선별한다. 이를 통해 대규모 문서 환경에서도 전처리 효율과 데이터 품질을 동시에 확보할 수 있다.
이러한 기술력은 실제 프로젝트를 통해 검증됐다. 크라우드웍스는 최근 보안 규정이 까다로운 국내 한 금융사를 대상으로 CPU 기반 환경에서 150만개 이상의 다양한 비정형 문서를 RAG 데이터로 변환하는 프로젝트를 완료했다. 매일 신규로 생성되는 사내 문서를 실시간 처리하고 데이터 온톨로지를 구축해 RAG에 최적화된 구조로 정제함으로써 AI가 실제 업무 환경에서 정확한 답변을 생성할 수 있도록 데이터 파이프라인을 구현했다.
인프라 유연성도 강점이다. 온프레미스와 클라우드 환경을 모두 지원해 보안 요건이 높은 기업 환경에서도 안정적으로 적용이 가능하다. 또한 GPU 뿐 아니라 CPU에서도 운영할 수 있어 비용 효율적인 RAG 데이터 파이프라인 구축이 가능하다.
또한 기업 내 다양한 문서 자산과 기존 시스템과 연계하고 통합하는 데이터 파이프라인 설계 역량도 강점이다. 이를 통해 단순한 데이터 전처리를 넘어 실제 서비스 단계에서 AI가 정확한 답변을 생성할 수 있도록 데이터 구조화, 온톨로지 구축까지 지원할 수 있다.
크라우드웍스 관계자는 “AI 시대에서는 얼마나 좋은 모델을 쓰는지보다 얼마나 잘 설계된 데이터를 보유하고 있느냐가 경쟁력을 좌우한다”며 “앞으로도 데이터 품질을 정량화하고 표준화하는 기술을 통해 AI 데이터 산업의 기준을 만들어가겠다”고 말했다.