엔씨소프트의 자회사 NC AI가 'K-월드모델' 연구 결과를 16일 공개했다. 월드모델은 로봇이 현실 세계의 물리적 환경을 이해하도록 설계된 피지컬 AI의 핵심 기술로 꼽힌다.
NC AI는 이날 로봇 지능의 핵심인 '월드 파운데이션 모델(WFM)' 연구 결과를 발표하며 "대규모 컴퓨팅 인프라가 요구되는 월드 모델 연구 분야에서 자체 연구 인프라를 활용해 모델 학습과 검증을 수행, 주요 태스크에서 실무 적용 가능성을 확인할 수준의 성공률을 기록했다"고 밝혔다.
피지컬 로봇 분야에서 월드 모델은 가상 환경에서 학습한 로봇이 실제 환경에서도 동일한 물리 법칙으로 작동하게 만드는 게 핵심이다. 현재 로봇 개발의 가장 큰 난제로 꼽히는 '시뮬레이션-현실 격차(Sim-to-Real Gap)'는 가상 시뮬레이션에선 완벽하게 학습한 로봇이 현실 세계의 미세한 마찰이나 물리적 변수로 오작동을 일으키는 것을 의미한다. 구글 딥마인드와 엔비디아 등도 월드모델 연구를 진행하고 있다.
NC AI는 기존 월드모델 방식과 달리 영상 생성 과정을 거치지 않고 '잠재공간' 정보에서 바로 행동을 생성하는 구조를 적용했다. 이를 통해 계산 효율성과 정확도를 동시에 높였다는 것이다. 여기에 엔씨소프트에서 20년 이상 대규모 MMORPG(다중접속역할수행게임) 서비스를 하며 축적해온 방대한 가상세계 구축 노하우와 3D생성 모델인 '바르코 3D(VARCO 3D)' 등 NC AI의 기술을 결합했다. 그 결과 NC AI는 글로벌 최고 수준 모델 대비 약 25% 수준의 GPU(그래픽처리장치) 자원만으로 모델 학습을 진행했다고 밝혔다.
성능도 실무 적용 가능성을 확인하는 수준까지 끌어올렸다. 로봇 팔의 복잡한 움직임을 제어하는 24개 조작 태스크를 대상으로 한 테스트에서 글로벌 최고 수준 SOTA 모델 대비 약 70% 수준의 성능을 기록했다. 실제 현장 적용과 직결되는 핵심 18개 태스크 기준으로는 엔비디아의 로봇 인공지능 모델 '코스모스(Cosmos)' 등 최고 성능 모델의 약 80% 수준의 성공률을 확보했다고 밝혔다.
NC AI는 로봇 학습의 필수 요소인 '데이터 부족' 문제를 근본적으로 해결할 대규모 합성 데이터 생성 파이프라인도 월드모델로 구현할 계획이다. 기존에는 눈이 내리는 공장, 조명이 꺼진 야간 물류센터, 예상치 못한 사람의 개입 등 현실에서 발생 가능한 다양한 변수를 실제 영상으로 수집하려면 막대한 시간과 비용이 소모됐다. 그러나 NC AI의 월드 파운데이션 모델 환경에서는 프롬프트 조작만으로 이같은 환경의 비디오 데이터를 대량으로 생성할 수 있다. 이를 바탕으로 반도체 클린룸, 철강 공정, 조선소 블록 등 한국 제조업 특성에 맞춘 '도메인 특화 맞춤형' 합성 데이터를 공급해 실제 현장 데이터의 부족한 점을 보완할 예정이다.
이연수 NC AI 대표는 "이번 WFM 연구 성과는 정밀한 물리 이해와 최적화된 학습 아키텍처를 통해 글로벌 톱티어 수준의 실질적 유효성을 증명해 냈다는 데 큰 의의가 있다"며 "향후 NC AI의 독보적인 월드모델 기술력을 바탕으로 K-피지컬AI 얼라이언스와 함께 한국 산업 특화형 로봇 생태계를 견고히 구축하고 나아가 글로벌 피지컬 AI 패권을 주도하는 핵심 경쟁력으로 키워나갈 것"이라고 강조했다.