[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]
테슬라와 보스턴다이내믹스 등 글로벌 로봇업체들이 휴머노이드 시장 선점을 위해 수조원을 투입하며 맞붙고 있다. 이러한 흐름을 타고 국내 피지컬AI 시장에서도 적지 않은 투자금이 관련 스타트업에 투입되고 있다. 다만 자본의 흐름은 이미 대기업이 각축을 벌이는 로봇 본체 대신 로봇을 가르치는 데이터와 AI 모델로 몰리고 있다.
이는 피지컬AI 학습에 필요한 데이터의 특성 때문이다. 피지컬AI는 LLM(거대언어모델)처럼 가상의 공간에서 텍스트로 학습하는 대신 현실 세계에서 직접 로봇을 움직이며 관절 각도와 힘, 카메라의 시야 등 데이터를 쌓고 학습해야 한다 . 오로지 '현장'에서만 얻을 수 있는 데이터를 공부하며 진화해야 단순 '로봇'이 아닌 진정한 '피지컬AI'로 거듭날 수 있다.
한국은 로봇 보급 자체는 세계 최고 수준이다. IFR(국제로봇연맹)에 따르면 국내 제조업 로봇 밀도는 근로자 1만명당 1220대로 세계 1위이며 전 세계 평균(177대)을 아득히 뛰어넘는다. 반면 이러한 로봇에 깔려있는 행동기반 학습 데이터는 글로벌 선도기업의 발끝에도 미치지 못하는 수준으로 알려졌다. 그야말로 '몸 쓰는' 로봇만 많은 실정이다.
이 같은 데이터 부족은 우선 '표준화 부족'에 기인한다. 로봇마다 관절과 센서, 카메라의 위치와 구조, 데이터 수집 형태와 주기 등이 제각각이다. 처음부터 학습을 상정하지 않고 모으는 데이터는 의미가 없다. 표준화를 거친 뒤에도 산업 현장에서 오랜 기간 반복 수행하는 데 시간이 든다. 자본을 투입해 로봇을 늘리기는 쉬워도 수년간의 데이터 자체를 만들어낼 수는 없다.
데이터의 '분절화'도 피지컬AI의 학습을 방해하는 요소로 꼽힌다. 한 로봇 스타트업 대표는 "로봇이 실제 작업에서 어떤 걸 인식하고 판단했는지, 동작에 따른 결과가 어땠는지 연결된 데이터가 필요한데 국내 현장 대부분은 설비별로 이를 모으는 기능이 부족하다"며 "같은 설비를 쓴다고 하더라도 기업별로 제조 데이터를 폐쇄적으로 축적하고 있어 서로가 서로의 학습에 도움이 될 수가 없다"고 말했다.
피지컬AI 확산으로 데이터와 AI 모델의 중요성이 커지면서 관련 사업에 뛰어드는 스타트업도 늘고 있다. 2024년 서민준 KAIST 교수가 창업한 컨피그인텔리전스가 대표적이다. 이 회사는 휴머노이드 등 범용로봇을 움직이는 AI모델인 'RFM(로봇 파운데이션 모델)'을 개발한다. RFM 학습을 위한 고품질 학습 데이터를 구축하는 데 특화돼 있다. 베트남에 300명 규모의 공장을 운영하며 10만 시간 이상의 인간 동작 데이터를 축적했다. 이에 힘입어 지난달 삼성, 현대차, LG, SK 등 국내 주요 그룹사가 대거 참여한 400억원 규모의 시드 투자를 받았다.
서비스 로봇 스타트업 엑스와이지(XYZ)는 지난 3월 코오롱인베스트먼트 등으로부터 130억원 규모의 시리즈B 투자를 유치했다. XYZ는 직접 운영하는 매장에서 데이터를 모은다. 자체 개발한 손동작 수집 기기로 사람 손의 움직임을 기록한 뒤 로봇제어모델 고도화에 쓴다. 데이터 수집부터 학습, 지능모델 개발, 실제 매장을 통한 피드백까지 피지컬AI의 전 과정을 자체 인프라로 수행하는 풀스택 체계가 갖춰져 있다.
위로보틱스는 지난달 JB인베스트먼트 등에서 950억원 규모의 시리즈B 투자를 받았다. 위로보틱스는 3년여 동안 3000대 이상 판매된 보행 보조 웨어러블 로봇 'WIM(윔)'을 활용해 실제 사용자들이 일상생활에서 기록한 인간 움직임 데이터를 축적한다. 이 데이터는 휴머노이드 'ALLEX' 제어 기술 개발에 활용된다.
피지컬AI 분야에선 당분간 대기업이 하드웨어를 담당하고, 이를 뒷받침할 학습 데이터와 AI모델은 스타트업이 모아오는 일종의 '원-하청' 구조가 이어질 가능성이 점쳐진다. 대기업들이 로봇 제조에 역량을 집중하는 대신 시간과 현장이 필요한 데이터와 AI모델 영역은 스타트업이 확보해놓은 걸 투자해 가져오는 게 합리적 선택이라는 것이다.
한 투자 심사역은 "각자의 로봇 전략을 세우고 경쟁하는 국내 4대 그룹이 모두 컨피그인텔리전스에 투자하는 모습은 피지컬AI 데이터 스타트업을 로봇 경쟁사가 아닌, 공통 인프라로 인식한다는 뜻"이라며 "TSMC가 애플·엔비디아·AMD의 경쟁 구도와 무관하게 모두의 반도체를 위탁생산하듯, 로봇 데이터 레이어도 같은 구조로 수렴하고 있다는 게 시장의 판단"이라고 바라봤다.