"흰색 소파 찾아줘"…텍스트 한 줄로 3D 공간 속 물체 찾는 AI 개발

류준영 기자
2026.06.08 11:00

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

주경돈 교수(좌측)와 방재훈 연구원/사진=UNIST

증강현실(AR) 화면이나 로봇이 인식하는 3차원 공간에서 사용자가 원하는 물체를 텍스트 입력만으로 찾아내는 인공지능 기술이 국내 연구진에 의해 개발됐다.

울산과학기술원(UNIST) 인공지능대학원 주경돈 교수팀은 자연어를 기반으로 3D 복원 공간 속 대상을 찾아내는 '오픈어휘 기반 3D 공간 인식 기술' '라이트스플랫(LightSplat)'을 개발했다고 8일 밝혔다.

이 기술은 '흰색 소파'나 '라면 위 달걀'처럼 사용자가 입력한 다양한 표현을 바탕으로 AI가 3D 복원 공간 안에서 해당 물체의 위치와 영역을 정확히 찾아낸다. 기존 기술이 의자·책상·문처럼 미리 정해진 범주 안에서만 물체를 탐색했던 것과 달리, 더 구체적이고 자유로운 표현으로도 원하는 대상을 찾아낼 수 있다.

로봇이나 AR 기술에서는 카메라로 들어온 2D 이미지를 위치·색·투명도 정보를 담은 작은 점 입자(가우시안)들이 모인 3D 공간으로 복원한다. 3D 공간 인식은 이렇게 복원된 공간에서 어떤 물체가 어디에 있고, 어느 영역을 차지하는지 파악하는 기술이다.

라이트스플랫의 가장 큰 강점은 처리 효율이다. 기존 오픈어휘 3D 공간 인식 기술 대비 메모리 사용량을 64분의 1 수준으로 줄였고, 3D 가우시안에 의미 정보를 연결해 자연어 검색이 가능한 상태로 만드는 데 걸리는 시간도 약 5초로 단축했다. 이는 기존 최신 기술보다 50~400배 빠른 속도다.

기존 기술이 3D 공간의 각 점 입자마다 긴 숫자 형태의 언어 특징값을 저장했던 것과 달리, 라이트스플랫은 각 점 입자에 2바이트짜리 짧은 인덱스만 부여한다. 실제 의미 정보는 별도 표에 저장해두고 필요할 때 인덱스를 통해 참조하는 방식으로, 메모리 부담을 대폭 낮췄다.

또 실제 물체를 표현하는 데 영향을 주는 점만 선별해 인덱스를 붙이고, 서로 다른 이미지에 흩어진 같은 물체 정보는 하나로 통합해 처리 속도를 높였다.

제1저자인 방재훈 연구원은 "오픈어휘 3D 사물 인식 기술을 실제 현장에 적용하려면 정확도뿐 아니라 속도와 메모리 효율을 함께 갖춰야 한다는 점에서 의미 있는 성과"라고 말했다. 주경돈 교수는 "사람의 말로 지시를 바로 수행하는 로봇 개발, 텍스트로 대상을 즉시 지정해 편집하는 AR·VR 콘텐츠 제작, 디지털 트윈 등 다양한 분야에 적용할 수 있을 것"이라고 기대했다.

[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>

관련 기사