[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

미디어 콘텐츠 특화 음성 AI(인공지능) 기업 허드슨에이아이가 미국 라스베이거스에서 열린 세계 최대 방송·미디어 전시회 'NAB Show 2026'에서 미디어 제작·더빙용 음성 AI 솔루션 '허드슨 스튜디오'를 선보였다고 21일 밝혔다.
NAB Show는 방송·스트리밍·프로덕션·포스트프로덕션 분야의 글로벌 기업이 대거 참가하는 행사다. 허드슨에이아이는 이번 참가를 계기로 북미·남미를 중심으로 미디어·플랫폼 기업과의 협업 논의를 확대할 계획이다.
허드슨 스튜디오의 핵심은 새롭게 업데이트한 '에이전틱 로컬라이제이션' 기능이다. 이 기능은 미디어 현지화의 기획부터 실행, 품질검수(QC)까지 전 과정을 에이전트가 자율 수행한다. 인력·시간 부담이 큰 QC를 자동화해 대규모 현지화의 진입 장벽을 낮춘다.
특히 AI 번역·더빙 결과물을 생성하는 데 그치지 않고, 에이전트가 프로젝트 요구사항을 정리해 작업을 실행한 뒤 결과물을 스스로 평가·개선한다. 프로젝트별·고객사별로 축적된 용어, 스타일 가이드, 톤앤매너를 메모리로 활용해 일관된 품질을 유지하는 점이 특징이다.
아울러 감정 이해 기반의 품질 컨트롤을 통해 연기·감정·비언어 표현까지 평가함으로써 기준에 미달하는 구간을 재실행하는 반복 과정을 거쳐 품질을 끌어올린다는 설명이다.
허드슨에이아이 관계자는 "기존에는 1시간 분량의 드라마 콘텐츠 QC에만 2~3일 이상 소요되는 경우가 많았다"며 "에이전트가 검수·수정·재실행 루프를 선행해 오류와 품질 편차를 줄이고 사람은 최종 확인과 승인에 집중하도록 해 운영 부담을 낮출 수 있다"고 설명했다.
허드슨 스튜디오는 △음성 분리(배경음·대사 분리) △화자분리(발화자 구분) △STT(음성인식) △TTS(음성합성) △VC(음성변환) 등을 지원한다.
각 기능은 모듈 형태로 구성돼 목적에 따라 선택·조합할 수 있으며, 영상에서 대사를 분리해 자막을 생성하거나 원하는 목소리·감정으로 나레이션·더빙 음성을 합성해 영상에 적용하는 작업도 가능하다. 현재 80개 이상의 언어를 지원하고 있다.
신현진 허드슨에이아이 대표는 "대량 현지화를 운영하는 미디어 플랫폼은 AI 더빙을 도입한다고 하더라도 예산·품질·일정 문제의 상당 부분이 QC에서 병목으로 나타난다"고 진단했다.
독자들의 PICK!
이어 "에이전틱 로컬라이제이션은 프로젝트 기획부터 실행, QC까지 에이전트가 자율적으로 수행하고 감정 평가와 반복 개선을 통해 자동 품질을 끌어올려 운영 장벽을 낮출 수 있다"고 덧붙였다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']