
그동안 장애 음성은 발화 왜곡과 음운 변동이 잦은 한국어 특성으로 인해 AI(인공지능) 인식 정확도가 낮아 의료 진단이나 언어 재활 시스템에 적용하는 데 한계가 있었다. 브레인데크(대표 정여름)는 이 같은 한계를 개선하고자 장애 음성 특성을 반영한 학습 구조와 인식 알고리즘을 고도화해 왔다. 그 결과 최근 한국인정기구(KOLAS) 공인시험에서 장애 음성 인식 정확도 92% 이상(CER 7.94)을 달성했다.
정여름 브레인데크 대표는 "기존 장애 음성 인식률이 50~75% 수준에 머물렀던 점을 감안하면 이번 공인시험 결과는 의료 현장과 다양한 서비스 환경에서 보다 안정적인 소통이 가능해졌다는 점에서 의미가 크다"라며 "단순 정확도 개선을 넘어 감정과 맥락을 함께 이해하는 대화형 AI로 나아가는 전환점"이라고 말했다.
브레인데크는 인식 정확도 향상을 감성 인식 기술로 확장했다. 기존 대화형 AI가 음성 톤이나 표정 등 단일 신호에 의존해 감정을 분류하면서 발생하던 오류를 개선하기 위해 불확실성과 모달리티 간 충돌을 분리·계량화하는 방식을 도입했다. 음성, 표정, 생체 신호가 서로 다른 신호를 보일 경우에도 AI가 이를 인지하고 판단 신뢰도를 조정하는 구조다.
정 대표는 "이 기술은 단순 감정 인식을 넘어 감성지능형(Affective) AI의 신뢰도를 표준화한다"며 "AI는 사용자와의 대화를 단순 응답이 아닌 맥락과 정서를 함께 이해하는 상호작용으로 인식한다"고 말했다. 이어 "해당 기술을 초지연 음성합성 기술 '루시5'와 결합해 로봇 산업으로 확장할 계획"이라며 "미래 로봇 산업에서 요구되는 멀티센싱 인터페이스를 제공할 계획"이라고 덧붙였다.
루시5는 초지연 환경에서도 자연스러운 음성 합성이 가능한 AI 엔진이다. 감정 인식 기술과 연계할 경우 의료·돌봄·서비스 로봇 등에서 사람의 감정과 의도를 실시간 반영하는 인터페이스 구현이 가능할 전망이라고 업체 측은 말했다.
브레인데크는 현재 정보통신산업진흥원(NIPA)의 'AI 기반 의료시스템 디지털 전환 지원사업'으로 전북대학교병원·양산부산대학교병원·충남대학교병원과 함께 대규모 언어재활 실증을 진행 중이다. 회사는 향후 장애 음성을 포함한 다양한 사용자 환경에서 신뢰성 높은 대화형 AI를 제공하며 의료와 로봇 산업 전반으로 적용 범위를 확대할 계획이다.