[박정렬의 신의료인]
분당서울대병원 천명음 분류 AI 모델
정확도 91.1%, 정밀도 88.2% 기록해

소아 환자의 쌕쌕거리는 숨소리인 '천명음'을 통해 호흡기 질환 여부를 파악하는 인공지능(AI) 기술이 국내 연구진에 의해 제시됐다.
분당서울대병원 소아청소년과 김경훈 교수팀은 소아 환자의 천명음(wheezing)을 분류할 수 있는 트랜스포머(Transformer) 기반 인공지능(AI) 모델을 개발했다고 10일 밝혔다.
천명음은 기도가 좁아지거나 막혀 발생하는 고음의 '쌕쌕'거리는 호흡음이다. 주로 소아 천식이나 만성 폐쇄성 폐 질환(COPD) 등의 호흡기 질환에서 나타나 조기 진단 시 주요 지표로 사용된다.
현재 천명음에 대한 진단은 의료진이 환자의 가슴에 청진기를 대고 직접 호흡음을 듣는 방식에 의존하고 있다. 그러나 의료진의 숙련도와 경험에 따라 정확도가 달라지는 주관적인 방법이라 보다 객관적이고 정확한 진단의 필요성이 제기돼 왔다.

이에 김경훈 교수팀은 이전에 소리를 이미지처럼 변환해 분석하는 AI 기술인 '합성공 신경망(CNN)'에서 나아가 트랜스포머 기반의 '호흡음 분석 변환 모델(Audio Spectrogram Transformer, AST)' 개발에 나섰다. CNN은 주로 이미지 인식 분야에서 성능을 인정받고 있는 기술로, 소리를 특정 시간 단위로만 분리·분석하는 구조라 호흡 전체의 흐름이나 앞뒤 연결 관계를 파악하는 데에는 한계가 있었기 때문이다.
트랜스포머는 챗GPT 등 등 다양한 분야에서 쓰이고 있다. 구글이 자연어처리를 위해 발표한 언어모델로 음성인식, 이미지 처리, 나아가 복합적이고 추상적인 패턴 등의 처리에도 적용이 가능하다는 장점이 있다.
연구팀이 개발한 AST 모델은 소리를 주파수 형태의 이미지로 변환한 '멜 스펙트로그램'(Mel Spectrogram)을 작은 조각으로 나누고, 이들 간의 관계를 학습하는 방식으로 설계됐다. 즉, 전체적인 호흡 흐름에 대한 정보에 기반해 천명음의 패턴을 정밀하게 파악하는 방식으로, 이는 일부 정보만 분석하는 CNN과는 구조적인 차이점이 있다.

연구팀은 AI 모델을 검증하기 위해 천명음 194개와 기타 호흡음(심장 소리 포함) 531개 등 총 725개 호흡음 중 80%를 AST 모델에 학습시켰다. 그리고 천명음과 기타 호흡음 전체에 대한 객관적인 평가를 위해 소아 폐 전문의 2명이 각각 독립적으로 평가를 진행했다.
독자들의 PICK!
이후 AST와 CNN 모델을 활용해 나머지 20%의 호흡음에 대해 천명음을 구분해 내는 분류 성능을 비교했더니 AST 모델은 정확도 91.1%, 정밀도 88.2%의 우수한 성능을 보였다. AI 모델의 성능 평가 지표인 'F1-Score' 역시 82.2%로 나타나 CNN보다 분류 성능이 우수하다는 사실이 확인됐다.
AST 모델은 CNN보다 정밀한 분류가 가능하고, 전처리 과정에서의 데이터 손실이 적고 모델 자체가 경량화돼 모바일 기기에서도 구동할 수 있다. 향후 임상 현장에서 스마트기기를 활용한 빠르고 정밀한 진단에도 큰 도움이 될 것으로 전망된다.
김경훈 교수는 "소아는 성인보다 폐포(허파꽈리)의 표면적이 작아 호흡기 질환에 더 취약한 만큼 천명음을 정확히 구분하는 게 조기진단에 매우 중요하다"며 "이번 결과를 통해 AI 기반 AST 모델의 소아 호흡은 분석 기술의 임상 적용 가능성을 입증했다"고 밝혔다. 이어 "스마트기기에 적용해 실시간 진단에 활용하고, 의료 접근성이 낮은 지역에서도 정확한 천명음 진단이 가능할 수 있도록 후속 연구·개발을 추진할 계획"이라고 덧붙였다.
이번 연구 결과는 국제학술지 '사이언티픽 리포트'(Scientific Reports) 최신 호에 실렸다.