'가상 병원'서 AI 실전검증…서울대병원·하버드의대, 시뮬레이션 모델 개발

홍효진 기자
2026.04.14 15:40

의료 AI 동적 평가 '임상 환경 시뮬레이터' 공개
실제 임상 현장의 파급 효과 반영
환자 예후·병원 운영 효율성 평가

임상 환경 시뮬레이터(CES) 작동 패러다임. /사진제공=서울대병원

실제 임상 현장과 동일한 '가상 병원'에서 인공지능(AI)을 실전 검증하는 모델이 공개됐다. 실제 위험 없이 AI의 안전성을 평가하는 일종의 전임상 체계다.

김성은 서울대병원 특화연구소 연구교수와 하버드 의과대학 공동 연구진은 거대언어모델(LLM) 기반 의료 AI를 동적으로 평가하는 '임상 환경 시뮬레이터(CES)'를 공개했다고 14일 밝혔다. 이 디지털 가상 병원 평가 체계 연구는 국제 학술지 네이처 메디슨(Nature Medicine, IF 50) 최신 온라인판에 게재됐다.

정적인 데이터에 의존해 온 기존 의료 AI 평가는 현장에서 의사의 결정이 미치는 연쇄적 파급 효과를 반영하지 못했다. 환자 상태는 실시간으로 변하고 처방은 곧 병원의 제한된 자원 소모로 직결되나 기존 방식으론 이 같은 시간적·시스템적 상호의존성을 평가할 수 없었다.

이에 연구진은 조종사가 비행 시뮬레이터에서 훈련받듯 의료 AI도 시간 흐름과 자원 제약 속에서 대처 능력을 평가받아야 한다고 연구 목적을 세웠다. 이를 구현하기 위해 연구진은 두 가지 핵심 엔진을 동기화했다. 먼저 '환자 엔진'은 전문의가 정의한 질병 궤적 템플릿과 실제 전자의무기록의 환자 초기 데이터를 바탕으로, LLM이 증상과 치료 반응의 다양한 가상 경로를 동적으로 생성해 환자의 상태 변화를 모사한다.

이와 맞물린 '병원 엔진'은 실제 병원의 시간 데이터를 바탕으로 현장의 단계별 업무 흐름을 그대로 재현해 병상·의료진·장비 상태를 실시간 추적한다. 혈액 검사 지시가 내려지면 실제 소요 시간에 맞춰 단계별로 필요한 의료 인력이 순차적으로 배정되고, 초응급 환자에게 자원을 우선 할당하는 우선순위 체계까지 완벽하게 구현됐다고 연구진은 전했다.

시간에 따른 동적 환자 상태 변화. 의료 AI의 개입 시점에 따라 중증 환자의 예후가 세 가지 경로(초록색: 안정화, 파란색 및 주황색: 상태 악화)로 갈라지는 파급 효과 시뮬레이션. /사진제공=서울대병원

이 가상 병원에선 AI의 개입 시점에 따라 위기 상황이 생생하게 구현된다. 가령 AI가 검사 처방을 지연시킬 경우 안정적이던 흉통 환자가 급성 심근경색으로 악화할 수 있다. 또 AI가 특정 초응급 환자에게 컴퓨터 단층촬영(CT) 스캐너 등 핵심 자원을 우선 할당하면 다른 환자 대기열이 길어지는 현실적 병목 현상도 발생한다.

AI가 내린 모든 결정은 환자 예후(생존 여부, 치료 소요 시간, 가이드라인 준수도)와 병원 운영 효율성(총 입원 기간, 응급실 처리량, 병상 및 장비 활용도)의 두 축을 합친 '이중 지표 복합 점수'로 평가된다. 병원 시스템을 훼손하지 않으면서 치료를 개선하면 보상이 주어지지만, 특정 환자에게만 자원을 과도하게 집중할 경우 다른 환자의 진료 기회가 희생돼 벌점이 부여되는 엄격한 균형을 요구한다. 아울러 전산망 마비나 다발성 응급 환자 발생 등 극한 상황의 적대적 스트레스 테스트도 진행한다.

이번 연구의 의의는 환자를 위험에 노출시키지 않고 시스템 안전성을 입증하는 '무위험 전임상 테스트 환경'을 제공했단 점에 있다. 연구진은 "철저한 검증을 거친 AI가 의료진의 디지털 대리인으로 복잡한 시스템 실무를 전담하면 의사는 본연의 역할에 온전히 집중할 수 있을 것으로 기대한다"고 전했다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>