의료 인공지능(AI) 혁신을 위해 데이터 '연합학습'을 법제화해야 한다는 전문가 제언이 나왔다. 원본 데이터 이동과 공유 없이도 공동 AI 모델을 개발할 수 있는 연합학습을 통해 의료 정보 활용의 안전성과 효율성을 높일 수 있단 주장이다.
김화종 한국제약바이오협회 K-멜로디(MELLODDY) 사업단장은 27일 서울 여의도 국회에서 열린 '안전한 의료 데이터 활용 기반 구축·혁신을 위한 정책 토론회'에서 "연합학습은 의료 데이터를 병원·기업·연구소 외부로 이동하지 않고도 AI 모델 파라미터(AI가 입력 데이터 분석을 위해 쓰는 내부 숫자 값)만 모아 공동 AI 개발이 가능하다"며 "데이터를 연결·협력·활용할 기술적 방법이 부재한 상황에서 가장 현실적·효율적인 방안"이라고 강조했다.
텍스트나 영상과 달리 바이오 헬스 분야는 학습·검증 데이터가 매우 부족하다. 정밀 의료를 구현할 핵심인 '데이터 연결'이나 기관 간 협력 자체가 어려워서다. 반면 해외에선 연합학습 구조 중심의 데이터 협력이 활발하다. 연합학습은 원본 데이터의 외부 이동이 없어 정보 유출 위험을 구조적으로 방지한다. 외부 공유 없이 공동 AI 모델 개발이 가능해 기관별 데이터 주권도 보장할 수 있단 점이 특징이다.
실제 빅파마(대형 제약사) 10곳이 참여한 유럽의 AI 신약 개발 프로젝트 '멜로디' 사업단은 실험 데이터의 직접적 공유 없이도 공동 AI 개발이 가능하단 점을 입증한 바 있다. 우리나라는 이를 벤치마킹한 'K-멜로디' 사업을 진행 중이다. 연합학습 기반 구독형 약동학·독성 예측 모델 개발이 목표다. 김 단장은 "법적으로 연합학습 모델 파라미터의 법적 지위를 명확히 하고 공공 데이터의 연합학습 활용 근거를 마련해야 한다"며 "전체적 틀을 주도할 중립 운영기관 신설과 데이터 제공 기관에 대한 보상책 방안도 필요하다"고 말했다.
진단·신약 개발 및 첨단재생의료, 맞춤형 건강관리 등을 포괄할 통합적 법안이 필요하단 목소리도 나왔다. 김재선 동국대 법학과 교수는 "유럽은 지난해 '유럽건강데이터공간규정'(EHDS)를 시행해 연구 데이터를 2차 활용할 수 있도록 법제화했다"며 "그러나 국내는 (데이터 활용)영역을 각각 별도법으로 규정하고 있어 이를 통합적으로 관리하는 법안이 없다"고 짚었다.
김 교수는 "국내 의료 데이터는 동의와 비식별 요건을 갖춘 뒤 기관생명윤리위원회(IRB)·기관보건의료정보심의위원회(DRB)를 거쳐 연구 목적으로 쓰이거나 공공 데이터 센터(바이오 뱅크)를 통해 활용된다"며 "의료기관 입장에선 데이터 제공 기관의 의무와 책임이 부과돼 부담이 크고, 환자들도 정보 활용 범위에 대한 신뢰가 다소 부족하다"고도 지적했다.
의료기관 간 데이터 관리체계의 불균형 구조도 언급됐다. 이동훈 전남대병원 AI상용화지원센터 부센터장은 "지방 국립대병원은데이터 기획·보안·품질관리 및 AI 개발과 실증을 맡을 전담 인력 확보조차 어렵다"며 "고성능 연산자원은 임대 또는 클라우드를 이용하지만 국립대병원은 클라우드 사용도 금지돼 있다"고 말했다. 글로벌 클라우드 서비스는 보안인증 '상' 등급을 충족하지 못해 국립대 등 공공병원 내 사용이 금지돼 있다.
최경일 보건복지부 의료정보정책과장은 "디지털 헬스케어 시장의 법적 안전망이 미비하단 지적이 많다"며 "하반기 중 의료데이터 활성화를 위한 입법화를 목표로 국회와 긴밀히 협력하겠다. 국립대병원 클라우드 제한에 대해서도 추가적인 내용을 확인해보겠다"고 말했다.