"인공지능(AI)이 신약 개발 속도를 높인다는 것은 이제 상식이지만 진짜 중요한 질문은 '그 AI가 무엇을 학습하고 있는가'입니다. 기존의 공개된 데이터만으로는 다음 세대의 혁신 신약을 만들 수 없습니다."
유제관 오믹인사이트 대표는 12일 머니투데이와의 인터뷰에서 'AI가 바이오산업에 어떤 영향을 주느냐'는 질문에 이같이 답했다. 오믹인사이트는 미국 실리콘밸리에 위치한 바이오테크 기업이다. 고해상도 공간 전사체 분석 플랫폼으로 유명하다.
유 대표는 신약 개발 AI의 핵심을 "생물학 데이터 레이어(Biology Data Layer)의 혁신"이라고 밝혔다. 현재 글로벌 시장에서 벌어지는 수천억 원 규모의 AI 스타트업 인수전은 결국 '누가 더 정밀한 생물학적 기초 데이터를 쥐고 있는가'의 싸움이라는 진단이다.
유 대표는 "베세머 벤처 파트너스(Bessemer Venture Partners)의 보고서에 따르면 2019년부터 2023년까지 미국 식품의약국(FDA)이 승인한 표적 단백질 기반 항암제 100%가 'PDB(Protein Data Bank)'라는 단백질 구조 공개 데이터베이스를 활용했다"며 "PDB에 등록된 20만 개의 구조는 신약 개발의 보물창고였지만 동시에 치명적인 약점도 있다"고 밝혔다.
이와 관련해 해당 데이터는 결정화(Crystallization)가 잘 되는 특정 단백질 위주로 데이터가 심하게 편향돼 있다는 것으로, 인체의 수많은 단백질 중 우리가 모르는 영역이 훨씬 더 많다는 설명이다.
유 대표는 그러면서 새로운 데이터를 만드는 능력이 AI 신약 개발의 핵심이 되고 있다고 강조했다. 그는 "이제 AI 신약 개발은 기존 데이터를 더 잘 분석하는 단계를 넘어, 아무도 가지지 못한 '새로운 데이터'를 스스로 만드는 쪽으로 완전히 이동하고 있다"고 말했다.
오믹인사이트의 데이터 창출 능력은 글로벌 빅파마의 주목을 받고 있다. 오믹인사이트의 무염색 자가형광(Label-free Autofluorescence) 이미징 기술이 촬영 도구를 넘어 '데이터 생산 엔진'으로 기능하고 있어서다.
유 대표는 "우리는 조직을 염색하거나 파괴하지 않고도 살아있는 생물학적 상태 그대로를 고해상도 데이터로 치환한다. 기존의 편향된 공공 데이터에 의존하는 것이 아니라, 특정 질병과 환자군에 특화된 '순수 데이터'를 우리가 직접 만들어내는 것"이라며 "AI 에이전트가 이 정밀한 데이터를 학습할 때, 비로소 임상 성공 확률은 획기적으로 올라간다"고 말했다.
유 대표는 '데이터 자산'의 가치를 중심으로 글로벌 거대 자본이 움직이고 있다는 점도 강조했다. AI 모델을 잘 만드는 회사가 아니라, 독보적인 데이터 레이어와 이를 통해 의사결정을 내릴 수 있는 역량을 가진 기업에 천문학적인 투자 금액이 몰리고 있다는 설명이다.
GSK는 종양학 AI 스타트업 노에틱에 5000만 달러를 투자했고, 일라이릴리도 항체 설계 AI 스타트업 차이디스커버리와 수천만달러 규모의 사용료 계약을 맺었다. 구글 딥마인드의 자회사 아이소모픽 랩스(Isomorphic Labs)는 일라이릴리, 노바티스, J&J와 누적 30억 달러 규모 파트너십을 맺으며 자체 항암제 후보물질의 첫 사람 대상 임상 진입을 추진하고 있다. 또 지난달 앤스로픽이 제품도 매출도 없는 8개월 된 스타트업 코이피션트 바이오(Coefficient Bio)를 4억 달러에 인수했다.
유 대표는 "글로벌 빅테크들이 신약개발에 뛰어드는 이유는 그들이 AI 모델을 잘 만들기 때문이 아니라, AI가 내리는 의사결정의 가치가 그만큼 커졌기 때문"이라며 "5년 뒤 임상 계획서를 짜는 자리에는 AI가 함께 앉아 있을 것이지만, AI 파운데이션 모델은 이제 어디서나 구할 수 있는 범용서비스가 돼가고 있고, 5년 후에는 그 AI에게 가장 정확한 판단 근거를 제공할 수 있는 '생물학 데이터 자산'을 가진 회사만이 살아남을 것"이라고 했다.
이어 "고품질 바이오 데이터를 생성하는 기술과 데이터 파이프라인은 쉽게 복제될 수 없기 때문"이라며 "오믹인사이트가 지금 글로벌 빅파마와 진행 중인 기술 검증은 바로 그 데이터 주권을 증명하는 과정"이라고 덧붙였다.