스스로 해킹, 통제 뚫는 AI '미토스 공포'

스스로 해킹, 통제 뚫는 AI '미토스 공포'

김소연 기자
2026.04.15 04:15

SW 취약점 찾아내 공격… 앤트로픽 "제한적 제공"
美 사이버국장, 은행·기업 등 소집 보안강화 논의… 보안 패러다임, 공격방어→사전차단 전환

앤드로픽의 차세대 AI 미토스(Mythos) 개요/그래픽=이지혜
앤드로픽의 차세대 AI 미토스(Mythos) 개요/그래픽=이지혜

"너무 위험해서 공개가 어렵다."

앤트로픽의 새로운 차세대 AI(인공지능) '미토스'(Mythos)가 전세계를 충격에 빠뜨렸다. 뛰어난 성능보다 화제가 된 것은 소프트웨어의 취약점을 찾아내 공격할 수 있다는 점이다. AGI(범용인공지능) 시대, AI 발전에 따른 보안위협이 현실화했다는 지적이 나온다.

14일 월스트리트저널(WSJ) 등 외신에 따르면 션 케언크로스 백악관 국가사이버국장은 주요 은행 수장들과 관계부처, 민간기업까지 한 자리에 모아 국가 핵심 인프라의 보안 취약성을 파악하고 AI의 사이버 공격을 막을 보안강화 작업에 돌입했다. 우리 정부도 민·관·군 주관 부처에 긴급 대응을 주문했다. 과학기술정보통신부는 이날 통신 3사 및 주요 플랫폼사 개인정보보호 최고책임자, 국내 AI 보안전문가와 긴급 점검회의를 개최했다.

앤트로픽이 지난 7일 선보인 최상위 AI모델 '미토스'가 소프트웨어의 취약점을 찾아내 해킹에 성공하며 스스로 격리환경에서 탈출하는 등 통제불능의 모습을 보인 데 따른 것이다.

미토스는 성능 측면에서도 인간을 뛰어넘었다. AI 최상위 모델 성능평가에 쓰는 박사급 난도의 문제를 모은 '인류의 마지막 시험'(HLE) 벤치마크에서 정답률 56.8%를 기록, 현존하는 모델 중 가장 뛰어난 기록을 보유했다.

앤트로픽조차 미토스가 악용될 위험을 우려해 일부 핵심 인프라에만 제한적으로 제공한다는 방침을 밝혔다. 일각에서는 이를 고도의 노이즈 마케팅으로 해석했으나 AI가 고도화할수록 사이버 위협이 커진다는 사실은 부인할 수 없다. 앤서니 그리에코 앤트로픽 수석부사장 겸 CSTO(최고보안책임자)는 최근 공식 블로그에 "AI 역량이 임계점을 넘어 핵심 인프라 보호의 시급성이 근본적으로 달라졌고 이제는 되돌릴 수 없는 단계에 들어섰다"는 글을 올렸다.

국내 보안업계 전문가들은 아직 미토스 AI의 면면이 공개되지 않은 만큼 신중을 기하면서도 AI로부터 보안위협에 철저히 대비해야 한다고 입을 모았다.

최운호 서강대학교 교수는 "기존에는 보안이 사이버 공격을 어떻게 막을까였다면 이제는 우리 시스템 안에 누가 존재하게 할 것인가로 정책의 본질이 바뀌어야 한다"면서 "국가정책은 전체 보안플랫폼을 설계하고 지휘할 초고급 아키텍트 양성에 집중해야 하고 인증되지 않은 존재는 아예 시스템 내에서 동작조차 어렵게 하는 '사전 차단형' 설계가 유일한 해법"이라고 말했다. 아울러 이번 미토스 쇼크를 계기로 AI 사이버전쟁의 사령관에 '최고 AI CISO(정보보호책임자)'를 앉히는 논의가 본격화할 것이라고 봤다.

아직은 지켜봐야 한다는 시각도 있다. 김승주 고려대학교 정보보호대학원 교수는 "미토스의 성능발표는 앤트로픽이 셀프로 한 것이기 때문에 지켜봐야 한다"면서도 "AI기술이 발전하면 공격기술도 고도화하는 만큼 위험에 대비해야 하고 우리 정부도 노력 중"이라고 말했다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>

김소연 기자

증권부 김소연입니다.

공유