앤트로픽, IPO 앞두고 '미토스급' AI모델 '페이블5' 공개…위험질의는 하위 모델 우회

[뉴욕=AP/뉴시스]뉴욕의 한 컴퓨터 화면에 2월26일 앤트로픽의 웹사이트와 회사 로고가 표시돼 있다. 백악관이 정부 기관들이 앤트로픽의 공급망 위험 지정을 해결하고 역대 가장 강력한 미토스를 포함한 새로운 모델을 탑재할 수 있도록 하는 지침을 개발하고 있다고 액시오스가 정통한 소식통들의 말을 인용해 28일(현지시각) 보도했다. 2026.04.29. /사진=유세진

AI 기업 앤트로픽이 기업공개(IPO)를 앞두고 최상위급 AI 모델을 일반에 공개했다. 사이버보안 등 악용 가능성이 큰 영역에는 별도 안전장치를 적용해 위험 질의에는 더 제한적인 하위 모델이 응답하도록 했다.

9일(현지시간) 로이터 등 외신에 따르면 앤트로픽은 새 AI 모델 '클로드 페이블5'와 '클로드 미토스5'를 출시한다고 밝혔다. 두 모델은 같은 기반 기술을 쓰지만 공개 범위와 안전장치 적용 수준이 다르다.

페이블5는 일반 이용자를 대상으로 공개되는 모델이다. 앤트로픽이 앞서 제한적으로 운영해온 '미토스'급 모델의 성능을 기반으로 하되, 사이버보안·생물학·화학 등 악용 우려가 큰 영역에는 안전장치를 적용했다. 예컨대 악성 해킹에 활용될 수 있는 취약점 탐색이나 생화학 무기 관련 질의가 들어오면 페이블5가 직접 답하지 않고 기존 모델인 '클로드 오퍼스4.8'이 대신 응답하도록 설계됐다. 경쟁 모델의 기능을 무단으로 추출하는 '증류' 의심 질의에도 같은 방식이 적용된다.

앤트로픽은 안전장치를 보수적으로 적용한 만큼 일부 무해한 요청도 차단될 수 있다고 설명했다. 다만 회사 측은 이 같은 안전장치가 평균적으로 전체 세션의 5% 미만에서만 작동한다고 밝혔다. 또 사용자가 안전장치를 우회하는 이른바 '탈옥' 시도를 막기 위해 광범위한 테스트를 진행했다고 덧붙였다.

미토스5는 페이블5와 같은 기반 모델이지만 일부 영역에서 안전장치가 해제된 버전이다. 앤트로픽은 미토스5를 우선 미국 정부와 협력하는 사이버보안 협의체 '프로젝트 글래스윙' 참여 기관에 제한적으로 제공한다. 프로젝트 글래스윙은 핵심 소프트웨어와 기반시설의 보안 취약점을 AI로 탐지·보완하기 위한 협력 프로그램이다. 한국에서는 한국인터넷진흥원(KISA)이 참여하고, 삼성전자와 SK하이닉스, SK텔레콤 등도 참여한 것으로 알려졌다.

앤트로픽은 페이블5와 미토스5가 기존 미토스 미리보기 모델보다 문서 기반 추론, 차트·표 해석, 문제 해결 능력 등에서 향상된 성능을 보였다고 설명했다. 특히 소프트웨어 개발과 데이터 분석 등 기업 업무 영역에서 활용성이 크다는 점을 강조했다.

이번 모델 공개는 앤트로픽의 IPO 추진과 맞물려 주목된다. 앤트로픽은 최근 650억달러 규모의 투자 유치를 통해 기업가치 9650억달러를 인정받은 것으로 전해졌다. 페이블5와 미토스5의 이용료는 입력 토큰 100만개당 10달러, 출력 토큰 100만개당 50달러로 책정됐다. 이는 기존 오퍼스 계열 모델보다 높은 수준이다.

다이앤 펜 앤트로픽 연구·제품관리 책임자는 로이터에 "가치 있는 방식으로 기술을 제공하는 동시에 해악보다 더 많은 이익을 낼 수 있도록 안전장치를 마련하는 것이 중요하다"고 말했다.

머니투데이

앤트로픽, IPO 앞두고 '미토스급' AI모델 '페이블5' 공개…위험질의는 하위 모델 우회

독자들의 PICK!

동성 성매매 정황까지...'잠자리 거부' 남친의 추잡한 비밀

'정경호·수영 결별' 예측한 무속인…과거 궁합 보며 한 말

"모텔 갔지?" 40년간 외도 의심…남편 급소에 끓는 물 부은 아내

'아기방 홈캠' 몰래 본 시모..."싸우고 스킨십도 했는데" 소름

태진아, '치매 투병' 옥경이 웨딩드레스 입은 결혼사진 공개