AI 기업 앤트로픽이 기업공개(IPO)를 앞두고 최상위급 AI 모델을 일반에 공개했다. 사이버보안 등 악용 가능성이 큰 영역에는 별도 안전장치를 적용해 위험 질의에는 더 제한적인 하위 모델이 응답하도록 했다.
9일(현지시간) 로이터 등 외신에 따르면 앤트로픽은 새 AI 모델 '클로드 페이블5'와 '클로드 미토스5'를 출시한다고 밝혔다. 두 모델은 같은 기반 기술을 쓰지만 공개 범위와 안전장치 적용 수준이 다르다.
페이블5는 일반 이용자를 대상으로 공개되는 모델이다. 앤트로픽이 앞서 제한적으로 운영해온 '미토스'급 모델의 성능을 기반으로 하되, 사이버보안·생물학·화학 등 악용 우려가 큰 영역에는 안전장치를 적용했다. 예컨대 악성 해킹에 활용될 수 있는 취약점 탐색이나 생화학 무기 관련 질의가 들어오면 페이블5가 직접 답하지 않고 기존 모델인 '클로드 오퍼스4.8'이 대신 응답하도록 설계됐다. 경쟁 모델의 기능을 무단으로 추출하는 '증류' 의심 질의에도 같은 방식이 적용된다.
앤트로픽은 안전장치를 보수적으로 적용한 만큼 일부 무해한 요청도 차단될 수 있다고 설명했다. 다만 회사 측은 이 같은 안전장치가 평균적으로 전체 세션의 5% 미만에서만 작동한다고 밝혔다. 또 사용자가 안전장치를 우회하는 이른바 '탈옥' 시도를 막기 위해 광범위한 테스트를 진행했다고 덧붙였다.
미토스5는 페이블5와 같은 기반 모델이지만 일부 영역에서 안전장치가 해제된 버전이다. 앤트로픽은 미토스5를 우선 미국 정부와 협력하는 사이버보안 협의체 '프로젝트 글래스윙' 참여 기관에 제한적으로 제공한다. 프로젝트 글래스윙은 핵심 소프트웨어와 기반시설의 보안 취약점을 AI로 탐지·보완하기 위한 협력 프로그램이다. 한국에서는 한국인터넷진흥원(KISA)이 참여하고, 삼성전자와 SK하이닉스, SK텔레콤 등도 참여한 것으로 알려졌다.
앤트로픽은 페이블5와 미토스5가 기존 미토스 미리보기 모델보다 문서 기반 추론, 차트·표 해석, 문제 해결 능력 등에서 향상된 성능을 보였다고 설명했다. 특히 소프트웨어 개발과 데이터 분석 등 기업 업무 영역에서 활용성이 크다는 점을 강조했다.
이번 모델 공개는 앤트로픽의 IPO 추진과 맞물려 주목된다. 앤트로픽은 최근 650억달러 규모의 투자 유치를 통해 기업가치 9650억달러를 인정받은 것으로 전해졌다. 페이블5와 미토스5의 이용료는 입력 토큰 100만개당 10달러, 출력 토큰 100만개당 50달러로 책정됐다. 이는 기존 오퍼스 계열 모델보다 높은 수준이다.
다이앤 펜 앤트로픽 연구·제품관리 책임자는 로이터에 "가치 있는 방식으로 기술을 제공하는 동시에 해악보다 더 많은 이익을 낼 수 있도록 안전장치를 마련하는 것이 중요하다"고 말했다.