아마존닷컴은 2일(현지시간) 자체 개발한 최신 AI(인공지능) 칩인 트레이니엄 3가 자사 클라우드 서비스를 통해 고객들에게 제공되기 시작했다고 발표했다. 이는 구글이 자체 개발한 AI 칩인 TPU(텐서 처리장치)로 주목받고 있는 가운데 AI 칩 선도기업인 엔비디아의 지배력에 위협이 될 수 있는 움직임이다.
배런스 등에 따르면 아마존은 이날 미국 라스베이거스에서 개최하고 있는 '아마존 웹 서비스(AWS) 리: 인벤트(re :Invent)' 행사에서 자체 개발한 트레이니엄 3 칩 최대 144개로 구동되는 울트라서버가 고객들이 사용할 수 있도록 제공되기 시작했다고 밝혔다.
아마존은 성명에서 "트레이니엄 3 울트라서버는 모든 규모의 조직이 더 큰 AI 모델을 더 빠르게 훈련할 수 있도록 하고 더 많은 사용자들을 더 저렴한 비용으로 지원한다"며 "미래의 야심 찬 AI 프로젝트에 필요한 컴퓨팅 파워에 대한 접근을 민주화한 것"이라고 설명했다.
아마존은 엔비디아의 고가 장비에 과도하게 의존하지 않도록 전략적으로 자체 칩 개발을 추진해왔다. 구글이 TPU로 AI 프로세서 시장에서 입지를 넓히는 상황에서 트레이니엄 3가 얼마나 많은 외부 고객을 확보할지 주목된다.
JP모간의 애널리스트인 더그 앤머스는 트레이니엄 3 공개 전에 발표한 보고서에서 "트레이니엄은 현재 제한된 대형 AWS 고객만 사용하고 있지만 우리는 AWS가 (트레이니엄에 대한) 접근성을 더 넓은 고객층으로 확대할 것으로 기대한다"고 밝혔다.
트레이니엄 3에 대한 중요한 평가 잣대 중 하나는 아마존이 투자한 AI 스타트업인 앤트로픽의 반응이 될 것으로 보인다. 앤트로픽은 지난 10월에 구글의 TPU 칩을 최대 100만개 사용하기로 결정해 아마존과 엔비디아를 넘어 칩 공급처를 다양화했다.
아마존은 2021년에 오픈AI 출신 엔지니어들이 설립한 앤트로픽에 최대 80억달러를 투자하기로 약정을 맺었다. 블룸버그에 따르면 구글은 앤트로픽에 약 30억달러를 투자한 것으로 알려졌다.
앤트로픽은 아마존이 여전히 자사의 "주요 (AI 모델) 훈련 파트너이자 클라우드 제공업체"라는 입장이다. 앤트로픽은 올해 말까지 거의 50만개의 트레이니엄 프로세서로 구성된 '프로젝트 레이니어' 슈퍼컴퓨터를 포함해 100만개 이상의 트레이니엄 2 칩을 사용할 것으로 예상하고 있다고 밝혔다.
JP모간의 앤머스는 "프로젝트 레이니어는 앤트로픽 전용으로 구축됐지만 충분한 전력을 확보할 수만 있다면 AWS는 트레이니엄 3를 기반으로 다른 대형 고객을 위해서도 유사한 규모의 아키텍처를 복제할 수 있을 것"이라고 예상했다. 아마존은 수천 대의 울트라서버를 연결해 최대 100만개의 트레이니엄 칩으로 구성된 클러스터를 만들 수 있다는 입장이다.
아마존은 트레이니엄 3 서버를 엔비디아 및 구글 칩 기반의 하드웨어와 직접 비교한 벤치마크 결과나 전력 요구사항은 공개하지 않았다. 트레이니엄 3 칩은 144기가바이트(GB)의 고대역폭 메모리(HBM)를 통합했다. 구글의 최신 아이언우드 TPU는 192GB, 엔비디아의 최신 블랙웰 GB300은 최대 288GB의 HBM을 통합했다.
트레이니엄 3 칩은 TSMC에서 생산된다. 아마존과 칩을 공동 설계해온 기업은 마블 테크놀로지인데 마블은 아마존의 칩 설계 기업으로서의 역할을 잃을 수도 있다는 우려로 주가가 압박을 받아왔다.
한편, 아마존은 이미 트레이니엄 4 개발에 착수했다고 밝혔다.
이날 아마존 주가는 0.2% 올랐고 엔비디아 주가는 0.9% 상승했다.