수천·수만 개의 GPU를 확보했다고 끝이 아니다. 이를 연결하는 네트워크, 막대한 전력을 처리하는 설비, 발열을 잡는 냉각 시스템, 보안·관제 체계가 받쳐주지 않으면 AI팩토리는 돌아갈 수 없다.
25일 블룸버그통신에 따르면 메타는 최근 데이터센터 개발·운영업체 크루소와 AI 컴퓨팅 용량 확보 계약을 맺었다. 메타는 미국 텍사스주 차일드리스와 미주리주 워렌턴에 있는 크루소 데이터센터 2곳에서 약 1.6GW 규모의 컴퓨팅 용량을 구매하기로 했다. 실제 AI 연산을 돌릴 수 있는 데이터센터 용량을 선점하는 방식이다. AI 투자의 무게중심이 GPU 확보에서 전력·부지·냉각·운영 역량을 갖춘 인프라 확보로 넓어졌다는 의미다.
국내에서도 변화가 감지된다. 젠슨 황 엔비디아 최고경영자(CEO)는 최근 방한 중 네이버NAVER), SK텔레콤 등과 AI팩토리 구축 협력을 논의했다. SK텔레콤은 엔비디아와 2027년 첫 가동을 목표로 기가와트(GW)급 AI팩토리를 구축한 후 아시아 전역으로 인프라를 넓힌다는 계획을 밝혔다. 네이버는 2027년 55MW 규모로 첫 가동을 시작해 2028년 누적 200MW까지 확장하는 AI팩토리 구축을 추진한다.
기존 데이터센터가 데이터를 저장·처리하는 시설이었다면, AI팩토리는 데이터를 투입해 토큰과 AI 서비스를 생산하는 공장에 가깝다. GPU와 서버가 '두뇌'라면 네트워크와 전력, 냉각, 보안은 이를 작동시키는 '혈관'과 '신경망'이다.
가장 먼저 부각되는 영역은 네트워크다. 대규모 AI 학습과 추론은 GPU 사이 데이터 이동이 중요하다. 서버·GPU가 많아질수록 스위치, 라우터, 광통신 장비, 고속 인터커넥트 수요가 커진다.
전력 인프라도 중요하다. AI 데이터센터는 랙당 전력 밀도가 높다. 변압기와 배전반, 전력기기, 케이블, 무정전전원장치(UPS) 등 전력망이 필요하다. AI 데이터센터 건설이 늘수록 전력 계통과 에너지 확보가 중요해진다.
냉각 시스템도 필수. 엔비디아 H100·H200 기준 GPU 1개당 소비 전력은 700W를 넘고, GB200 NVL72 랙은 랙 전체 소비 전력이 120~130kW에 달한다. 기존 공랭식 냉각이 감당하기 어렵다. 액체냉각, 칠러, 공조 설비 등 열 관리 기술이 중요한 축으로 떠오른다.
보안·관제 수요도 커진다. AI 데이터센터는 대규모 연산 자원과 데이터를 동시에 처리한다. 제로트러스트, 통합관제, 로그분석, 양자내성암호(PQC) 같은 보안 체계가 필요하다. 장애나 보안 사고가 발생하면 AI 서비스 전체가 멈출 수 있다.
글로벌 기업 중 네트워크 분야에선 시스코, 아리스타네트웍스, 브로드컴 등이 주목받는다. 전력·냉각 분야에서는 슈나이더일렉트릭, 이튼, ABB, 버티브 등이 대표적이다. 국내에서는 네이버클라우드와 SK텔레콤이 앞서 나가고 KT, LG유플러스, 삼성SDS, LG CNS 등도 관련 사업을 확장중이다.
업계 관계자는 "AI팩토리는 GPU만으로 완성되는 것이 아니라 데이터센터 전체를 AI 워크로드에 맞게 다시 설계하는 일"이라며 "전력, 냉각, 네트워크, 보안이 함께 맞물려야 한다"고 했다.