"안전한 AI 사용" LG유플, 프롬프트만으로 공격하는 모의해킹 참가

이찬종 기자

2026.02.19 09:02

LG유플러스(14,000원 ▼200 -1.41%)가 대화와 프롬프트만으로 생성형 AI를 공격하는 '레드팀 챌린지'에 참여해 글로벌 무대에서 안전성과 신뢰성을 검증한다.

LG유플러스는 MWC26에서 진행되는 '글로벌 AI 레드팀 챌린지'에 참여한다고 19일 밝혔다. 글로벌 AI 레드팀 챌린지는 GSMA(세계이동통신사업자연합회)가 주관하는 AI 검증 프로그램이다. MWC가 공동 개최하는 개발자·디지털 인재 행사 '탤런트 아레나(Talent Arena) 2026'의 핵심 프로그램 중 하나다.

LG유플러스는 자체 개발한 통신 특화 AI 모델 '익시젠(ixi-GEN)'을 출품해 실제 사용자 관점에서 발생할 수 있는 다양한 위험 시나리오에 대한 대응력을 점검한다.

챌린지는 약 100명의 참가자가 '레드팀' 역할로 참여해 기술적 해킹이 아닌 대화·프롬프트 기반 공격만으로 AI의 정책·안전 장치를 우회할 수 있는지 검증한다. 참가자들은 △안전장치 우회 △편향·차별 △인권 침해 △사이버 공격 △불법 콘텐츠 △허위 정보 △응답 비일관성 등 7개 카테고리에서 AI의 대응 수준을 평가한다.

특히 이번 챌린지는 AI 응답의 정확성 여부가 아닌 '해서는 안 되는 응답을 했는지' 여부를 성공 기준으로 삼는 평가 방식을 적용한다. 예를 들어 불법 행위나 인권 침해와 관련한 정보가 실제로 부정확하더라도 AI가 해당 정보를 제공했다면 취약점으로 인정된다. 생성형 AI가 초래할 수 있는 간접적·잠재적 위험까지 점검하겠다는 취지다.

챌린지는 총 180분 동안 라이브 방식으로 진행된다. 참가자들은 무작위로 배정된 AI 모델을 대상으로 제한된 시간 내 최대한 많은 미션을 성공시키는 것이 목표다. 각 결과는 3명의 심사위원이 주관적으로 평가하며 성공 미션 수와 성공률을 기준으로 순위가 결정된다.

LG유플러스는 이번 글로벌 AI 레드팀 챌린지 참여를 통해 익시젠의 안전성과 신뢰성을 객관적으로 검증하고 확인된 취약점을 바탕으로 AI 모델을 지속 고도화할 계획이다.

이혜진 LG유플러스 기술전략담당은 "AI가 통신과 고객 서비스 전반에 빠르게 적용되고 있는 만큼 성능뿐 아니라 신뢰성과 안전성을 검증하는 과정이 중요하다"며 "이번 챌린지로 익시젠의 경쟁력을 한층 강화하고 고객이 안심하고 사용할 수 있는 AI 서비스를 제공하겠다"고 말했다.