KAIST 전기및전자공학부 연구팀-국가보안기술연구소
AI 생성 탐지 기술 'XDAC' 개발

AI(인공지능)로 조작한 댓글을 탐지하는 기술이 나왔다. AI로 생성한 댓글의 98.5%를 잡아낼 뿐만 아니라 어떤 AI를 사용했는지도 식별할 수 있다. 이 기술을 적용하면 '온라인 여론 조작'에 대한 우려를 불식시킬 수 있다는 설명이다.
KAIST(카이스트)는 김용대 전기및전자공학부 교수 연구팀이 국가보안기술연구소(이하 국보연)와 공동으로 한국어로 쓰인 댓글 중 AI가 생성한 댓글을 탐지하는 기술 'XDAC'를 개발했다고 23일 밝혔다. 연구 결과는 AI 자연어처리 분야 최고 권위 학술대회인 'ACL 2025'에 채택됐다.
대표적인 생성형AI인 '챗 GPT 4o'를 기준으로 댓글 1개를 생성하는 데 드는 비용은 약 1원 수준으로 알려졌다. 약 20만원이면 국내 주요 뉴스 플랫폼 기사에 달리는 하루 평균 댓글 수인 20만 개를 생성할 수 있다는 뜻이다. 최근엔 맥락에 맞춰 감정과 논조까지 조절할 수 있는 AI도 나왔다.
연구팀은 AI가 생성한 댓글과 사람이 작성한 댓글을 사람이 구별할 수 있는지 실험했다. 댓글 총 210개를 평가한 결과, 실험단은 AI 생성 댓글의 67%를 사람이 작성한 것으로 판단했다. AI 생성 댓글은 기사 맥락, 문장 유창성, 편향성 인식 등 분야에서 사람이 작성한 댓글보다 높은 평가를 받았다.
연구팀은 △LLM(거대언어모델) 14종 △자연스러움 강화 △세밀한 감정 제어 △참조자료를 통한 증강 생성 등 전략을 적용한 AI 댓글 생성 프레임워크를 개발했다. 한국어 사용자의 어법을 모방한 한국어 AI 댓글 데이터세트를 만들어 언어 표현을 정밀 분석했다. 그 결과, AI가 생성한 댓글에는 사람과 다른 고유한 '말투 패턴'이 있음을 확인했다.
AI는 "~것 같다", "에 대해" 등 형식적인 표현과 접속어를 자주 사용했다. 이에 비해 실제 사람은 'ㅋㅋㅋㅋ'와 같은 반복 문자, 감정 표현, 줄 바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 썼다. 반복 문자의 사용 비율은 사람 작성 댓글이 AI 생성 댓글보다 약 40% 높았다.
특수문자 사용에서도 차이가 있었다. 한국어 사용자는 한국어 자음이나 특수 기호 등 문화적 특수성이 반영된 다양한 특수문자를 썼지만, AI는 전 세계적으로 통용되는 표준화된 기본 이모티콘을 주로 썼다.
독자들의 PICK!
XDAC는 이러한 차이를 정교하게 반영해 탐지 성능을 높였다. 14종 LLM의 말투를 파악해 어떤 AI 모델이 각 댓글을 생성했는지도 식별할 수 있게 했다.
그 결과, XDAC는 AI가 생성한 댓글을 98.1%의 정확도로 구별해냈다. 이는 기존 한국어 댓글 탐지 기술의 정확도보다 약 30% 높인 결과다. 또 84.3%의 정확도로 댓글을 생성한 LLM도 식별했다.
고우영 선임연구원은 "연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고 생성 모델까지 식별할 수 있는 세계 최초의 기술"이라며 "AI 기반 여론 조작에 대응할 수 있는 기술적 기반을 마련했다"고 의의를 밝혔다.