머니투데이 the300과 사단법인 한국여성의정이 공동 진행한 '2030 뉴(new)다만세, 진짜 캐스팅보터의 탄생' 기획 데이터 분석은 (주)옥소폴리틱스가 수행했습니다. 수행 방식은 아래와 같습니다.
-조사 분석에는 성격이 다른 두 개의 자료 뭉치를 사용합니다.
-자료 ① 커뮤니티 글 (12만6584건) : 더쿠·인스티즈·일베·보배드림처럼 성향이 뚜렷한 게시판 글을 모은 것입니다. 이 중 1만3634건을 골라 글 하나하나에 '감정·정치 진영·주제·중요 가치·후보 선택 기준·작성자 성별·연령' 같은 6가지 꼬리표(라벨)를 달았습니다. 보고서에 나오는 모든 비율(%) 통계는 전부 이 뭉치에서 나왔습니다. 쉽게 말해 '여론의 수치'를 재는 도구입니다.
-자료 ② 유튜브 댓글 (80만9000건) : 진보·보수 정치 유튜브 22개 채널의 댓글입니다. 댓글은 게시판 글과 성격이 달라 별도의 자료 뭉치로 다룹니다. 채널 성향별로 여론이 어느 쪽으로 기우는지, 본문 곳곳의 생생한 인용, 그리고 AI 페르소나(가상의 대표 인물 9명) 묘사를 보강하는 데 활용했습니다.
-유튜브 댓글을 핵심(%) 통계에 섞지 않은 이유 : 유튜브 댓글은 작성자의 성별·연령을 알 수 없어 '2030 여성' 같은 비율을 낼 수 없고, 라벨 항목이나 글의 단위도 다릅니다. 한 표에 합치면 수치가 왜곡(오염)될 수 있습니다. 그래서 비율 통계는 커뮤니티 글로만 확보하고, 유튜브는 흐름 및 인용 보강용으로 분리했습니다.
-머니투데이 the300과 (사)한국여성의정이 의뢰하고 (주)옥소폴리틱스가 분석했습니다다.
-분석 대상은 두 종류의 온라인 글이다. 첫째는 더쿠·인스티즈·여성시대·디시인사이드·에프엠코리아·일베·보배드림처럼 정치 성향이 뚜렷한 커뮤니티 19곳의 게시글. 둘째는 진보·중도·보수 정치 유튜브 채널의 댓글입니다. 분석은 두 단계로 나뉩니다.
① 여론의 비율을 재는 통계 분석 : 커뮤니티 19곳 중 게시판 단위로 수집이 가능한 18곳에서 글 12만6584건을 모았다. 인기 커뮤니티 글이 지나치게 많이 잡히는 쏠림 현상을 바로잡은 뒤, 두 시기 즉 계엄 직후 한 달(2024.12.3~2025.1.4)과 6·3 지방선거 직전 한 달(2026.5.3~6.3) 간의 의 글 1만3634건을 골라 AI로 꼬리표를 달았다(라벨링).
글 하나하나에 △감정 △정치 성향 △주제 △중요하게 여기는 가치 △후보를 고르는 기준 △작성자의 성별·연령 추정 등 여섯 가지를 표시했다. 라벨링에는 서로 다른 3종의 AI 라벨러(Gemini 2.5 Flash·Claude Sonnet 등)를 활용했다. 보고서에 나오는 모든 비율(%)은 이 자료가 기반이다.
② 생생한 목소리를 담는 보강 자료 : 정치 유튜브 채널 댓글 80만9000건은 따로 모았다. 채널 성향별로 여론이 어디로 기우는지 살피고, 본문 인용과 'AI 페르소나(가상의 대표 인물)' 묘사에 활용했다. 유튜브 댓글은 ①의 핵심 비율 통계에는 섞지 않았다.
- 유튜브 댓글 80만9000건은 페르소나 전용이 아니라, 보고서에서 세 군데에 두루 활용됐습니다. 1) 보고서 부록의 유튜브 여론 분석, 채널 성향별로 균형 표본(7976건)을 뽑아 감성·진영·주제 3차원으로 라벨링 2) 보고서 본문 인용·해석 등에서 유튜브 여론을 직접 인용·분석 (예: 부동산 관련 유튜브 여론) 3) AI 페르소나, 가상 대표 인물 묘사 보강 등의 과정에 쓰였습니다.
-커뮤니티 12만6584건은 여론의 수치(%)를 재는 자료로, 유튜브 80만9000건은 여론의 결과와 생생한 목소리를 보강하는 별도 자료로 활용됐다는 의미입니다.