다음카카오 '뉴스 생산부터 독자 클릭까지'…과정 공개

홍재의 기자
2015.09.14 15:28

모바일에는 추천 시스템 '루빅스'로 다양성 높여…PC는 점진적으로 루빅스 적용

사진제공=다음카카오

다음뉴스에 송고되는 기사는 서비스 품질 저해 방지를 위해 문서간 중복 필터링과 편집원칙에 반하는 선정적, 광고성 문서가 없는지 최종 검수를 거친다. 이후 이용자별 관심사와 좋아하는 콘텐츠에 대한 반응을 기계학습을 통해 독자에게 전달한다.

다음카카오가 공식블로그를 통해 다음뉴스 콘텐츠 배치 절차와 주요 서비스 데이터를 14일 공개했다.

다음카카오는 '다음뉴스, 독자와 함께 더욱 혁신하겠습니다'(http://blog.daumkakao.co.kr/412)라는 제목으로 블로그에 관련 내용을 공개했다.

해당 글을 통해 다음카카오는 기사가 언론사에서 송고돼 웹·모바일을 통해 이용자에게 보일 때까지의 과정을 상세하게 설명했다. 다음뉴스 서비스 담당자들의 역할, 주요 적용 기술 등도 공개했다.

다음뉴스 배치 절차는 언론사의 기사 송고와 함께 시작된다. 9월 현재 140여개 매체에서 하루 2~3만건의 기사가 송고되며 다음뉴스 에디터가 키워드별로 기사를 묶어 보여주는 클러스터링 기술에 따라 실시간으로 주제와 정보량을 파악한다.

이후 필터링과 기계학습을 거쳐 독자에게 기사가 전달된다. 대부분의 언론사가 '속보'로 전하는 긴급뉴스나 대형사고, 재난재해, 기상특보, 스포츠중계, 경기결과처럼 실시간성이 중요한 뉴스는 전체 이용자에게 배치된다. 해당 부분은 아직 기계가 소화할 수 없는 영역이다. PC뉴스는 모바일 보다 낮은 단계로 루빅스 알고리즘을 적용하고 있다. PC는 로그인 비율이 낮고 공용PC도 많기 때문에 현재는 루빅스풀에 있는 기사를 자동 배치하는 수준이다.

다음카카오는 "기계학습을 통해 전달되는 루빅스 시스템을 통해 기사의 공정성과 다양성을 향상시켰다"며 루빅스 적용 3개월간의 주요지표를 공개했다.

사진제공=다음카카오

첫 화면 기사수는 적용전 일평균 257건에서 839건으로 226% 증가했으며 IT 섹션과 문화생활 색션은 각각 365%, 660% 증가해 뉴스 다양성이 풍부해졌다. 더 많은 기사가 첫 화면에 배치되며 클릭수 109%, 일간 이용자수 42%, 기사 읽는 시간이 65% 증가하는 등 뉴스 소비량도 전반적으로 크게 늘어났다.

이와 함께 다음카카오는 다음뉴스의 기사 송고 현황, 뉴스 배치 통계, 섹션별 이용자 소비패턴, 성연령별 이용자 소비분포 등 뉴스 서비스 관련 주요 데이터도 공개했다.

주요 지표별로 살펴보면 △8월 한달간 일평균 기사 2만7000건 송고(뉴스 53%, 연예 32%, 스포츠 13%, 라이프 2%) △하루 다음 모바일 첫 화면에 기사 총 800여건 자동배치 △성연령별 이용자 분포는 남성 59.2%, 여성 40.1% 등이 있다.

다음카카오는 "제목과 내용이 일치하며 정보 가치가 높을때 체류 시간과 추가 클릭이 훨씬 많이 일어나는 것을 알 수 있었다"며 "이러한 요소들을 기계학습에 더 반영할 계획"이라고 밝혔다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>