인천 송도1동·송도2동에서 박찬대·유정복 득표수 동일
통계학자 "통계 잘못 이해한 '착시'…선거 조작 의심은 비합리적"

최근 치러진 6·3 지방선거 이후 일부 투표소의 관내사전투표 득표수가 완벽히 일치하는 현상을 두고 부정선거 의혹이 제기됐다. 인천과 전남 등 일부 지역에서 후보 간 득표수가 똑같이 나온 것이 확률적으로 불가능에 가깝다는 주장이다. 그러나 이는 통계학적 원리를 오해한 데서 비롯된 착시라는 것이 통계학자들의 주된 의견이다.
13일 한국과학기술미디어센터(SMCK)에 따르면 다수의 통계학자들은 최근 관내 사전투표 득표수가 일치할 확률에 대해 '희귀한 일이 아니'라고 입을 모았다.
서울대학교 장원철 통계학과 교수는 이를 '생일 문제'나 '전화번호 일치'와 같은 확률적 성격으로 설명했다. 특정인 두 명의 전화번호 뒷자리가 우연히 같을 확률은 매우 낮아 보이지만, 100명이 모인 공간에서 '누구든 상관없이' 뒷자리가 같은 쌍이 존재할 확률을 계산하면 99%에 달한다는 것이다.
예를 들어, 내 친구와 내 전화번호 뒷자리가 똑같을 확률은 엄청 희박해 보이지만, 실제 100명이 모인 운동장에서 '번호 뒷자리가 똑같은 사람'을 찾으면 그럴 확률은 99%에 달한다는 것이다. 어떤 번호든 상관없이 '누구든 한 쌍만 겹치면 되기' 때문이다. 투표소 데이터 역시 특정 두 동만 떼어놓고 볼 것이 아니라, 비슷한 규모를 가진 전체 행정동의 가능한 모든 쌍을 대입해 보면 동일한 득표수가 나올 확률은 일반인의 생각보다 훨씬 높아진다고 설명한다.
서강대학교 이윤동 경영대학 교수는 '중심극한정리'를 기반으로 분석했다. 예컨대, 전체 투표자 수가 약 4500명 내외이고 두 후보의 득표율이 2 대 1 정도일 경우, 후보의 득표수는 무작위로 흩어지지 않는다. 수학적 원리에 따라 실제 득표수는 전체 구간 중 중심부에 위치한 2950과 3050 사이의, 약 100개의 숫자에 집중돼 0.6~0.9% 사이의 확률이 된다는 설명이다.

영남대학교 박한우 미디어커뮤니케이션학과 교수 역시 '숫자가 같다'는 사실 하나만 볼게 아니라 이번 선거의 투표율이나 그 지역의 특징 등을 종합적으로 따져봐야 한다고 했다. 그는 수많은 데이터에서 '첫째 자리 숫자'가 특정 확률로 나타난다는 통계법칙인 '벤포드 법칙'을 토대로 데이터 과학적 검증을 시도했으나, 현재로서는 어떤 이상 징후도 발견되지 않았다고 선을 그었다.
그러면서 박 교수는 "이번 사례는 역대 최고 수준의 투표율, 지역적 특성, 사전투표 성향 등 다변화된 맥락을 종합적으로 짚어내는 교차적 분석이 필요하다"면서 "앞으로 선거 보도시 개표 과정과 선거 데이터 분석 결과에 대한 검증 절차, 확률 수치의 산출 근거 공개, 데이터 전문가 검증 등을 제도화하는 방향으로 보도 지침을 보완해야 한다"고 덧붙였다.
독자들의 PICK!
한편 중앙선거관리위원회에 따르면 인천시장 선거 관내 사전투표 결과 송도1동과 송도2동에서 각각 1위 박찬대 더불어민주당 후보 3030표, 2위 유정복 국민의힘 후보 1440표로 동일한 결과가 나왔다.
전남광주시장 사전투표에서도 전남 고흥군 금산면, 광주 광산구 송정1동에서 모두 1위 민형배 민주당 후보가 1401표, 이정현 국민의힘 후보가 120표를 받는 등 총 투표소 10곳(5쌍)에서 두 후보의 득표수가 같았다. 이에 장동혁 국민의힘 대표 등 부정선거론자들의 의혹 해소 요구가 빗발쳤다.