
‘중간은 해야지’, ‘평균에도 못 미치면 어떻게 하니’. 예전부터 자주 듣던 말일 것이다. 키, 몸무게, 성적, 소득, 1인당 GDP까지 평균은 실제로 통계에서 가장 많이 사용하는 개념이다.
특정 집단의 대표값을 보여주는 통계수치 중 하나인 평균은 그 집단의 중간 수준을 보여주고 과거와 비교해 얼마나 변화가 이루어졌는지 파악할 수 있는 유용한 지표다. 하지만 평균을 전체 통계를 유일하게 대표하는 가치로 활용하는 것은 경계해야 한다. 평균이 때로는 통계자료의 속성이나 본질을 잘못 보여줄 수도 있기 때문이다.
일련의 군대가 강을 건너는데 수심이 평균 1m라는 정보만을 믿고 도하를 하다가 수심이 깊은 특정 지점에서 수영을 못하는 많은 군인이 익사를 했다는 이야기는 평균의 함정을 보여주는 대표 사례로 자주 거론되곤 한다.
이처럼 수심이 가장 깊은 곳에 해당하는 특이한 관측값을 통계에서는 아웃라이어(outlier)라고 한다. 통계자료의 가운데 수인 중앙값(median), 가장 많은 수인 최빈값(mode)을 함께 이용해 아웃라이어의 존재 여부와 전체 분포를 살펴봐야 집단 전체의 속성을 제대로 파악할 수 있다.
평균이 우리가 믿고 따라야 할 절대적 기준은 아니다. 중요한 참고자료 중 하나일 뿐이다. 평균 이면에 있는 숨겨진 본질을 다양한 방법으로 분석해 통계를 활용하는 것이 오늘을 살아가는 지혜가 아닐까 생각한다.