'빅 데이터(big data)' 출현으로 데이터량 폭발적 증가
엑사바이트 들어 보셨나요? 십진법으로 표현하면 승수가 18로 기가바이트(gigabyte)의 제곱에 해당한다. 아직까지도 데이터의 양을 표시할 때 가장 많이 인용하는 메가바이트(megabyte)는 승수가 6밖에 안되니 엑사바이트의 규모를 짐작할 만하다.
엑사바이트란 말이 아직은 생소하게 들릴지 모르지만, 이미 우리의 매일매일 생활속에서 만들어지는 모든 데이터의 양을 기가바이트나 그보다 한 단계 높은 테라바이트(terabyte: 승수 15)로는 측정하기 어려운 수준까지 늘어났다.

엑사바이트는 2003년 미국의 작가 베르린 크린켄보그(Verlyn Klinkenborg)가 뉴욕타임즈에 캘리포니아주립대(UC Berkeley)의 연구결과를 인용, "인간이 태초부터 지금까지 5 엑사바이트의 데이터를 만들었다"고 언급하면서부터 사람들 사이에 널리 회자됐다.
그리고 지난 2010년, 구글(Google)의 에릭슈미트(Eric Schmidt) 전 CEO는 한 컨퍼런스 모임에서 이에 덧붙여 "인간이 태초부터 2003년까지 5 엑사바이트 규모의 데이터를 만들었다면, 지금은 이 규모의 데이터가 단 2일만에 생성된다"며 데이터량이 엄청난 속도로 증가하고 있음을 지적했다.
한편, 19일, LG CNS주최의 엔트루(Entrue) 컨퍼런스에서 빅 데이터의 원조 구루(guru)인 밥슨대학(Babson College) 토마스 데이븐포트(Thomas Davenport) 교수는 "5 엑사바이트의 데이터가 매년 생성된다"고 최근 대학 연구를 인용, 발표했다.
이들의 발표를 종합해보면, 현재 우리가 매일 생성하는 데이터량이 엄청나며(즉 빅 데이터가 출현하고) 그 증가 속도 또한 놀랄 만큼 빠르다는 것이다. 이러한 빠른 데이터량 증가는 예전에는 측정 못했던 음성이나 움직임 등의 비정형 데이터까지도 요즘은 측정 계량화할 수 있게 된 데도 한 몫을 한다. 지금도 우리들의 일상생활 곳곳에 침투(?)해 있는 수많은 센서(sensor)들이 우리들의 얼굴표정과 웃음소리까지도 감지하고 있다. 우리가 인식 못한 채 스스로 데이터 생성의 주인공이 되고 있는 것이다.
이런 데이터량 증가는 컴퓨터 하드웨어 기술의 발전 속도를 말해주는 무어의 법칙(Moore's Law)과는 비교도 안될 정도로 빠르다. 무어의 법칙은 인텔의 창업자인 고든 무어(Gordon Moore)가 트랜지스터의 개수가 매 2년마다 2배씩 빠르게 증가한다고 한 얘기인데, 데이터량의 증가 속도는 데이븐포트 교수가 예측을 사양할 만큼 너무나 빠르다.
독자들의 PICK!
이런 속도라면 우리가 만들어 내는 데이터량이 엑사바이트의 다음 단계인 제타바이트(zettabyte)로 측정해야 할 때가 멀지 않았다.