시간이 흐르고 시대가 변하면서 과학 논문의 저자 표기 방식도 달라지고 있다. 한 세기 전에는 한두 명의 과학자들이 자신의 아이디어와 실험결과를 정리해서 논문으로 발표했다. 예를 들면 앨버트 아인슈타인의 논문들은 대부분 아인슈타인이 혼자 썼다. 그러나 현재의 연구들은 더 이상 한 사람의 천재가 해결할 수 있는 규모가 아니다. 현대 과학은 '거대 협업의 장'이자 '규모의 경제가 작동'하는 영역에 들어서 있다.
1916년, 아인슈타인은 중력파의 존재를 예측한 논문을 발표했다. 정확히 백 년이 흐른 2016년에 미국의 레이저 간섭계 중력파 관측소(LIGO)가 중력파를 관측하는 데에 성공했다. 그런데 아인슈타인의 논문과는 달리, 중력파 관측을 설명하는 논문의 저자는 천 명에 달했다. 멀리 떨어진 은하로부터 오는 미세한 신호를 관측하기 위해 과학, 공학, 컴퓨터 분야 최고 전문가들의 협업이 필요했기 때문이다. 연구에 참여해 저자에 포함된 LIGO 과학 협력단에는 14명의 한국 과학자들도 포함되어 있었다.
천 명으로 부족한 논문도 있다. 2012년 유럽핵입자물리연구소(CERN)는 질량의 기원을 설명하는 힉스 입자를 발견했다는 논문을 발표했다. 이 논문의 저자에는 약 3000명의 이름이 실렸다. 이 3000명은 세계 최대 규모의 입자가속기를 짓고 운영한 공학자들, 실험을 실행하고 데이터를 분석하는 데 참여한 과학자들이다,
이같은 '거대 연구 인프라 기반의 국제협력'은 물리학과 천문학에서 많이 찾아볼 수 있다. 유령입자로 불리는 중성미자를 관측해 우주의 기원을 연구하기 위한 '아이스큐브' 관측기는 아문센-스콧 남극기지 인근의 빙하 속 2km 아래에 설치되어 있다. 호주와 남아프리카 공화국에는 높은 해상도로 우주를 관찰하기 위한 차세대 전파 망원경 '스퀘어 킬로미터 어레이'가 건설되고 있다. 프랑스 남부에 건설 중인 국제열핵융합실험로(ITER)는 35개국이 참여하고 있는 역사상 가장 큰 규모의 국제연구개발사업이다. 생명과학 분야인 '인간 지놈 프로젝트'도 손꼽을 만한 대규모 연구였다. 코로나 바이러스 대유행 시기에는 1만 5000명의 의사와 연구자가 참여한 의학 논문이 발표되어 기네스북에 기재되기도 했다. 말하자면 현대 과학은 점점 더 많은 데이터와 여러 과학 분야의 협력 체계를 통해 작동하고 있는 것이다,
인공지능 분야 역시 예외가 아니다. 구글의 인공지능 모델 '제미나이 2.5 기술보고서'에는 3295명의 여 명의 과학자와 공학자들이 공동 저자로 참여했다. 20세기 말 거대과학의 상징이 입자가속기였다면, 오늘날에는 데이터센터와 인공지능 인프라도 새로운 거대 연구장비 역할을 담당하고 있다.
대규모 국제협력 연구는 거대한 실험장치의 설치와 운영에서 시작되어 이 실험장치에서 나오는 대용량 데이터를 효율적으로 처리하는 방식으로 진행된다. 문제는 이 같은 거대실험장치에서 나오는 실험과 연구 데이터의 양이 상상 이상으로 막대하다는 점이다. '구슬이 서 말이어도 꿰어야 보배'인 것처럼 여기서 쏟아져 나오는 다양한 데이터를 제대로, 치밀하게 분석해야만 연구의 성과를 얻을 수 있다. 과거에 실험장치를 소유한 국가가 연구를 주도했다면, 현재는 데이터를 잘 처리, 분석하는 국가의 연구자들이 더 많은 성과를 내고 있다. 데이터 처리와 공유가 국제협력 연구의 새 도전과제로 자리잡은 것이다.
국가 연구개발(R&D) 투자 35조5000억원 시대를 맞은 우리나라 역시 다양한 국제협력 연구에 참여하고 있다. 이러한 대규모 국제연구에 참가할 때, 이제는 실험 참가 못지 않게 데이터를 획득하고 데이터의 주권을 확보하는 데에도 관심을 기울여야 한다. 연구인프라를 구축하고 운영할 때에 데이터 처리를 위한 컴퓨팅 비용을 적게 잡는 경향이 있는데, 효율적인 연구 진행을 위해서 이 점도 바뀔 필요가 있다고 본다.