유튜브를 보다 생성형 인공지능을 광고하는 알고리즘에 빠져들었다. 하루가 멀다고 새로운 인공지능 도구가 쏟아진다. 시와 소설을 써주고 그림과 노래를 만들어주고 멈춰 있는 평면사진을 움직이는 동영상으로 바꿔버린다. 한국 할머니와 흑인 청년이 자연스럽게 대화하면서 영어를 주고받는 짧은 영상은 많게는 1000만이 넘는 조회수를 기록했다.
챗GPT와 미드저니가 선보였을 때만 해도 이렇게 수많은 도구가 이토록 급속하게 범람하리라고는 미처 생각하지 못했다. 이제는 생성형 도구가 너무 많아 일일이 거명할 수 없을 정도다. 생성형 인공지능의 보편화와 대중화는 매우 짧은 시간 안에 현실이 됐다. 어쩌면 새로운 '훈민정음'이 창제됐다는 비유도 가능하겠다.
덕분에 디지털 콘텐츠는 민주화 시대를 만났다. 디지털 콘텐츠를 만들려면 글자(텍스트) 소리(사운드) 그림(이미지)이라는 3가지 요소가 필요하다. 생성형 인공지능은 이제 세 요소를 자유롭게 전환하는 능력을 보여준다. 글자를 입력하면 곧바로 그림을 만들어주고 사진을 넣으면 순식간에 영상으로 바꿔준다. 이처럼 다양한 양식의 정보를 결합하고 상호작용하며 전환하는 현상을 멀티모달리티라고 부른다. 멀티모달리티는 며칠 동안 촬영과 편집과정을 거치면서 갖은 애를 써야 겨우 만들어낼 수 있었던 영상콘텐츠를 몇 분이면 뚝딱 완성한다.
인공지능 시대엔 멀티모달리티적 사고와 역량이 중요해졌다. 인공지능은 인력과 자본이 필요한 콘텐츠 제작도구를 누구나 편하게 쓸 수 있도록 새로운 세계로 우리를 끌고 간다. 그러나 인공지능이 값싸고 편리한 기술의 시대를 열었지만 그 결과물은 대개 어디선가 본 듯한 것일 가능성이 높다. 그러므로 인공지능은 우리에게 새로운 상상력을 발휘하라는 도전을 유도한다.
이제 인간은 인공지능을 뛰어넘는 창조력을 발휘해야 한다.
멀티모달리티와 더불어 21세기를 살아갈 젊은 세대는 이런 도전에 직면했다. 예컨대 이제 대학 교육은 지식과 정보의 축적과 전수를 목표로 삼은 20세기 방식에서 벗어나야 한다. 디지털-플랫폼-인공지능으로 이어지는 시대에 지식과 정보는 이미 넘쳐나기 때문이다. 멀티모달리티 시대엔 넘쳐나는 지식과 정보를 연결해 재빨리 가치 있는 새로운 지식과 정보로 바꿔낼 수 있는 역량을 갖춘 인재를 요구한다.
멀티모달리티 역량은 그저 인공지능이 주도하는 디지털 환경에서만 중요한 게 아니다. 그것은 글로벌 인재가 갖춰야 할 다양한 문제발굴 능력과 문제해결 역량이라는 관점에서 유비적으로 이해돼야 한다. 우리가 직면한 저출생, 고령화, 빈부격차, 세대갈등 등 복잡한 사회문제는 결코 하나의 단일한 시각으로 풀어낼 수 없다. 멀티모달리티 역량은 다양한 문화적 맥락과 가치를 이해하고 해석하는 인간의 고유한 능력으로 확장된다.
영어로 된 일본경제 보고서를 읽어내면서 그 속에서 인도와 유럽의 교역문제를 간파하고 이를 통해 유럽의 노동시장 문제를 발굴하고 다시 그것이 이민과 난민이라는 문제와 만난다는 사실을 찾아낼 수 있는 관점과 역량이 필요해졌다. 멀티모달리티 시대의 새로운 인재는 인공지능 도구가 만들어낸 결과물을 넘어설 수 있는 인간지능의 상상력, 디지털과 아날로그, 로컬과 글로벌을 아우르는 주체적 연결의 역량을 갖춘 사람이다.
그러므로 전통적인 '전공' 또는 '전문분야'라는 말도 다시 이해돼야 한다. 전공이나 전문은 오로지 한 분야에만 정통하다는 의미다. 여러 악기(모달리티)의 소리를 조율해 완벽한 음악(가치 있는 결과물)을 창조하는 오케스트라의 지휘자는 스스로 모든 악기를 다루지 못하지만 전체를 보고 들을 줄 아는 눈과 귀를 가지고 있다. 멀티모달리티 시대의 인재는 다양한 정보와 문화를 능숙하게 연결·융합·통합해 현실의 복잡한 문제를 해결한다. 그것이 곧 21세기 인재의 시대정신이다.