글쓰는 기계가 인간과 경쟁할 날이 올까요?
지메일(Gmail)의 두 가지 기능 덕분에 이제는 많은 이들이 자동 글쓰기(automated writing)라는 것에 익숙해졌습니다. “스마트 답장(Smart Reply)” 기능은 일상적인 이메일에 대한 간단한 답을 만들어 냅니다. “오후 3시에 만날까?” 같은 질문을 받는 경우, 클릭 한 번으로 “그래!”라는 답장을 만들어 낼 수 있죠. 더 놀라운 건 “스마트 작문(Smart Compose)” 기능입니다. 사용자가 쓰는 글을 봐가면서 문장의 나머지 부분을 제안하죠. 두 기능 모두 문법적으로 흠 잡을 데 없는 영어임은 물론이고, 약간 무서울 정도로 내가 쓰려던 문장을 예측해 냅니다.
“뉴요커”지의 존 씨브룩은 최근 GPT-2라는 이름의 한층 더 강력해진 글쓰기 도구를 소개했습니다. 이 시스템은 수십억 개의 인공 “뉴런(신경세포)”와 가상의 “시냅스(신경접합부)”로 이루어진 디지털 네트워크를 활용해 뉴요커 같은 잡지의 글 스타일을 흉내낼 수 있습니다. 이 시스템은 40기가바이트에 달하는 온라인 상의 글을 통해 계속해서 학습하고 스스로를 강화해 나갑니다. 씨브룩이 테스트한 버전은 뉴요커의 과월호들을 활용해 다듬어진 버전입니다.
자동 글쓰기 프로그램을 뇌에 비유하는 건 언뜻 딱 적절해 보이지만, “뉴런”, “시냅스”와 같은 단어에 따옴표를 치는 데는 다 이유가 있습니다. 이 시스템은 단순히 (매우 고도의) 통계적 추측을 내놓을 뿐입니다. 뉴요커 스타일의 문장에서 A라는 단어 뒤에 올 가능성이 높은 단어는 B 단어라는 식이죠. 간단한 수준의 자동 글쓰기에서 사용자가 “Happy”라는 단어를 치면, 수백만 통의 이메일을 통해 학습한 지메일은 그 다음에 올 단어로 “birthday”를 제안할 겁니다. GPT-2의 작동 원리도 본질적으로 이와 같습니다.
컴퓨터를 피해가는 것은 바로 창의력입니다. 과거의 작문으로 훈련을 받았다는 바로 그 점 때문에, 컴퓨터가 써낼 수 있는 것은 파생물 뿐입니다. 스스로 주제나 목표를 정할 수도, 스스로의 논리와 스타일을 가지고 그 주제와 목표에 도달할 계획을 세울 수도 없죠. 씨브룩의 기사 여러 군데에서 독자들은 GPT-2가 어떻게 씨브룩을 대신해 글쓰기를 이어나갔는지 볼 수 있습니다. 언뜻 인간의 느낌을 풍기지만, 자세히 들여다보면 공허하고, 앞뒤가 안 맞는 부분도 드러나죠.
의미 없는 글이 인공지능만의 전유물은 아닙니다. 얼핏 보면 말이 되는 듯하지만 사실은 그렇지 않은 글은 이미 엄청나게 많이 존재하죠. 1996년 앨런 소칼(Alan Soka)은 인문학 저널에 엉터리 논문을 제출했습니다. 말이 안 되는 내용이었지만, 학계의 포스트모더니즘 문장을 그럴 듯하게 흉내낸 언어로 쓰여진 글이었죠. 엉터리 논문은 저널에 게재되었습니다. 2017년에는 학자 3명이 다시 한 번 이 사기극을 재연했고, 20편의 가짜 논문 중 4편이 게재 승인을 얻었습니다. 이렇게 인간은 의도를 가지고, 또 의도 없이, 의미 없는 글들을 잔뜩 생산하고 있습니다.
하지만 진짜 글을 쓰기 위해서는 일단 하고 싶은 말이 있어야 합니다. 컴퓨터에게는 하고 싶은 이야기가 있을 수 없죠. 컴퓨터는 지시를 기다립니다. 인풋을 주면 아웃풋이 나오죠. 주제를 주거나, 첫 문단을 몇 개 입력하거나, “써라”라는 입력어를 넣어야 합니다. 그 결과는 영어의 문법을 따르는 문장이겠지만, 목적이 있는 글과 같다고 보기는 어렵습니다.
GPT-2와 같은 프로그램들이 의미있는 작문을 하기 위해서는 우선 현실 지식의 데이터베이스와 연결되어야 합니다. 현재는 아주 제한적인 수준으로 이루어지고 있는 일이죠. 애플의 시리나 아마존의 알렉사에게 “탑건이 언제 개봉했지?”와 같은 팩트를 물어보면 답을 얻을 수 있는 것처럼요. 하지만 하나의 주장을 뒷받침하기 위해 여러 가지 팩트를 조합해야 하는 질문, 예를 들어 “총기 규제법이 도입되면 총기 범죄가 줄어드니?”와 같은 질문만 던져도 시리와 알렉사는 당황하기 시작합니다.
지식과의 조합이 발전한다 해도, 또 다른 돌파구가 필요합니다. 글쓰기 프로그램에 문장을 넘어 구조를 가르치는 일이죠. 씨브룩은 GPT-2를 사용해 쓴 글이 길어지면 길어질수록 더욱 명백한 엉터리가 된다는 사실을 알아냈습니다. 각각의 문장이 말이 되고, 서너 개의 문장은 그럭저럭 잘 이어지지만, 여러 문단, 여러 페이지에 달하는 수사와 주장의 흐름을 만들어 내기까지는 아직 멀었다는 것입니다. 현직 기자들이 은퇴하기 전에 글쓰는 기계와 경쟁할 일은 없을 것이고, 지금의 어린이들도 여전히 글쓰기를 배워야 하는 이유입니다.
엉터리 글을 써내는 것 자체는 별문제 없지만, 글쓰기 프로그램이 소셜미디어와 댓글란을 장악해 말도 안 되는 분노의 헛소리가 사회 분열과 혼란을 촉진할 거란 우려도 있습니다. 하지만 소셜미디어와 댓글란에서는 이미 그와 같은 현상이 일어나고 있죠. 어쩌면 자동완성된 분노의 댓글이 범람하는 시대가 되면 오히려 독자들이 가짜글과 진짜글을 구분할 수 있게 될지도 모릅니다. 그렇게 되면 글 쓰는 기계도 터미네이터처럼 세상을 더 나은 곳으로 만드는 데 기여할 수 있을지도 모릅니다. (이코노미스트)