인공지능 분야의 야망은 끝이 없습니다. 지난 1월 한 인터뷰에서 순다 피차이 구글 최고경영자는 “인공지능은 전기나 불보다 심오하다.”라고 말했습니다.
그렇지만 인공지능을 개발하는 일상은 평범하기만 합니다. 지난주 피차이는 환호하는 관중 앞에서 구글의 새 프로그램 구글 듀플렉스가 미용실에 전화를 걸어 예약하는 영상을 선보였습니다. 전화를 받은 사람이 컴퓨터와 대화한다고 생각하지 못할 정도로 듀플렉스는 전화 업무를 잘 해냈습니다.
이 시연이 속임 없는 사실이라면 (조금 섬뜩하지만) 인상적인 성과입니다. 하지만 구글 듀플렉스는 사람들이 생각하는 것처럼 의미 있는 인공지능의 발전은 아닙니다.
구글 듀플렉스에 대한 공개 보고서를 읽어보면 프로젝트의 초기 범위는 놀랄 만큼 제한되어 있음을 알 수 있습니다. 프로젝트는 단 세 가지 과제만 포함하고 있습니다: “레스토랑 예약하기, 미용실 예약하기, 공휴일의 영업시간 확인하기.”
미용실 예약하기? 우리는 이보다 더 큰, 예를 들면 의학 기술의 수준을 한 단계 끌어올리거나 신뢰할 수 있는 가사 도우미 로봇을 만드는 일 등을 가능하게 하는 인공지능을 꿈꿨습니다.
구글 듀플렉스 프로젝트의 범위를 이렇게 제한한 이유는 원대한 목표를 향한 작지만 중요한 첫걸음을 상징적으로 보여주고자 했기 때문이 아닙니다. 그저 아직은 인공지능 분야가 더 복잡한 과제를 제대로 처리할 방법을 모르기 때문입니다.
구글 듀플렉스가 제대로 작동할 수 있었던 비결은 구글이 인정한 대로 널리 연구할 수 있는 “닫힌 분야”와 매우 제한된 종류의 데이터로 범위를 정했기 때문입니다. 미용실에 전화해 예약하는 대화가 정확히 거기에 해당하죠. 구글 듀플렉스는 그런 좁은 분야에 대한 상당한 훈련을 받은 다음에야 사람이 말하는 듯한 대화를 할 수 있습니다. 광범위한 주제를 아우르는 열린 대화는 아직 요원합니다.
구글 듀플렉스가 아직 설익은 기술을 섣불리 발표한 것도 아니고, 아직 부족한 기술에 사람들이 지나치게 열광한 것도 아닙니다. 구글은 분명 세계에서 가장 많은 인공지능 연구원을 보유하고 방대한 데이터와 엄청난 전산 처리 능력을 갖추고 있습니다. 그런 구글조차도 현재의 능력으로 진정한 의미의 인공지능을 구현할 수 없다는 것이 오히려 이번 듀플렉스 발표를 통해 생생하게 드러난 겁니다.
이 문제의 핵심은 인공지능 분야가 언어의 무한한 복잡성을 이해하지 못한다는 사실입니다. 몇 가지 규칙에 따라 소수의 수학 기호를 조합함으로써 무한한 수학 방정식을 만들어 낼 수 있듯이, 적당한 규칙과 적당한 단어들을 조합하여 무한하게 많은 수의 문장을 만들어낼 수 있습니다. 진정한 인간 수준의 인공지능은 문장 몇 가지가 아니라 가능한 조합의 모든 문장을 다룰 수 있어야 합니다.
대화의 범위가 제한될수록 인공지능이 이를 학습하기는 쉬워집니다. 대화 참여자가 스크립트대로 말할 경우, 회화책 같은 단순한 템플릿을 사용해서 주제의 변화를 인식하는 컴퓨터 프로그램을 만들기는 어렵지 않습니다. (“가게 문을 몇 시에 닫으세요?” “저녁 7시에 4명 예약하고 싶은데요.”) 그러나 유명 회화책 한 권을 통달했다고 외국어를 유창하게 말할 수 있는 것이 아니듯, 인공 지능의 대화에는 곧 동문서답이 난무하게 될 것입니다.
레스토랑 예약 같은 제한된 범위에서도 예상하지 못한 시나리오가 발생할 수 있습니다. (“죄송합니다. 저희 레스토랑이 그 주에 내부 공사를 합니다.”라고 나오면 어떻게 반응할까요?) 좋은 컴퓨터 프로그래머라면 대화 참여자가 다시 말하게 유도하여 이런 상황을 가능한 모면할 수 있게 디자인했을 겁니다. 일단 “죄송합니다. 그 주에 문을 닫는다고 말씀하셨나요?” 정도로 짧은 대화는 충분히 넘길 수 있습니다. 그러나 심도 있는 주제로 자유로운 대화를 나눌 때는 그런 얼버무림이 결과적으로 전혀 앞뒤 맥락이 맞지 않는 짜증 나는 대화로 끝날 수도 있습니다.
공정하게 말하면 구글 듀플렉스는 회화집 같은 템플릿을 사실 사용하지 않았습니다. 구글 듀플렉스는 머신러닝 기술을 사용하여 인간의 대화를 녹음한 방대한 양의 데이터에서 대화 가능한 문장들을 추출했습니다. 그러나 기본적인 문제는 달라지지 않습니다. 얼마나 많은 수의 데이터를 보유하고, 얼마나 많은 패턴을 구분할 수 있는지와 상관없이, 데이터는 결코 인간의 창의력이나 현실 세계의 가변성에 견줄 수 없습니다. 가능한 문장의 세계는 너무나 복잡합니다. 삶의 다양성은 끝이 없고 인간이 그 다양성에 대해 이야기할 수 있는 방법도 끝이 없는 것처럼 말이죠.
그렇다면 인공지능 분야는 대신 무엇을 해야 할까요? 머신러닝과 ‘빅데이터’가 유행하기 전 인공지능 연구원들은 컴퓨터가 어떻게 복잡한 지식을 암호화하고 처리할 수 있는지 파악하고자 노력했습니다. ‘지식 엔지니어링 프로젝트’로 알려진 이 프로젝트는 거대한 데이터에서 통계적 패턴을 감지하는 프로그램을 만들려고 한 것이 아니라, 규칙의 체계 속에서 인간 이해의 근본적인 요소를 정형화하여 컴퓨터 프로그램에 적용하려는 목적이 있었습니다. 인간 생각의 결과를 단순히 모방하는 데서 나아가 기계가 실제로 인간의 인식 능력의 핵심을 함께 공유할 수 있도록 말입니다.
그 프로젝트는 실현이 어렵다고 밝혀지며 중단되었습니다. 그러나 “어렵고 미완성”이라고 해서 결코 방향이 잘못됐다는 뜻은 아닙니다. 인공지능 연구원들은 언젠가는 그 프로젝트로 돌아가야 할 것입니다. 인간의 의식이 어떻게 끝없이 유연할 수 있는지를 연구하는 인지 심리학자들의 도움을 받으면 좋을 것입니다.
오늘날 인공지능에 대한 주된 접근법은 효과가 없었습니다. 물론, 구글 번역기나 구글 듀플렉스같이 주목할 만한 AI 기반 프로그램이 탄생한 건 대단한 성과입니다. 그러나 지능의 한 형태로 보았을 때 프로그램의 한계는 사람들의 주의를 촉구합니다. 머신러닝과 빅데이터로, 세계에서 가장 유능한 인공지능 회사조차 레스토랑 예약하기 이상의 성과를 내지 못한다면, 어쩌면 지금이 인공지능에 대한 우리의 전략을 다시 생각해야 할 때인지도 모릅니다.
(뉴욕타임스, Gary Marcus and Ernest Davis)
뉴스페퍼민트는 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 글에 관한 해설을 쓰고…
* 비상 계엄령 선포와 내란에 이은 탄핵 정국으로 인해 한동안 쉬었던 스브스프리미엄에 쓴 해설 시차발행을…
우리나라 뉴스가 반헌법적인 계엄령을 선포해 내란죄 피의자가 된 윤석열 대통령을 탄핵하는 뉴스로 도배되는 사이 미국에서…
윤석열 대통령에 대한 탄핵 소추안 투표가 오늘 진행됩니다. 첫 번째 투표는 국민의힘 의원들이 집단으로 투표에…
윤석열 대통령의 계엄령 선포와 해제 이후 미국 언론도 한국에서 일어나는 정치적 사태에 큰 관심을 보이고…
트럼프 2기 행정부가 출범하면 미국과 중국의 관계가 어떻게 될지에 전 세계가 촉각을 곤두세우고 있습니다. 안보…