와이컴비네이터의 샘 알트만과 테슬라 설립자인 엘론 머스크가 운영하는 인공지능 랩 오픈AI에서 근무하는 이고르 모르다치와 그 동료들은 소프트웨어 봇이 자신의 언어를 만들고 학습하는 세계를 만들어냈습니다. 그 “세계”는 언뜻 보기에 그저 이차원의 커다란 백색 화면일 뿐이며, 그 안에서 움직이는 봇들 역시 빨갛고 파란 원의 형상을 띠고 있습니다. 그러나 여기야말로 봇들이 과제를 수행하기 위해 서로를 도우며 그 과정에서 언어를 만들어내는 장소입니다.
이는 흔히 강화학습(reinforcement learning)이라 불리는 기술에 의한 것으로, 봇이 시행착오를 거듭하며 무엇이 가능하고 가능하지 않은지를 습득하여 마침내 목표에 도달하는 것입니다. 만일 특정한 행동이 목표에 더 가까이 가게 해준다면, 봇들은 그 행동을 반복합니다. 이와 유사한 과정을 거쳐 봇들은 자기들만의 언어를 만들어냅니다. 서로 “대화를 주고받는” 것이 목표에 더 가까이 가도록 돕기 때문입니다.
봇들은 가상세계를 탐험하며 습득한 개념을 무작위로 고른 뜻 없는 글자와 연결짓습니다. 이 개념엔 그들 자신과 특정한 장소 및 사물, 혹은 “가다”와 “보다” 같은 행동이 포함됩니다. 모르다치와 동료들은 이 봇들의 언어가 더욱 복잡한 형태로 발전하기를 바라고 있습니다. 물론 아직 갈 길이 멉니다만, 오픈AI의 다른 연구자는 벌써 “번역기 봇”의 개발에 착수하고 있습니다.
궁극적인 차원에서 이러한 방법은 기계가 언어를 보다 깊이 있게 이해하도록 할뿐더러 왜 언어가 존재하는지도 보여줄 수 있습니다. 언어와 관련된 인공지능 연구에서는 흔히 인간의 언어를 흉내 내는 방법만 사용해왔지, 새로운 언어를 개발하지는 않았기 때문입니다. 최근 사용되는 인공신경망 구조에서는 방대한 양의 데이터에서 패턴을 찾아내는 방식으로 사진을 인식하고 말소리를 알아듣게 하는 등 많은 발전을 이뤘으며, 이 방식은 영어로 된 대화에서 패턴을 찾아내는 데도 적용되고 있으나 아직은 완전한 성공이라 하기 어렵습니다.
UC버클리의 피터 아빌 교수는 말합니다.
“인간과 지적으로 교류하기 위해서는 단순히 통계적 패턴을 찾아내는 것만으로는 부족합니다. 사용자가 언어를 이해하는 순간은 목표를 달성하기 위해 언어를 사용할 때입니다.”
초기 인류는 생존에 필요하기 때문에 언어를 습득하고 구사하게 되었습니다. 오픈AI의 연구자들은 그와 유사한 환경을 봇에게 만들어 주어 언어를 활용하게 유도하고 있는 것입니다. 그러나 많은 인공지능 연구자들은 인공신경망을 활용한 통계적 접근이 여전히 유효하다고 보고 있습니다. “물론 [오픈AI의 연구가] 흥미로운 진전을 보여줍니다만, 아직은 시기상조라 할 수 있습니다.”
그럼에도 모르다치의 연구는 대규모의 데이터를 분석하는 것만이 유일한 방법은 아니란 사실을 보여줍니다. 시스템은 스스로 행동을 통해 배우며, 이러한 배움은 궁극적으로 전혀 다른 혜택을 가져다줄 수 있습니다. 이미 마이크로소프트나 스탠포드 등에서 봇들 사이의 협력을 촉진하는 방식으로 강화학습을 시도하고 있습니다. 모르다치가 시도하고 있듯, 다양한 방법론을 조합하는 것이야말로 새로운 성공에 이르는 길이 되지 않을까요? (와이어드)
* 뉴스페퍼민트는 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 글에 관한 해설을…
트럼프 2기 행정부 인사가 속속 발표되고 있습니다. 대부분 트럼프에게 절대적인 충성을 보여준 이들로, 기존 공화당원들…
* 뉴스페퍼민트는 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 글에 관한 해설을…
선거가 끝난 지 일주일이 다 돼 가고 있습니다. 역사적인 승리를 거둔 트럼프는 2기 행정부 출범을…
* 뉴스페퍼민트는 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 글에 관한 해설을…
미국 대선이 트럼프 대통령의 승리로 마무리됐습니다. 트럼프의 승리 요인, 해리스의 패배 요인을 분석하는 기사와 칼럼이…