차원이 다른 구글 번역기의 도래 (2)

2017년 1월 3일 | By: ingppoo | IT, 세계 | 1 comment

옮긴이: 구글이 인간의 신경망을 본뜬 딥러닝을 적용해 지금까지 우리가 알던 번역기와는 차원이 다른 인공지능 번역기를 선보였습니다. 지난달 14일 새로운 구글 번역기를 집중적으로 분석한 뉴욕타임스의 기사 “The Great A.I. Awakening”을 소개합니다.

1부 보기

구글 번역기가 첫선을 보인 건 2006년의 일이다. 이후 구글 번역기는 구글의 주력 서비스 가운데 하나이자 가장 인기 있는 자산으로 자리매김했다. 현재 매달 5억 명이 구글 번역기를 사용하고, 매일 1,400억 개의 단어가 구글 번역기를 통해 다른 나라말로 옮겨진다. 구글 번역기 그 자체의 쓰임새만 중요한 것이 아니라, 지메일이나 크롬 등 자동 번역 기능 덕분에 여러 언어로 서비스가 제공되는 구글의 다른 디지털 서비스에도 구글 번역 기술이 쓰인다. 순다 피차이는 새로운 구글 번역기를 소개하면서 구글도 회사 차원에서 번역 기술과 작업이 지정학적으로 무척 중요하다는 사실을 절감한 지 얼마 되지 않았다고 말했다. 그러면서 아랍어와 독일어 사이의 번역 사용량이 다섯 배나 급증한 최근의 구글 번역기 이용 기록 그래프를 제시했다. (번역은 수십 가지 다른 언어를 쓰는 사람들이 한 나라 국민으로 사는 인도에서 자란 피차이 본인에게 평생의 과제와 같은 것이기도 하다) 구글은 출시 이래 꾸준히 새로운 언어와 기능을 추가해 왔지만, 지난 4년간 특히 번역의 질은 좀처럼 높아지지 못했다. 일종의 정체기가 찾아온 것이다.

마침내 구글은 정체기를 뛰어넘는 혁신의 첫걸음을 내디뎠다. 12월 첫째 주 기준 이미 구글 번역기는 미국과 유럽, 아시아 등지에서 인공지능 시스템을 기반으로 한 새로운 버전으로 바뀌었다. 영어와 스페인어, 프랑스어, 포르투갈어, 독일어, 중국어, 일본어, 한국어, 그리고 터키어에 먼저 인공지능 신경망 번역이 적용됐고, 총 1백여 개 언어가 2017년 동안 매달 여덟 개꼴로 추가될 예정이다. 새로운 아이디어가 현실이 되기까지 걸린 시간은 불과 아홉 달. 이는 기술을 개발하고 혁신을 이뤄낸 구글의 엔지니어들에게조차 무척 놀라운 속도였다. 새로운 인공지능 번역은 거의 하룻밤 새 구글 번역기가 출시된 이래 지난 10여 년간 이룩한 발전에 맞먹는 성능 개선을 이뤄냈다.

피차이는 모호하고 다소 난해하기도 한 문학적 표현을 즐겨 쓴다. 한 달 전 피차이는 캘리포니아 마운틴뷰에 있는 사무실에서 나와 마주 앉아 구글 번역기가 필요한 이유에 관해 모든 사람이 힌두교의 성전이자 철학서인 바가바드 기타를 원문으로 읽고자 산스크리트어를 직접 배웠던 물리학자 로버트 오펜하이머 같을 필요는 없기 때문이라고 말했다.

다시 런던에서 열린 구글의 행사장. 발표하는 피차이의 뒤로 화면에 아르헨티나 소설가이자 시인인 호르헤 루이스 보르헤스의 유명한 문구가 소개됐다. “Uno no es lo que es por lo que escribe, sino por lo que ha leído.”

피차이는 얼굴에 웃음을 머금은 채 먼저 구식 구글 번역기가 해당 스페인어 문장을 번역한 영어를 읽어 내려갔다. “One is not what is for what he writes, but for what he has read.”

이어 새로운 인공지능 신경망 번역으로 옮긴, 훨씬 매끄러운 영어가 소개된다. “You are not what you write, but what you have read.”

(옮긴이: 우리말로 옮기면, “당신을 규정하는 건 당신이 지금 쓰고 있는 글이 아니라 당신이 지금껏 읽어온 것들” 정도의 뜻이 됩니다)

호르헤스의 말은 새로운 구글 번역기의 도래를 선언하는 데 더없이 적절한 인용구이기도 했다. 구글 번역기는 어떤 의미에서는 모든 것을 읽어낼 수 있는 기계에서 처음으로 실행됐기 때문이다.

사실 구글이 인공지능에 회사의 미래를 걸고 머신러닝에 주력하겠다는 발표를 내놓았을 때만 해도 인공지능이나 머신러닝은 많은 이들에게 전혀 와 닿지 않는 이야기였다. 구글은 특히 지난 4년간 페이스북, 애플, 아마존, 마이크로소프트, 그리고 중국 기업인 바이두와 함께 인공지능 기술 개발에서 치열한 경쟁을 벌였다. 인재의 영입을 두고 기업들끼리는 물론이고 이들 기업과 대학 연구소들 사이에 각축전이 벌어지기도 했다. 높은 금전적 보상과 연구 지원, 연구의 자율성을 좇아 인재들이 점점 기업으로 몰려들었다. 페이스북이 그해 가장 촉망받는 우수 인재를 영입해올 때 CEO인 마크 주커버그가 직접 전화를 걸거나 화상 통화를 해 비전을 설명하고 전폭적인 지원을 약속한다는 건 실리콘 밸리에서 알 만한 사람은 다 아는 이야기다. 첫 연봉으로 억대가 아니라 0이 하나 더 붙은 10억 대 연봉을 받는 일도 있다. 인공지능 분야의 주요 학술 컨퍼런스 참가자는 과거에 비해 네 배나 늘어났다. 인공지능을 바탕으로 한 혁신은 그저 새로운 세부사항이나 기술적인 특징이 하나 덧붙는 정도가 아니다. 대신 모든 곳에 적용이 가능한, 완전히 새로운 인공지능을 토대로 세상의 판을 다시 짜는 일이다.

“인공지능”이라는 단어 자체가 이미 그 뜻이 자명해 보이긴 하지만, 사실 인공지능만큼 해석에 있어 혼선과 논란을 불러온 개념을 찾기도 쉽지 않다. 당신이 지금 1970년대로 돌아가 길거리에서 지나가던 누군가를 불러세워 놓고 주머니에서 스마트폰을 꺼낸 뒤 구글 지도를 보여준다고 상상해 보시라. 물론 정신 나간 사람 취급을 받거나 이상한 물건으로 속임수를 쓰는 사기꾼으로 오해받아도 이상할 것이 전혀 없겠지만, 어찌어찌 하여 당신이 주머니에서 꺼낸 작은 기계가 악마의 소품 같은 것이 아니라 아폴로호를 달에 보냈던 컴퓨터보다 더 성능이 좋은 기계라는 걸 설득했다고 가정해 보자. 1970년대를 사는 사람들의 눈에는 스마트폰의 구글 지도야말로 최첨단 인공지능처럼 느껴질 것이다. 실제로 구글 지도는 지도를 볼 줄 아는 사람이 다른 사람에게 길을 알려주듯 길을 알려주고 장소를 찾아주니, 엄밀히 따지면 인공지능이 맞다. 길을 찾는 작업을 수행하는 속도가 사람보다 훨씬 빠르고 정확하다는 특징이 있긴 하다. 또한, 실시간 교통 정보를 반영하거나 길을 잘못 들었을 때 경로를 바로 다시 탐색해 설정하는 일 같은 경우 사람이 사실상 하기 어려운 작업이다.

하지만 오늘날 우리는 구글 지도나 다른 내비게이션 앱을 가리켜 위대한 인공지능이라고 칭송하지 않는다. 우리가 원래 지능이라는 단어 자체를 쓰는 데 인색하기도 하거니와, 무릇 인공지능이라면 사람이 절대로 할 수 없는 어떤 일을 대신해줄 수 있는 능력을 지녀야 한다고 생각하기 때문이기도 하다. 어떤 작업을 자동화하는 바로 그 순간, 그 작업을 수행하는 데 필요하던 기술은 마치 기계의 부속품처럼 되어버리고 만다. 좀 삐딱하게 묘사한다면 구글 지도는 따분한 기계 그 이상도 이하도 아니다. 그저 한 지점에서 다른 지점으로 이동하고자 하는 명백한 요구사항을 입력하면 기존에 입력된 기제에 따라 가장 효율적인 길을 찾아줌으로써 요구를 들어주는 것이 전부다. 구글 지도를 인공지능이라고 부르기에는 이미 기술을 바라보는 우리의 ‘눈높이’가 너무 높아졌다.

순다 피차이는 현재 인공지능 기술이 쓰이는 사례와 미래에 인공지능 기술을 활용해 궁극적으로 달성하고자 하는 목표를 각각 분석, 설명하면서 “범용 인공지능(artificial general intelligence)”이라는 개념을 소개한 적이 있다. 범용 인공지능은 자세히 규정된 절차에 따라 정해진 임무만 수행하는 과거의 인공지능이 진일보한 것으로, 인간처럼 사고하며 명확하지 않은 부분까지 해석하고 분석해 해결책을 낸다. 실제 범용 인공지능은 우리가 일상에서 겪는 다양한 상황에서 다양한 목표에 맞춰 어디든 쓸 수 있는 일반적인 도구로 자리 잡으리라는 것이 피차이의 예상이자 구글이 회사의 명운을 걸고 달려든 목표이기도 했다. 예를 들면 이런 식이다. 구글 지도에 지금처럼 단지 A 지점에서 B 지점으로 가는 경로를 찾아달라는 요구를 입력하는 게 아니라, “공항에 가는데 가는 길에 어디 들러서 조카에게 줄 선물을 하나 샀으면 해.”라고 말을 하면 범용 인공지능을 탑재한 구글 지도가 아주 친한 친구나 정말 일을 열심히 하는 인턴만 알 수 있는 핵심 정보를 활용하여 상세한 맞춤형 답을 내놓는 식이다. 언제 어디서나 불러낼 수 있는 일상 속 ‘스마트 비서’인 셈인데, 3년 전 스파이크 존스 감독이 연출한 영화 “그녀(Her)”에서 스칼렛 요한슨이 맡은 역할과 유사하다고 보면 된다. 공항 가는 길에 조카에게 줄 선물을 사야 하는 상황에서 핵심 정보란 조카의 나이, 어린이 선물을 사줄 때 당신이 보통 얼마를 쓰는지, 지금 시각에 문을 연 가게가 어디 있는지 등이다. 게다가 더 똑똑한 인공지능은 절친이나 최고의 인턴사원도 알 수 없는 것들까지 고려한다. 예를 들어 조카 또래의 아이들 사이에서 요즘 어떤 게 유행인지, 혹은 그 또래 아이들에게 실제로 필요한 건 무엇인지를 알려줄 수도 있다. 인공지능이 우리가 과거에 무얼 했는지에 관한 복잡한 데이터를 분석해 잘 드러나지 않는 성향이나 선호를 파악할 수 있다면, 우리가 주어진 상황에서 무엇을 원할지 정작 우리 스스로 생각해내지 못하는 것까지 인공지능이 추론하는 것도 불가능한 일이 아니다. (뉴욕타임스)

원문보기

3부 보기

다음은 오늘 소개한 부분의 영어 원문을 구글 번역기가 우리말로 옮긴 것입니다. (맞춤법, 띄어쓰기, 문장의 종결 어미, 고유명사 등은 일부 고쳤습니다)

—–

2006년에 데뷔한 이후 Google의 가장 신뢰할 수 있는 인기있는 자산이되었다. 다른 언어로 하루에 1억 4천억 단어가 필요한 5억 명 이상의 월간 사용자에게 서비스를 제공한다. 자체 독립형 앱으로 존재할뿐만 아니라 Gmail, Chrome 및 기타 Google 제품에 통합 된 기능으로 존재한다. Google은 이를 디지털 방식으로 상상할 수 없는 마찰없는 자연스럽고 푸시 버튼으로 사용한다. Pichai는 난민 위기에 처해있을 뿐이었으며, 번역사의 지정학적 중요성에 대해 회사 측은 설명했다. 그 뒤에 있는 화면에는 아랍어와 독일어 간의 번역이 최근 5 배나 증가한 그래프가 나타났다. (그것은 Pichai의 마음에 가깝고, 인도에서 자랐으며 수십 개의 언어로 나뉘어졌다.) 팀은 꾸준히 새로운 언어와 기능을 추가했지만, 지난 4 년 동안의 품질 향상은 상당히 느려졌다.

오늘까지. 이전 주말 현재, 번역은 미국뿐만 아니라 유럽과 아시아에서도 트래픽의 상당 부분을 AI 기반 시스템으로 변환되었다. 롤아웃에는 영어와 스페인어, 프랑스어, 포르투갈어, 독일어 , 중국어, 일본어, 한국어 및 터키어. 번역의 백 개 언어 중 나머지 언어는 내년 말까지 매월 8 개를 목표로 등장했다. Google의 자체 기술자가 놀랍도록 놀랐던 새 화신은 불과 9개월 만에 완성되었다. 인공 지능 시스템은 오래 전 일생 동안 발생했던 총 이익과 대략 동등한 하룻밤 향상을 나타냈다.

Pichai는 애매한 문학적 레퍼런스에 대한 애정을 가지고있다. 그는 캘리포니아 주 마운틴 뷰에있는 그의 사무실에서 한 달 전에, 누군가가 물리학 자 Robert Oppenheimer와 같을 수는 없기 때문에 번역이 존재한다고 말했다. Robert Oppenheimer는 Bhagavad Gita를 원래 읽기 위해 Sanskrit를 배웠다. 런던에서, 그 뒤에 모니터의 슬라이드는 보르헤스 견적에 가볍게 쳤다. “Uno no es lo que es por lo que escribe, sino por lo que ha leído.”

웃어넘기는 피차이는 오래된 번역 시스템에 의해 표현된 어색한 영어 버전의 문장을 소리내어 읽었다. “하나는 글을 쓰는 것이 아니라 읽은 것을 읽는 것입니다.”

그 오른쪽에는 새로운 AI 렌더링 버전이 있었다. “당신은 당신이 쓴 것이 아니고, 당신이 읽은 것입니다.”

그것은 맞는 말이었다. 새로운 Google 번역은 어떤 의미에서 모든 것을 읽는 것을 배웠던 첫 번째 기계에서 실행되었다.

AI 주위에 자신을 재구성하는 구글의 결정은 업계 전반 기계학습 정신 착란이 될 것을의 첫 번째 주요 표현했다. 지난 4 년 동안 구글, 페이스북, 애플, 아마존, 마이크로소프트, 중국 기업인 바이두 등 6 개 업체가 특히 AI 인재들에 대한 무기 경쟁을 촉발 시켰다. 자원과 자유에 대한 기업의 약속은 최고 학술 부서를 .아냈다. 실리콘 밸리에서 페이스북의 CEO 인 마크 주커 버그가 개인적으로 감독하고 전화 통화 및 화상 채팅을 통해 널리 알리고있다. 그의 회사는 가장 바람직한 대학원생으로 선발된다. 일곱 가지 인물의 시작 급여는 전례가 아니다. 현장에서 가장 중요한 학술회의 참석은 거의 4 배가 되었다. 위태로운 것은 단지 단편적인 혁신이 아니라 완전히 새로운 컴퓨팅 플랫폼인 보편적 인공 지능을 제어 할 수 있다.

“인공 지능”이라는 문구는 그 의미가 자명 한 것처럼 불려지지만, 항상 혼란과 논쟁의 원천이었다. 70 년대로 돌아가 거리에서 누군가를 중지시키고 스마트 폰을 꺼내어 Google지도를 보여 주었다고 상상해보십시오. 일단 당신이 그녀를 납득 시키면 당신은 이상하게 옷을 입은 마법사가 아니었고, 주머니에서 꺼낸 것은 검은 예술 부적이 아니라 아폴로 셔틀에 탑승 한 것보다 더 강력한 작은 컴퓨터였다. 구글 맵은 거의 확실했다. 그녀에게 “인공 지능”의 설득력 있는 예처럼 보인다. 매우 실제적인 의미에서 그렇다. 지도를 읽고 쓰는 사람이 관리 할 수 있는 모든 일을 호텔에서 공항으로 가져 오는 등의 작업을 할 수 있다.하지만 훨씬 빠르고 안정적으로 수행 할 수 있다. 또한 인간이 간단하고 명백하게 할 수없는 일을 할 수 있다. 트래픽을 평가하고, 최적의 경로를 계획하고, 잘못된 출구를 취할 때 방향을 바꿀 수 있다.

그러나 실제로 오늘날 아무도 Google지도에 명예의 “인공 지능”을 부여하지 않으므로 감정적이고 겸손한 것은 우리가 “지능”이라는 단어를 사용함에 있다. 인공 지능은 HAL을 무엇이든지간에 구별하는 것이어야 한다. 베틀이나 수레가 할 수 있다. 우리가 작업을 자동화 할 수있는 순간, 관련 기술을 단순한 메커니즘 중 하나로 다운 그레이드한다. 오늘날 Google지도는 로봇이라는 용어를 경멸적으로 본다. 단순한 요구(한 곳에서 다른 곳으로 갈 필요가 있음)를 받아들이고 가능한 한 효율적으로 그 요구를 충족 시키려고 한다. 따라서 “인공 지능”의 목표 게시물은 끊임없이 후퇴한다.

그는 조심 구분을 할 수있는 기회를 가질 때, 피차이는 AI의 현재 응용 프로그램과의 궁극적 인 목표 구별 “인공 일반 지능.” 인공 일반 지능이 암시 적으로 시설을 보여줄 것 대신에 명시 적으로 지시에 충실한 준수를 포함하지만, 하지 않는다 , 해석 적. 그것은 일반적인 목적으로 일반적인 상황에서 설계된 일반적인 도구가 될 것이다. Pichai는 그의 회사의 미래가 이와 같은 것에 달려 있다고 믿습니다. 구글 맵스에 “공항에 가고 싶지만 조카를 위해 선물을 사는 길에 들러야한다”고 상상해 보라. 좀 더 일반적으로 지능형 버전의 서비스인 유비쿼터스 조수, Sparke Jonze의 “Her”에서 3 년 전에 기억에 남는 스칼렛 요한슨이 친한 친구 또는 열렬한 인턴이 알 수 있는 모든 종류의 것들, 즉 조카의 나이와 평소 얼마나 좋아 하는지를 알 것이다. 아이들을 위한 선물에 쓰고, 오픈 스토어를 어디에서 찾을 수 있는지 알려줍니다. 그러나 진정으로 지능적인 지도는 조카 학교의 미취학 아동들 사이에서 최근에 유행한 것과 같은 친한 친구가 모르는 모든 종류의 것을 알 수 있다. 또는 더 중요한 것은 사용자가 실제로 원하는 것이다. 지능형 기계가 우리가 과거에 한 일에 관한 데이터의 복잡한 규칙성을 식별할 수 있었다면, 우리가 완전히 자신을 알지 못한다 할지라도 우리의 후속 욕구에 대해 추론할 수 있을 것이다.