차원이 다른 구글 번역기의 도래 (1)
2017년 1월 1일  |  By:   |  IT, 세계  |  2 Comments

옮긴이: 구글이 인간의 신경망을 본뜬 딥러닝을 적용해 지금까지 우리가 알던 번역기와는 차원이 다른 인공지능 번역기를 선보였습니다. 지난달 14일 새로운 구글 번역기를 집중적으로 분석한 뉴욕타임스의 기사 “The Great A.I. Awakening”은 열흘 가까이 인기 기사 1위 자리를 지키는 등 큰 반향을 일으켰습니다. 구글 번역기의 괄목할 만한 발전은 뉴스페퍼민트에도 어떤 식으로든 큰 영향을 미칠 것이 자명합니다. 이번 기사는 지금까지와는 조금 다른 방식으로 소개해보려 합니다. 저희가 문장과 문단, 문맥을 이해한 뒤 우리말로 풀어 옮긴 기존 방식의 번역과 함께 (향상된) 구글 번역기가 번역한 문장을 별도로 실어 독자분들이 비교해보실 수 있도록 글을 올리겠습니다. (고유명사를 인식하지 못해 빚어진 오타나 명백한 띄어쓰기 오류 등은 구글 번역기가 내놓은 번역을 수정해 올리겠습니다.) 저희의 번역이 매끄럽지 못하거나 오역이 있는 부분을 지적해주시면 늘 그랬듯 빠르게 반영하여 수정하도록 하겠습니다. 구글의 번역은 지금 이 순간도 계속 데이터가 쌓이며 매끄러워지고 있습니다. 번역기의 번역은 첫 번째 글을 올리기 전인 1월 1일 10시의 작업임을 밝혀둡니다. 업데이트를 반영할 때는 이를 글 머리에 표시해 두겠습니다.

—–

차원이 다른 구글 번역기의 도래

구글의 가장 인기 있는 서비스 가운데 하나인 구글 번역기가 인공지능을 본격적으로 탑재한 뒤 몰라보게 달라졌다. 머신러닝이 컴퓨터와 기술 생태계를 완전히 뒤바꿔놓을 날이 머지않았다.

 

프롤로그: 당신은 지금껏 무엇을 읽었습니까?

지난 11월 초 어느 금요일 늦은 밤, 도쿄대학의 레키모토 준 교수는 강의에 필요한 자료를 인터넷에서 찾아 정리하던 중 소셜미디어상에서 화제가 된 이야기를 접하게 된다. 인간과 컴퓨터의 상호작용에 관한 연구 분야의 권위자이기도 한 레키모토 교수의 관심을 끈 이야기는 바로 구글의 유명 서비스 가운데 하나인 구글 번역기의 성능이 하루아침에 믿을 수 없을 만큼 좋아졌다는 내용이었다. 레키모토 교수는 얼마나 대단한 발명품이 나온 건지 직접 확인해 보고자 구글 번역기를 한 번 돌려보고는 입을 다물지 못했다. 잠자리에 들어서도 번역기가 내놓은 지금껏 접한 적 없는 차원이 다른 번역문들이 머릿속을 떠나지 않았다.

레키모토 교수는 블로그에 새로운 번역기를 사용한 소회를 메모해 두었다. 그는 먼저 소설 “위대한 개츠비”의 두 가지 다른 번역본에서 같은 부분을 발췌, 비교해보기로 했다. 하나는 1957년 노자키 다카시의 번역판이고, 다른 하나는 최근에 무라카미 하루키가 번역한 버전이었다. 구글 번역기는 과연 이 소설을 어떻게 번역해 낼까? 나중에 레키모토 교수는 이메일을 통해 무라카미 하루키의 번역은 “무척 세련된 일본어이긴 하지만, 다분히 하루키다운 문장이 군데군데 눈에 띈다.”는 평을 덧붙였다. 그에 반해 구글 번역기의 번역은 일부 부자연스러운 부분이 없지 않았지만, 훨씬 의미가 명확하게 다가왔다.

레키모토 교수는 또 반대로 일본어를 영어로 옮겨보기로 했다. 헤밍웨이가 쓴 “킬리만자로의 눈” 영문본을 꺼내 들어 앞부분을 직접 일본어로 옮긴 뒤 그 일본어 번역을 다시 구글 번역기에 넣고 영어로 번역해 보았다. 그는 블로그에 두 가지 버전을 함께 올려놓고 어느 것이 헤밍웨이의 원작이고 어느 것이 그가 일본어로 옮겼다가 다시 구글 번역기를 통해 영어로 바꾼 것인지 독자들에게 맞춰보게 했다.

첫 번째 후보는

Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.

두 번째 후보는

Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.

 

영어로 옮긴 첫 번째 버전이 헤밍웨이의 원문, 두 번째가 일본어로 옮겼다가 구글이 다시 번역한 문장이다. 하지만 두 번째 문장들도 표범이란 단어 앞에 정관사 ‘the’를 빠뜨린 부분을 제외하면 명백한 문법상의 오류라 할 만한 것이 없는, 상당히 매끄러운 문장이다. 이전 구글 번역기의 수준을 잘 알고 있는 레키모토 교수는 원문에 이렇게 가까운 번역을 할 수 있게 된 비결이 궁금했다. 레키모토 교수가 아마 24시간만 일찍 같은 작업을 했다면 구글 번역기가 내놓은 번역은 다음과 같았을 것이다.

Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west, “Ngaje Ngai” in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.

(옮긴이: 단어 대 단어 수준에서 맥락을 전혀 읽지 못한 번역으로, 문법에 맞지 않고 문장 자체가 성립되지 않는 부분투성인 영어입니다.

** 참고로 이 부분을 우리말로 옮기면 아래와 같습니다.

킬리만자로는 해발 19,710피트의 눈 덮인 산으로, 아프리카에서 가장 높다고 한다. 그 서쪽 봉우리는 마사이어로 “응가예 응가이”, 즉 ‘신의 집’이라고 부른다. 서쪽 봉우리 가까운 곳에 얼어서 말라붙은 표범 사체가 있다. 이 표범이 무엇을 찾아 그 높은 곳까지 왔는지 아무도 그 이유를 알지 못한다. – 정영목 옮김, 문학동네 –

 

레키모토 교수는 이 놀라운 발견을 트위터에 올렸다. 레키모토 교수의 팔로워들을 시작으로 삽시간에 수많은 사람이 완전히 달라진 기계 번역의 등장이 정말로 깜짝 놀랄 만한 일이라는 트윗을 올렸다. 장족의 발전을 이룬 부분도 있었고, 아직 실소를 자아내는 부분도 있긴 했다. 다음날 동이 틀 무렵 ‘구글 번역기’는 일본 트위터상에서 두터운 팬층을 거느리고 있는 애니메이션 시리즈와 인기 있는 소녀 아이돌 그룹의 오랫동안 기다린 새 싱글 앨범 발매 소식을 모두 제치고 단연 ‘실검 1위’였다. 도대체 구글 번역기에 무슨 마법이 일어났길래 하룻밤 새 이렇게 예술적인 경지에 이르렀는지 모두가 궁금해했다.

나흘 뒤 구글 런던 지사 사무실. 기자, 사업가, 광고 업계 종사자 수백 명을 초대한 구글은 새로운 번역기에 건 마법의 실체를 공개했다. 이날 행사에 초대받은 사람들에겐 여러 나라말로 번역된 쪽지가 든 포춘쿠키가 하나씩 주어졌다. 내가 받은 포춘쿠키 안에 든 종이의 한쪽에는 노르웨이 말로 무언가가 쓰여 있고, 다른 쪽에는 구글 번역기 앱을 다운받을 수 있는 초대장이 인쇄돼 있었다. 손님들에게 제공된 도넛과 스무디 등 음식의 맛도 독일어(zitrone), 포르투갈어(baunilha), 스페인어(manzana) 등 다양한 언어로 표현돼 있었다. 우리는 안락하고 어두운 극장으로 안내를 받고 들어섰다.

사디크 칸 런던 시장이 행사 모두 발언에 나섰다.

“얼마 전에 제 친구 한 명이 저를 보면 구글이 생각난다고 하더군요. 혹시 제가 모든 일에 답을 알고 있어서 그런 것이냐 물었더니, 친구가 하는 말이 그게 아니라 제가 마치 구글처럼 항상 대화를 끝내버려서 그렇다더군요.”

청중 사이에 옅은 웃음이 퍼졌다. 칸 시장은 구글의 최고경영자 순다 피차이를 소개하며 발언을 마쳤다.

피차이는 런던 킹스크로스에 구글이 야심 차게 개발하고 있는 소위 “지식 발전소” 구역의 주춧돌이 될 새 건물의 완공을 기념하고자 런던에 왔다. 또한, 지난해 자신이 발표한 구글의 미래 발전 계획의 첫 단추를 성공적으로 끼웠다는 사실을 발표할 계획이었다. 피차이는 미래의 구글이 “인공지능을 선도하는, 인공지능 중심” 기업이 될 것이라고 여러 차례 밝혔다. 이는 사실 이론적으로는 꽤 복잡한 사안인지라, 발언이 나올 때마다 해석이 분분했다. 현실적인 관점에서 보면 이는 결국 머지않아 구글의 주력 서비스가 전통적인 컴퓨터 프로그래밍의 산물이 아니라 머신러닝, 즉 기계학습에 의한 것으로 대체된다는 뜻으로 풀이된다.

구글 안에서도 소수 정예만 몸담고 있는 구글 브레인(Google Brain) 팀이 생긴 건 5년 전의 일이다. 구글 브레인에는 마치 갓난아기가 시행착오를 반복하며 세상을 배워가듯 주변 상황을 익히고 스스로 지식과 경험을 쌓는 “인공 신경망”이 마침내 진짜 인간이 할 수 있는 일에 버금가는 무언가를 만들어낼 수 있다는 기대로 뭉친 이들이 몸담고 있다. 사실 이런 의견은 전혀 새로운 것이 아니다. 1940년대 현대적인 컴퓨터를 처음 만들 때 과학자들은 기본적으로 비슷한 생각을 하긴 했다. 하지만 진지하게 이를 기술적으로 구현하는 문제에 맞닥뜨리면 그동안 많은 컴퓨터과학자는 이를 먼 미래에나 가능한, 당장은 불가능한 미션으로 간주하곤 했다. 하지만 첫걸음을 내디딘 2011년부터 구글 브레인은 인공지능을 기반으로 한 새로운 도전이 지난 수십 년간 노정된 기술적 한계를 뛰어넘을 혁신으로 이어질 수 있다는 믿음 아래 달려왔다. 음성인식 기술은 구글 브레인 팀이 손을 댄 뒤 정확도가 훨씬 높아졌다. 안드로이드에서 머신러닝을 장착한 구글의 음성인식 기능은 사람이 듣고 받아적는 것에 거의 뒤지지 않는다. 구글 브레인은 올해 초 소비자 제품 전반에 일대 혁신을 일으킬 만한 개발에 착수했고, 이날 그 역사적인 첫 결과물을 구체적으로 발표했다. (뉴욕타임스)

원문보기

2부 보기

 

다음은 오늘 소개한 부분의 영어 원문을 구글 번역기가 우리말로 옮긴 것입니다. (맞춤법, 띄어쓰기, 고유명사 등은 일부 고쳤습니다)

—–

위대한 AI 각성

Google이 인공 지능을 사용하여 인기있는 서비스 중 하나 인 Google 번역을 변형시키는 방법과 컴퓨터 학습을 통해 컴퓨팅 자체를 재발견하는 방법

 

 

프롤로그 : 당신은 무엇을 읽었습니까?

11 월 초 금요일 늦은 밤, 도쿄 대학에서 인간 – 컴퓨터 상호 작용의 뛰어난 교수인 레키모토 준은 소셜 미디어에 등장하는 특이한 소식을 알기 시작하면서 온라인으로 강연을 준비했다. 명백하게 회사의 인기있는 기계 번역 서비스 인 Google 번역은 갑자기 거의 상상할 수 없을 정도로 향상되었다. 레키모토는 Transl 자신을 방문하여 실험을 시작했다. 그는 놀랐다. 그는 잠들었어야했지만, 번역은 그의 상상력을 되찾기를 거부했다.

레키모토는 블로그 게시물에 자신의 초기 연구 결과를 썼다. 먼저 그는 “The Great Gatsby”의 두 가지 출판 버전인 다카시 노자키의 1957 년 번역본과 무라카미 하루키의 최신작과 몇 가지 문장을 이 새로운 Google 번역본이 만들 수 있었던 것과 비교했다. 하루키의 번역은 “매우 세련된 일본어”로 쓰여졌다. 레키모토는 이메일을 통해 나에게 나중에 설명했지만 산문은 “Murakami-style”이라고 한다. 대조적으로 Google의 번역은 “약간의 부자연 스러움”에도 불구하고 “더 투명합니다 . ”

레키모토 지위의 후반부는 일본어에서 영어로 다른 방향으로 서비스를 조사했다. 그는 헤밍웨이의 “킬리만자로의 눈”에 대한 개막에 대한 자신의 일본 해석을 버리고 그 문장을 구글을 통해 영어로 돌려 보냈다. 그는 헤밍웨이의 원본과 함께 이 버전을 출간했으며 독자가 기계의 작동을 추측하도록 유도했다.

첫 번째 후보는

Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.

두 번째 후보는

Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.

심지어 영어 원어민에게도, 표범에 대한 누락된 기사는 2 번이 자동 장치의 결과물인 유일한 실제 선물이다. 그들의 친밀감은 레키모토에게 경이의 원천이었다. 그는 이전 서비스의 능력에 대해 잘 알고 있었다. 겨우 24시간 만에 구글은 다음과 같은 일본어 통역을 번역했을 것이다.

Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west, “Ngaje Ngai” in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.

 

레키모토는 그의 발견을 트위터에서 수십만 명의 추종자에게 홍보했으며 앞으로 수 시간 동안 수천 명의 사람들이 기계 번역 서비스를 통해 자신의 실험을 방송한다. 어떤 것은 성공했고, 다른 것은 주로 만화 효과를 의미했다. 새벽이 도쿄를 돌파하자 Google 트로이는 일본의 트위터에서 1 위를 차지했으며 일부 컬트 애니메이션 시리즈와 소녀 아이돌 슈퍼 그룹에서 오랫동안 기다려온 새로운 싱글이다. 모두가 궁금해하는 바 : Google 번역은 어떻게 대단히 교묘하게 교묘하게 만들어 졌을까?

나중에 4 일, 세계 각지에서 백 언론인, 기업가와 광고주의 부부는 특별한 발표에 대한 구글의 런던 엔지니어링 사무실에서 모였다. 손님은 번역 브랜드 포춘 쿠키로 인사했다. 그들의 논문은 한쪽에 외국어가 있었는데 – 광산은 노르웨이어에 있었고 다른 쪽은 번역 앱을 다운로드하라는 초대장이었다. 테이블은 도넛과 스무디의 트레이, 독일어 (zitrone)에서 그 맛을 광고 현수막, 포르투갈어 (baunilha), 스페인어 (manzana)으로 표시 각각 설정했다. 잠시 후 모든 사람들이 봉제되고 어두운 극장으로 안내 받았다.

런던 시장 사디크 칸은 몇 가지 개회사를 했다. 친구가 시작한 그는 최근에 그에게 구글에 대해 상기시켰다. “왜 내가 모든 대답을 알고 있느냐?”시장은 물었다. “아니,”친구는 “당신이 항상 내 문장을 끝내려고하기 때문에”라고 대답했다. 군중들은 정중하게 말했다. 칸은 Google의 CEO인 순다 피차이를 소개함으로써 결론을 맺었다.

피차이는 부분적으로는 킹스 크로스에 건설중인 새로운 “지식 영역(knowledge quarter)”의 초석 인 Google의 새 건물을 개설하기 위해 런던에 있었으며 작년에 발표한 회사 변화의 초기 단계 완성을 공개했다. 피차이가 여러 차례 발표한 미래의 Google은 “AI 우선”이 될 것이다. 이론에서 의미하는 것은 복잡하고 많은 추측을 환영했다. 행운을 가지고 실제로 의미하는 바는 곧 회사의 제품이 더 이상 전통적인 컴퓨터 프로그래밍의 열매, 정확하게는 “기계 학습”을 대표하지 않을 것이라는 것이었다.

회사 내부의 희귀한 부서인 Google Brain은 5 년 전 이 원칙에 따라 설립되었다. 즉 유아가 하는 것처럼 시행 착오를 통해 세계와 친숙한 인공적인 신경 네트워크가 인간의 유연성과 같은 것을 개발할 수 있다는 것이다. 이 개념은 새로운 것이 아니다. 1940 년대 현대 컴퓨터 시대의 초기 단계로 거슬러 올라간다. 그러나 대부분의 컴퓨터 과학자들은 그것을 모호하고 평판이 좋지 않은 것으로 보았다. 하지만 2011년 이래로 Google Brain은 인공 지능에 대한 이러한 접근 방식으로 수십 년의 전통적인 노력을 혼란스럽게 만든 많은 문제를 해결할 수 있음을 입증했다. 브레인이 그것을 개조하려는 노력을하기 전까지는 음성 인식이 잘 작동하지 않았다. 기계 학습의 응용 프로그램은 인간의 필사본만큼이나 좋은 Google 모바일 플랫폼 인 Android에서 성능을 발휘했다. 이미지 인식에 대해서도 마찬가지였다. 1 년 전만 해도 처음으로 브레인은 전체 소비자 제품의 용기 개조로 시작되었으며 그 결과는 오늘 밤에 기념되었다.

2부 보기