차원이 다른 구글 번역기의 도래 (10)

2017년 1월 25일 | By: ingppoo | IT, 세계 | No Comment

구글이 인간의 신경망을 본뜬 인공신경망에 딥러닝을 적용해 지금까지 우리가 알던 번역기와는 차원이 다른 인공지능 번역기를 선보였습니다. 지난달 14일 새로운 구글 번역기를 집중적으로 분석한 뉴욕타임스의 기사 “The Great A.I. Awakening”을 소개합니다.

처음부터 보기

9부 보기

7. 이론이 하나의 제품이 되기까지

그때까지만 해도 신경망 번역 프로젝트를 진행하는 사람은 슈스터와 인턴으로 합류했던 우, 첸까지 단 세 명뿐이었다. 하지만 휴즈가 기존의 구글 번역팀을 재편해 신경망 번역 프로젝트를 지원하면서 인력난은 단번에 해결됐다. 매주 수요일 오후 2시, 구글 브레인 팀이 쓰는 건물 내 석영 호수(Quartz Lake)라 불리는 방에서 슈스터가 주재하는 회의가 열렸다. 10~20명의 팀원이 근무 일정이나 회의 주제에 따라 돌아가며 회의에 참석했는데, 휴즈와 코라도가 회의에 가보면 방 안에 있는 사람 중에 영어를 모국어로 쓰는 사람은 자기들밖에 없었다. 회의에 온 엔지니어들의 모국어는 중국어, 베트남어, 폴란드어, 러시아어, 아랍어, 독일어, 일본어까지 다양했다. 물론 이들은 컴퓨터 엔지니어다 보니 수학 공식이나 코드로 업무에 필요한 소통을 하는 게 더 효율적이었겠지만. 구글에서 열리는 회의는 대개 누군가 주도하는 법이 없다. 하지만 이 회의만큼은 슈스터가 주도하는 게 겉에서 보기에도 명확했다.

다만 팀을 새로 짠 상황에서도 새 팀이 정확히 무엇을, 어떤 일부터 해야 하는지는 정해진 게 없었다. 언젠가 슈스터는 내게 이렇게 말했다.

“신경망 번역에 관한 이야기는 처음부터 끝까지 불확실성에 관한 이야기라고 보시면 돼요. 소프트웨어, 데이터, 하드웨어, 사람까지 마치 광활한 뻘밭에서 허우적대는 느낌이었달까요? 엄청 열심히 무언가에 매달려도 고작 이 정도밖에 안 보일 때가 많았죠.”

그는 좁은 어깨와 길고 가는 팔을 구부렸다 펴가며 헤엄치는 시늉을 하더니 앞날을 가늠할 수 없었다는 말을 할 때는 손을 가슴에서 약 30cm 떨어진 곳에 두고 말을 이었다.

“어딘가에 우리가 목표로 삼은 지점이 있긴 할 텐데, 저기 어딘가에 말이죠. 그런 생각만 계속했죠.”

구글의 대부분 회의실에는 영상통화용 모니터가 있다. 일정 시간 사용 안 하는 모니터에는 절전 모드 혹은 화면 보호 기능으로 고해상도 사진이 나온다. 울창한 숲의 아침, 오로라처럼 초현실적인 대자연의 모습이나 옛날 독일 의회처럼 역사적인 사진들이다. 슈스터는 그런 사진 가운데 하나에 담긴 밤에 조명을 받아 밝게 빛나는 워싱턴 기념비를 가리키며 말했다.

“밖에서 볼 때는 우리 팀원 전체가 저렇게 밝고 선명한 가이드라인을 따라 착착 일하는 것처럼 보일 거예요.”

여기까지 이론을 정립하고 가다듬어가며 모두가 안 된다는 실험을 거듭해 길을 개척해온 것만 해도 실로 지난한 과정이었다. 하지만 이론을 실제 세상에 내놓을 서비스로 만들어가는 일도 절대 간단한 것이 아니었다. 학계의 몇몇 과학자들은 최종 단계야 학문적으로는 어려울 것 없는, 그저 “엔지니어들의 몫”이라고 쉽게 생각할지 모르지만 그렇지 않다. 우선 기계에 입력하는 원본 데이터가 좋은 데이터여야 한다. 인공지능 신경망이 수십억 개 단어를 읽는 과정이 학습인데, 학습 자료는 헤밍웨이의 소설 속 지문처럼 적당히 복잡한 완성된 문장들이다. 대중에 공개된 자료 가운데 선택된 것도 있는데, 같은 내용을 영어와 프랑스어로 동시에 기록한 캐나다 의회의 수백만 페이지에 달하는 의사 기록이 대표적이다. 하지만 지난 10년 동안 참여번역과 같이 사람이 직접 옮긴 문장이나 표현이 기본 데이터의 대부분이었다. 구글 번역팀이 데이터로 갖고 있던 모든 영어 단어 수는 무려 9천7백만 개였다. 하지만 이모티콘이나 오·탈자, 같은 단어를 빼고 나니 데이터로 사용할 수 있는 어휘 수는 약 16만 개로 줄어들었다.

소비자들이 무엇을 원하는지, 어떤 수준의 번역에 만족해할지 정확히 파악하는 일도 중요한 과제였다. 깔끔한 문장, 매끈한 표현처럼 우리가 흔히 생각하는 좋은 문장, 좋은 번역의 요건은 막상 구글 번역기를 실제로 쓰는 이용자들이 꼽는 우선순위가 아닐 때가 많다. 많은 사람은 복잡한 문장까지 완벽하게 번역해주기를 바라지 않는다. 이들이 원하는 건 뜻밖에 간단한 표현, 얼마 안 되는 단어들이다. 또한, 신경망이 이용자들이 던지는 질문을 제대로 처리할 수 있게 하려면 처음부터 신경망을 제대로 훈련해야 한다. 신경망은 학습한 데이터를 낱낱이 분석하고 흡수하기 때문에 데이터가 어떤 내용인지 적나라하게 드러날 수밖에 없다. 휴즈는 이렇게 설명했다. “신경망 번역은 주어진 데이터에서 뽑아낼 수 있는 걸 다 뽑아내고 모조리 배워요. 모든 걸 처음 배우는 갓난아기 같죠. ‘아빠는 화나면 저렇게 말하는구나!’하고 따라 하면 안 되니 아이 앞에선 항상 말조심하잖아요? 똑같은 이치라고 보시면 됩니다.”

하지만 역시 관건은 소비자가 어떤 문장의 번역을 요청했을 때 얼마나 빨리, 신뢰할 만한 수준의 정확한 번역을 내놓느냐에 달려 있었다. 속도나 정확성에서 소비자가 만족하지 못한다면 그 자체로 불합격이었다. 2월에 열 단어로 된 문장을 번역하는 데 10초가 걸렸다. 소비자에게 이렇게 굼뜬 번역기를 선보일 수는 없었다. 번역팀은 일부 소비자들을 대상으로 얼마나 기다릴 수 있을지 측정하는 실험을 했다. 소비자들의 인내심을 측정해보고자 일부러 번역 결과가 늦게 나타나도록 해봤는데, 평소보다 두 배, 심지어 다섯 배나 시간이 더 걸려도 소비자들은 크게 개의치 않았다. 하지만 여덟 배가 느려지자 소비자들은 느린 속도를 눈치채고 불만을 표했다. 모든 언어에서 마찬가지일지 따로 확인할 필요는 없었다. 프랑스어나 중국어처럼 번역 수요가 많은 언어는 특히 조금이라도 지체되어선 안 됐고, 그보다 사용량이 적은 언어는 정확한 번역 결과를 얻기 위해서라면 조금 처리가 지연돼도 괜찮다고 생각하는 소비자들이 많았다. 소비자들이 구글 번역기 창을 닫고 경쟁사의 다른 서비스를 이용하지만 않는다면 괜찮은 일이었다.

슈스터는 나중에 솔직히 번역 속도를 높일 수 있을지 확신이 없었다고 인정했다. 그는 마이크로키친에서 첸에게 이렇게 말했던 것도 기억하고 있다. “분명히 속도를 높일 수 있는 방법이 있을 텐데, 우리가 그게 도대체 무엇인지 아직 파악을 못 했어. 그게 무엇인지 정말 모르겠네.”

그래도 신경망을 더 많이, 완벽하게 훈련하기 위해 신경망 전용 그래픽 처리장치인 GPU가 더 필요하다는 건 알고 있었다. 휴즈가 구글 본사에 GPU 1천 개를 지원해달라고 요구하자는 의견을 냈을 때 슈스터는 2천 개를 받자고 했다. 이틀 뒤 GPU 2천 개가 설치됐다.

4월이 되자, 처음 세 명이던 신경망 번역팀은 이제 팀원 30명 이상을 갖춘 작지 않은 부서가 됐다. 쿽 레처럼 브레인 팀에서 차출된 사람도 있었지만, 대부분은 기존 구글 번역팀 출신이었다. 5월에 휴즈는 각각의 언어 묶음마다 담당자를 임명했다. 이들은 각각 자신이 맡은 언어의 번역 성과를 평가표에 입력하고 공유했다. 항상 적어도 20명 이상이 각자 맡은 언어의 번역 기능을 일주일에 걸쳐 실험하고 있었고, 예상치 못한 문제가 발생하면 이를 기록한 뒤 함께 해결책을 찾았다. 하루는 갑자기 신경망이 뚜렷한 이유도 없이 문장에 포함된 모든 숫자를 삭제해 버리기도 했다. 어떤 의미에서 일촉즉발의 상황이 몇 달 동안 지속됐다. 슈스터는 이렇게 말했다. “사람들이 거의 악을 쓰기 직전이었죠.”

늦봄이 되자 몇몇 성과가 나타났다. “단어별 분석(word-piece model)”, “번역 범위 제한(coverage penalty)”, “길이 규격화(length normalization)” 등 새로운 기준을 정해 번역을 검토했다. 부문별로 조금씩 번역이 나아졌고, 무엇보다 전체를 하나로 놓고 보면 문장은 눈에 띄게 개선됐다. 그런데 규격화된 모델을 정해놓고 보니 시간을 두고 계속 나아지는 건 여러 언어를 포괄하는 단 한 가지 모델이었다. 그때까지만 해도 번역팀은 각각의 장점을 뽑아 기록해가며 150개가 넘는 다양한 모델을 혼용하고 있었다. 그래도 머신러닝을 통해 자동으로 일을 처리하는 기계를 만드는 과정에 이렇게 많은 사람의 시간과 수고가 든다는 역설은 사실 큰 문제는 아니었다. 이들이 한 일 대부분이 직감적인 작업이었다. 단계마다 얼마나 많은 뉴런을 썼는지? 1,024개였는지 512개였는지? 몇 단계 작업을 했는지? 한 번에 몇 문장을 입력했는지? 얼마나 오래 학습했는지? 슈스터는 내게 말했다.

“수백, 수천 번 실험을 해보고 나서야 일주일 정도 해보면 그 실험은 그만해도 된다는 결론을 얻었어요. 항상 언제 그만해야 할지 정하는 게 고민이잖아요. 이 정도면 할 만큼 했다는 걸 어떻게 알까요? 사실 누구도 알 수 없어요. 완벽한 머신러닝 메커니즘이란 없죠. 기계를 훈련하다가 어느 지점에는 그만둬야 해요. 전체 시스템이 원래 그렇게 짜여 있어요. 어떤 사람들은 이 사실을 도저히 못 받아들입니다. 예술적인 요소가 있달까요? 몇 번의 붓 터치로 부족했던 부분을 살려낼 수 있어요. 시도하고 실험하고 훈련하는 게 중요한 것일 뿐 완벽한 상태나 최종 목표는 없어요. 누군가는 이런 일을 더 잘하고 누군가는 잘 못 할 수 있는 거죠.”

구글 브레인 팀은 5월 들어 소비자에게 선보일 수 있는 수준의 속도를 위해서는 제프 딘이 요청했던 특수목적 칩인 TPU(텐서 처리장치, tensor processing units)에서 번역기를 실행하는 방법밖에 없다는 결론에 이르렀다. 첸은 이렇게 말했다. “하지만 코드가 TPU와 호환이 될지도 모르는 상태였어요. 다만 TPU가 아니면 도저히 방법이 없겠다는 점에 모두가 동의했죠.” 그는 딘에게 TPU에서 실험해볼 수 있게 해달라고 요청했고, 딘은 그렇게 했다. 하지만 TPU는 우려대로 바로 원하는 대로 작동하지 않았다. 우는 구글 하드웨어 팀 사람들과 함께 두 달 동안 원인을 찾았다. 그들은 모델에 손을 대는 대신 칩의 오류를 찾아 개선할 수 있는 데까지 개선했다. 신경망 프로젝트는 결국 전체 인프라 투자를 결정하는 데 핵심적인 기준이 될 작업이었다.

6월 어느 수요일, 그날도 석영 호수 회의실에서는 주간 회의가 열렸다. 그날 구글 번역팀원 모두의 관심은 단연 바이두가 발표한 연구 논문에 쏠렸다. 슈스터의 입에 모두의 이목이 쏠렸다. “다들 아시다시피 바이두가 논문을 발표했죠. 마치 누군가 우리 어깨너머로 우리가 매달려있는 작업을 보기라도 한 것처럼 프로젝트 구조도, 연구 성과도 상당히 비슷해요.” 바이두가 공개한 블루 스코어(BLEU scores)는 구글이 서너 달 전 자체 실험에서 얻은 점수와 거의 비슷했다. 레는 당황하지 않았다. 오히려 레는 구글이 지금 가는 방향이 맞는 방향이라는 확신이 생겼다고 말했다.

구글은 먼저 논문을 발표해 더 뛰어난 성과를 알리고 경쟁자의 기를 꺾을 수도 있었다. 팀원들도 이 사실을 알았지만, 슈스터의 생각은 달랐다. “서비스를 선보이는 게 논문을 발표하는 것보다 훨씬 중요하지 않겠습니까? ‘아, 그거 사실 내가 먼저 했던 건데’ 이렇게 말하는 사람들 있는데, 먼저 생각했고 먼저 아이디어 냈다고 훗날 누가 알아주나요? 제대로 실행하는 게 우선입니다.”

어쨌든 이런 슈스터의 일관된 기조 때문에라도 구글은 더 좋은 서비스를 누구보다도 먼저 내놓아야 했다. 휴즈는 오래전부터 업그레이드된 제품을 소리소문없이 출시하고 소비자의 반응을 살펴보는 환상을 품고 있었다. 그들은 아무런 예고도 없이 서비스를 출시한 뒤 소셜미디어에 갑자기 똑똑해진 구글 번역기 이야기가 퍼지는지 기다렸다.

노동절 이틀 뒤인 9월 7일 오후 5시 36분, 중국어-영어 신경망 번역 서비스를 전체 이용자의 10%에 한해 역시 아무런 공지 없이 선보이기 1분 전에 휴즈는 말했다.

“새로운 번역기가 여러분 곁에 왔노라고 아직 말하고 싶지 않아요. 먼저 새로운 시스템이 잘 돌아가는지 직접 확인하고 싶기도 하고요, 이상적인 건 트위터에 구글 번역기 말도 안 되게 정확해졌다는 트윗이 넘쳐나는 상황이죠.” (뉴욕타임스)

원문보기

11부 보기

다음은 오늘 소개한 부분의 영어 원문을 구글 번역기가 우리말로 옮긴 것입니다. (맞춤법, 띄어쓰기, 문장의 종결 어미, 고유명사 등은 일부 고쳤습니다)

—–

7. 이론은 제품이 되다

슈스터, 우 첸 – – 그때까지 신경 번역 팀은 삼명 있었다 그러나 휴즈의 지원, 광범위한 팀은 합체하기 시작했다. 그들은 석영 호수라는 뇌 건물의 코너 룸에서 오후 2시 수요일 슈스터의 지휘하에 만났다. 회의는 일반적으로 이상 12 명의 회전 주조 참석했다. 휴즈 또는 코라가 있었다, 그들은 일반적으로 단지 영어를 모국어로했다. 그들은 대부분 자신의 효율적 피진과 수학 이야기하지만 엔지니어들은, 중국어, 베트남어, 폴란드어, 러시아어, 아랍어, 독일어, 일본어 말했다. 이 회의를 실행 구글에 항상 완전히 분명하지 않지만 슈스터의 경우에 모호성이 없었다.

그들은 심지어 한 후, 수행하는 데 필요한 단계는, 전적으로 명확하지 않았다. “이 이야기는 불확실성에 대한 많은입니다 – 전 과정에 걸쳐 불확실성,”슈스터는 한 지점에서 나에게 말했다. “소프트웨어, 데이터, 하드웨어, 사람들. “- 그의 좁은 어깨에서 팔꿈치에 약간 구부러진 그의 길고 날씬한 팔을 확장 -“그것은 같았다. 진흙의 큰 바다에서 수영하고, 당신 만이 지금까지 볼 수 있습니다 “그는 팔인치에 그의 손을 밖으로 개최 그의 가슴의 앞에. “이 목표는 곳, 그리고 어쩌면이있다.”

구글의 회의실의 대부분은, 모니터 영상 채팅 할이있는 경우 초기 화면 극도 실번의 꿈의 정경 또는 오로라 나 독일의 고해상도 과포화 공개 Google+ 사진. 슈스터는 밤에 워싱턴 기념비의 결정 여전히를 보였다 패널 중 하나를 향해 몸짓.

” 외부에서보기는 모든 사람이 쌍안경을 가지고 있으며, 지금까지 미리 볼 수 있다는 것입니다. ”

학술 과학자들은 “단순한”공학으로 해제 할 수있는 부분 – – 덜 어려웠다 이미 근면과 인출되어 있지만 시도가 가능한 제품으로 바꿀했다 이론적 작업이 시점에 그들을 얻을 수 없습니다. 우선, 그들은 좋은 데이터를 훈련하고 있는지 확인이 필요했습니다. 교육의 단어를 구글의 수십억은 대부분이 헤밍웨이에서 찾을 수있는 물건의 종류와 같은 온건 한 복잡성의 완전한 문장들로 구성했다 “판독”을. 이 중 일부는 공개 도메인에 : 통계적 기계 번역의 원래 로제타 스톤은 캐나다 의회의 전체 이중 언어 기록 페이지의 수백만이었다. 그것의 대부분은, 그러나, 열정적 인 응답자에서 크라우드 소싱 된 인간의 번역을 포함하여 수집 된 데이터, 10 년에서 수집되었다. 연구팀은 “. 즉”자신의 창고에 약 97,000,000 독특한 영어를했다하지만 그들은 이모티콘과 맞춤법 오류 및 중복을 제거하면, 그들은 단지 16 만 주위의 작업 어휘를했다.

그런 다음 사용자가 실제로 자주가 사용된다 합리적으로 언어와는 매우 작은 있던, 번역 원한에 집중할했다. 많은 사람들은 구글이 발견했다, 전체, 복잡한 문장을 번역하는 서비스에 보이지 않는; 그들은 언어의 이상한 작은 파편을 번역합니다. 당신은 사용자 쿼리의 스트림을 처리 할 수 있도록 네트워크를 원한다면, 당신은 그 방향으로 방향을해야했다. 네트워크는에 훈련 된 데이터에 매우 민감했다. 휴즈는 어느 곳에서 나에게 넣어 같이 “신경 번역 시스템은 할 수있는 모든 것을 배우고있다. 그것은 유아 같아요. ‘그가 화가 때 아, 아빠는 그 단어를 말한다!’ ” 그는 웃었다. ” 당신은 조심해야합니다. ”

더 무엇보다,하지만 그들은 모든 일이 자신의 사용자가주의하지 않을 것이라고 빠르고 충분히 신뢰할 수있는 것을 확인했습니다. 월에 10 단어 문장의 번역은 10 초 걸렸습니다. 그들은 천천히 그 어떤 것도 소개하지 않을 수 있습니다. 번역 팀 허용치를 식별하기 위해 위조 지연의 형태로 사용자의 작은 비율에 대기 실험을 시작했다. 그들은 두 배 긴했다 번역, 심지어 5 배만큼, 등록 할 수 없습니다 것을 발견했다. 8 배나 둔화는 것. 그들은이 모든 언어에서 사실 확인이 필요하지 않았다. 프랑스어, 중국어와 같은 트래픽이 높은 언어의 경우, 그들은 사실상 침체를 묵인 수 없었다. 더 애매한 뭔가를 들어, 그들은 더 나은 품질을 받고 있다면 사용자가 그래서 약간의 지연으로 꺼져 무서워하지 않을 것을 알고 있었다. 그들은 그냥 포기하고 일부 경쟁 업체의 서비스로 전환하지 못하도록하고 싶었다.

슈스터, 그 부분에 대해, 그들도 충분히 빠르게 만들 수 있다면 그는 단지 몰랐 인정했다. 그는 첸로 전환하고, 상기하는 동안 마이크로 키친의 대화를 기억 “이 충분히 빨리 만들기 위해 우리가 모르는 뭔가해야하지만, 나는 그것을 할 수 있는지 모르겠어요.”

그는 그들이 이상의 컴퓨터를 필요가 있다고하지만, 알지 못했다 – “GPU는,”그래픽 프로세서는 신경 네트워크를 재구성 – 훈련.

휴즈는 그가 무슨 생각을 물어 슈스터에 갔다. “우리는 천의 GPU를 요청해야합니까?”

슈스터는 “2000 왜?”고 말했다

더 먼, 투기 미래에, 기계 번역은 아마도 인간의 언어와 일반적인 전산 시설을위한 첫 걸음이었다.

열흘 후, 그들은 추가 2000 프로세서 있었다.

두뇌 측에 르 같은 그들 중 일부, 그리고 번역의 많은 – 4 월, 세 가지의 원래 라인업은 30 명 이상이되었다. 월, 휴즈는 각 언어 쌍에 임시 소유자의 종류를 지정하고, 그들 모두는 성과 평가의 큰 공유 스프레드 시트로 결과를 확인. 주어진 시간에, 적어도 20 명이 자신의 독립적 인 일주일 간의 실험을 실행하고, 예상치 못한 문제가 들어오는대로 처리. 어느 날 모델은 분명한 이유도없이,이 문장에서 건너 온 모든 숫자를 복용하고이를 폐기하기 시작했다. 이 모든 터치이었고, 이동 개월이 있었다. “사람들은 거의 고함 있었다”슈스터 고 말했다.

늦은 봄으로 여러 가지가 함께오고 있었다. 연구팀은 “단어 조각 모델,”A “에 따르면 저하”, “길이 정상화라는 것을 도입했다.”각 부분은, 슈스터는 말한다, 어쩌면 몇 % 포인트 만 집계 그들이 상당한 효과를 가지고 결과를 향상시켰다. 모델 표준화 하였다되면 오히려 현재 사용 번역 150 다른 모델보다, 시간이 지남에 따라 개선 할 단일 다 언어 모델 일 것이다. 그러나 역설 – 학습 시스템을 통해 더 일반화 만들어진 도구, 자동화 프로세스가 공동 인간의 창의력과 노력 등의 특별한 금액을 요구하는 것이이 – 그들에 손실되지 않았습니다. 그들이 무슨 짓을했는지 너무 많은 단지 직감했다. 당신은 얼마나 많은 뉴런 층 당을 사용 했습니까? 1024 또는 512? 몇 층? 한 번에 얼마나 많은 문장을 통해 실행 했습니까? 당신은 얼마나 훈련을 했습니까?

” 우리는 실험의 수백했다, ” 슈스터는 나에게 말했다 ” 우리는 우리가 일주 후 훈련을 중지 할 수 있다는 것을 알고 있었다 때까지. 당신은 ‘ 항상 말을 다시 : 언제 우리가 중지합니까? 어떻게 내가 아는 ‘ 다 있어요? 당신은 당신이 모르는 ‘ 일 다시. 기계 학습 메커니즘을 완벽 적이 없다. 당신은 훈련해야하고, 어떤 시점에서 중지해야합니다. 그것은 ‘ 이 전체 시스템의 매우 고통스러운 성격이야. 그것은 ‘ 어떤 사람들에게는 어렵다. 그것은 ‘ 약간에게 예술이야 – 이 좋은 수 있도록 당신이 당신의 브러시를 넣어. 그것은 단지 그 일에서 비롯됩니다. 어떤 사람들은 몇 가지 더, 더 낫다. ”

월함으로써, 뇌 팀은 유일한 방법은 그들도 그들이 TPU에, 딘 요구했던 특수 목적 칩에서 실행 할 수 있다면 제품이 있다는 구현 충분히 빠르게 시스템을 만들려고 있다고 이해했다. 첸 넣어 같이 코드가 작동한다면 “우리는 알지도하지 않았다. 그러나 우리는 TPU를하지 않고, 그것이 알고 않았다 확실히 작동하지 않을했다. 우리를 위해 뭔가를 예약하십시오. “딘을 예약했다”그는 주장 하나에 딘 하나에가는 기억합니다 “. 의 TPUs 그러나, 상자 밖으로 바로 작동하지 않았다. 우 이유를 파악하기위한 시도로 다음 하드웨어 팀의 누군가에 앉아 두 달 동안. 그들은 단지 모델을 디버깅되지 않았다; 그들은 칩 디버깅했다. 신경 번역 프로젝트는 전체 인프라 투자에 대한 개념 증명 될 것이다.

유월 안에 하나 수요일, 석영 호수에서 회의에 대한 들려오로 시작 바이 용지 최근 분야의 최고 온라인 포럼에 출연했다. 슈스터는 주문 방을 가져왔다. “예, 바이두는 종이로 나왔다. 그것은 우리의 어깨를 통해 찾고 사람 같은 느낌 -. 비슷한 구조, 유사한 결과 “회사의 BLEU 점수 구글이 월과 3 월에 내부 테스트에서 달성 본질적으로 무엇인가. 르 프릴 보이지 않았다; 그의 결론은 구글이 바른 길에 있던 기호라고 보입니다. “그것은 우리의 시스템과 매우 유사하다”고 조용한 승인했다.

Google 팀은 이전에 결과를 게시 한 수 있음을 알고 아마도 그들의 경쟁을 구타,하지만 슈스터 그것을 넣어 : “런칭은 게시보다 더 중요하다. 사람들은 ‘아, 내가 먼저 뭔가했다’라고하지만 누가 결국, 관심? ”

이것은, 그러나, 그것은 필수적가 처음과 더 나은 자신의 서비스를 얻을 수 있도록했다. 휴즈는 그들은 심지어 스위치의 사용자들에게 알려하지 않을 환상을 가지고 있었다. 그들은 단지 기다릴 소셜 미디어는 광대 한 개선 사항에 대한 의혹에 불을 경우 볼 것입니다.

” 우리는 돈 ‘를 t이하고 싶은 말은 ‘ 아직 새로운 시스템을이야, ” 그는 노동절 후 오후 5시 36분 이일 저에게 1 분 그들이 말하지 않고, 자신의 사용자의 10 %로 중국에 영어를 출시하기 전에 누군가. ” 우리는 그것이 작동하는지 확인하고 싶습니다. 이상적인는 점이다 ‘ : 트위터에 폭발하는 s의 ‘ 당신은 구글이 가지고 번역 방법 멋진 봤어? ‘ “