차원이 다른 구글 번역기의 도래 (번외)
지난 한 달간 뉴욕타임스 매거진의 기사 “The Great A.I. Awakening”를 12편에 걸쳐 소개했습니다. 매번 그날 소개한 부분에 해당하는 구글 번역기의 번역을 글 뒷부분에 첨부했는데, 오늘은 구글 브레인이 개발한 신경망 번역기로 옮긴 해당 기사 전문을 따로 소개합니다.
앞서 첨부한 번역기의 번역은 맞춤법이나 띄어쓰기 등을 일부 수정했지만, 오늘 올리는 글은 소제목을 굵은 글씨로 바꾼 것 외에 아무런 수정도 하지 않은 것임을 말씀드립니다. 뉴스페퍼민트의 번역과 비교해보시면서 읽어보시면, 많은 부분이 다른 걸 확인하실 수 있습니다.
위대한 AI 각성
Google이 인공 지능을 사용하여 인기있는 서비스 중 하나 인 Google 번역을 변형시키는 방법과 컴퓨터 학습을 통해 컴퓨팅 자체를 재발견하는 방법
프롤로그 : 당신은 무엇을 읽었습니까?
11 월 초 금요일 밤 늦게 도쿄 대학에서 인간 – 컴퓨터 상호 작용의 탁월한 교수 인 레 키모토 (Rekimoto)는 소셜 미디어에 등장하는 특이한 소식에 주목하기 시작하면서 온라인으로 강연을 준비했다. 명백하게 회사의 인기있는 기계 번역 서비스 인 Google 번역은 갑자기 거의 상상할 수 없을 정도로 향상되었습니다. Rekimoto는 Transl 자신을 방문하여 실험을 시작했습니다. 그는 놀랐다. 그는 잠들었어야했지만, 번역은 그의 상상력을 되찾기를 거부했습니다.
Rekimoto는 블로그 게시물에 자신의 초기 연구 결과를 썼습니다. 먼저 그는 “The Great Gatsby”의 두 가지 출판 버전 인 Nozaki Takashi의 1957 년 번역본과 Haruki Murakami의 최신작과 몇 가지 문장을이 새로운 Google 번역본이 만들 수 있었던 것과 비교했습니다. 무라카미 (Murakami)의 번역은 “매우 세련된 일본어”로 쓰여졌습니다. Rekimoto는 이메일을 통해 나에게 나중에 설명했지만 산문은 “Murakami-style”이라고합니다. 대조적으로 Google의 번역은 “약간의 부자연 스러움”에도 불구하고 “더 투명합니다 . “
레키 모토 (Rekimoto) 지위의 후반부는 일본어에서 영어로 다른 방향으로 서비스를 조사했다. 그는 헤밍웨이 (Hemingway)의 “킬리만자로의 눈 (Snows of Kilimanjaro)”개관에 대한 자신의 일본 해석을 맹렬히 비췄다. 그는 Hemingway의 원본과 함께이 버전을 출간했으며 독자가 기계의 작동을 추측하도록 유도했습니다.
아니. 1:
킬리만자로는 높이 19,710 피트의 눈 덮인 산으로 아프리카에서 가장 높은 산이라고합니다. 그 서부 정상 회담은 Masai “Ngaje Ngai”라고 불리는 하원이다. 서부 정상 회담에서 가까운 곳에는 표범의 건조하고 얼린 시체가 있습니다. 표범이 그 고도에서 찾고 있던 것을 아무도 설명하지 못했습니다.
아니. 2 :
킬리만자로는 19,710 피트의 눈으로 덮인 산으로 아프리카에서 가장 높은 산이라고합니다. 서쪽의 정상 회담은 하나님의 집인 마사이에서 “응가에 응가이”라고 불린다. 서쪽 상단에는 건조하고 얼어 붙은 표범 동물이 있습니다. 아무도 표범이 그 고도에서 원하는 것을 설명하지 못했습니다.
심지어 영어 원어민에게도, 표범에 대한 누락 된 기사는 2 번이 자동 장치의 결과물 인 유일한 실제 선물입니다. 그들의 친밀감은 Rekimoto에게 경이의 원천이었습니다. 그는 이전 서비스의 능력에 대해 잘 알고있었습니다. 겨우 24 시간 만에 구글은 다음과 같은 일본어 통역을 번역했을 것이다.
킬리만자로는 눈으로 덮인 산에서 19,710 피트 떨어져 있으며 아프리카에서 가장 높은 산이라고합니다. 서쪽 꼭대기 인 마사이족 언어의 “응가에 응가이 (Ngaje Ngai)”는 하나님의 집이라고 불 렸습니다. 서쪽에 가까운 상단에는 건조하고 얼어 붙은 표범 사체가 있습니다. 표범이 그 고도에서의 수요가 있었는지 여부에 관계없이 아무도 설명하지 않았다.
Rekimoto는 그의 발견을 트위터에서 수십만 명의 추종자들에게 알렸고 앞으로 수 시간 동안 수천 명의 사람들이 기계 번역 서비스로 자신의 실험을 방송합니다. 어떤 것은 성공했고, 다른 것은 주로 만화 효과를 의미했습니다. 도쿄에서 새벽이 다가옴에 따라 Google 트위터는 일본의 트위터에서 1 위를 차지했으며 일부 컬트 애니메이션 시리즈와 소녀 아이돌 슈퍼 그룹에서 오랫동안 기다려온 새로운 싱글입니다. 모두가 궁금해하는 바 : Google 번역은 어떻게 대단히 교묘하게 교묘하게 만들어 졌습니까?
나중에 4 일, 세계 각지에서 백 언론인, 기업가와 광고주의 부부는 특별한 발표에 대한 구글의 런던 엔지니어링 사무실에서 모였다. 손님은 번역 브랜드 포춘 쿠키로 인사했습니다. 그들의 논문에는 한쪽에 외국어가 있었는데 – 광산은 노르웨이어에 있었고 다른 쪽은 번역 앱을 다운로드하라는 초대장이었습니다. 테이블은 도넛과 스무디의 트레이, 독일어 (zitrone)에서 그 맛을 광고 현수막, 포르투갈어 (baunilha), 스페인어 (manzana)으로 표시 각각 설정했다. 잠시 후 모든 사람들이 봉제되고 어두운 극장으로 안내 받았습니다.
런던 시장 인 Sadiq Khan은 몇 가지 개회사를했습니다. 친구가 시작한 그는 최근에 그에게 구글에 대해 상기시켰다. “왜 내가 모든 대답을 알고 있느냐?”시장은 물었다. “아니,”친구는 “당신이 항상 내 문장을 끝내려고하기 때문에”라고 대답했습니다. 군중들은 정중하게 말했습니다. Khan은 Google의 CEO 인 Sundar Pichai를 소개함으로써 결론을 맺었습니다.
피 차이 (Pichai)는 부분적으로는 킹스 크로스 (King ‘s Cross)에 건설중인 새로운 “지식 영역 (knowledge quarter)”의 초석 인 Google의 새 건물을 개설하기 위해 런던에 있었으며 작년에 발표 한 회사 변화의 초기 단계 완성을 공개했습니다. Pichai가 여러 차례 발표 한 미래의 Google은 “AI 우선”이 될 것입니다. 이론에서 의미하는 것은 복잡하고 많은 추측을 환영했습니다. 행운을 가지고 실제로 의미하는 바는, 회사의 제품이 더 이상 전통적인 컴퓨터 프로그래밍의 열매, 정확하게는 “기계 학습”을 대표하지 않을 것이라는 것이 었습니다.
회사 내부의 희귀 한 부서 인 Google Brain은 5 년 전이 원칙에 따라 설립되었습니다. 즉 유아가하는 것처럼 시행 착오를 통해 세계와 친숙한 인공적인 신경 네트워크가 인간의 유연성과 같은 것을 개발할 수 있다는 것입니다. 이 개념은 새로운 것이 아닙니다. 1940 년대 현대 컴퓨터 시대의 초기 단계로 거슬러 올라갑니다. 그러나 대부분의 컴퓨터 과학자들은 그것을 모호하고 평판이 좋지 않은 것으로 보았습니다. 하지만 2011 년 이래로 Google Brain은 인공 지능에 대한 이러한 접근 방식으로 수십 년의 전통적인 노력을 혼란스럽게 만든 많은 문제를 해결할 수 있음을 입증했습니다. 브레인이 그것을 개조하려는 노력을하기 전까지는 음성 인식이 제대로 작동하지 않았습니다. 기계 학습의 응용 프로그램은 인간의 필사본만큼이나 좋은 Google 모바일 플랫폼 인 Android에서 성능을 발휘했습니다. 이미지 인식에 대해서도 마찬가지였습니다. 1 년 전만해도 처음으로 브레인은 전체 소비자 제품의 용기 개조로 시작되었으며 그 결과는 오늘 밤 기념되었습니다.
2006 년에 데뷔 한 이후 Google의 가장 신뢰할 수있는 인기있는 자산이되었습니다. 다른 언어로 하루에 1 억 4 천억 단어가 필요한 5 억 명 이상의 월간 사용자에게 서비스를 제공합니다. 자체 독립형 앱으로 존재할뿐만 아니라 Gmail, Chrome 및 기타 Google 제품에 통합 된 기능으로 존재합니다. Google은이를 디지털 방식으로 상상할 수없는 마찰없는 자연스럽고 푸시 버튼으로 사용합니다. Pichai는 난민 위기에 처해있을 뿐이 었으며, 번역사의 지정 학적 중요성에 대해 회사 측은 추측했다. 그 뒤에있는 화면에는 아랍과 독일 간의 번역이 최근 5 배나 증가한 그래프가 나타났다. (그것은 Pichai의 마음에 가깝고, 인도에서 자랐으며 수십개의 언어로 나뉘어졌습니다.) 팀은 꾸준히 새로운 언어와 기능을 추가했지만 지난 4 년 동안의 품질 향상은 상당히 느려졌습니다.
오늘까지. 이전 주말 현재, 번역은 미국뿐만 아니라 유럽과 아시아에서도 트래픽의 상당 부분을 AI 기반 시스템으로 변환되었습니다. 롤아웃에는 영어와 스페인어, 프랑스어, 포르투갈어, 독일어 , 중국어, 일본어, 한국어 및 터키어. 번역의 백 개 언어 중 나머지 언어는 내년 말까지 매월 8 개를 목표로 등장했습니다. Google의 자체 기술자가 놀랍도록 놀랐던 새 화신은 불과 9 개월 만에 완성되었습니다. 인공 지능 시스템은 오래 전 일생 동안 발생했던 총 이익과 대략 동등한 하룻밤 향상을 나타 냈습니다.
Pichai는 애매한 문학적 레퍼런스에 대한 애정을 가지고있다. 그는 캘리포니아 주 마운틴 뷰에있는 그의 사무실에서 한 달 전에 다른 사람들이 물리학 자 Robert Oppenheimer와 같을 수는 없기 때문에 번역이 존재한다고 말했습니다. Robert Oppenheimer는 Bhagavad Gita를 원본으로 읽기 위해 Sanskrit를 배웠습니다. 런던에서, 그 뒤에 모니터의 슬라이드는 보르헤스 견적에 가볍게 쳤다 “. 우노 더 에스 이오 케 에스 포 이오 케의 방접원을 그리다, 중외 포 싸다 가야 하 르 í 수행”
웃어 넘기는 피 차이 (Pichai)는 오래된 번역 시스템에 의해 표현 된 어색한 영어 버전의 문장을 소리내어 읽었습니다. “하나는 글을 쓰는 것이 아니라 읽은 것을 읽는 것입니다.”
그 오른쪽에는 새로운 AI 렌더링 버전이있었습니다. “당신은 당신이 쓴 것이 아니고, 당신이 읽은 것입니다.”
그것은 맞는 말이었습니다. 새로운 Google 번역은 어떤 의미에서 모든 것을 읽는 것을 배웠던 첫 번째 기계에서 실행되었습니다.
AI 주위에 자신을 재구성하는 구글의 결정은 업계 전반 기계 학습 정신 착란이 될 것을의 첫 번째 주요 표현했다. 지난 4 년 동안 구글, 페이 스북, 애플, 아마존, 마이크로 소프트, 중국 기업인 바이두 등 6 개 업체가 특히 AI 인재들에 대한 무기 경쟁을 촉발 시켰습니다. 자원과 자유에 대한 기업의 약속은 최고 학술 부서를 .아 냈습니다. 실리콘 밸리에서 페이스 북의 CEO 인 마크 주커 버그 (Mark Zuckerberg)가 개인적으로 감독하고 전화 통화 및 화상 채팅을 통해 널리 알리고있다. 그의 회사는 가장 바람직한 대학원생으로 선발된다. 일곱 가지 인물의 시작 급여는 전례가 아닙니다. 현장에서 가장 중요한 학술회의 참석은 거의 4 배가되었습니다. 위태로운 것은 단지 단편적인 혁신이 아니라 완전히 새로운 컴퓨팅 플랫폼 인 보편적 인공 지능을 제어 할 수 있습니다.
위태로운 것은 단지 단편적인 혁신이 아니라 완전히 새로운 컴퓨팅 플랫폼을 잘 제어 할 수있는 것에 대한 통제입니다.
“인공 지능”이라는 문구는 그 의미가 자명 한 것처럼 불려지지만, 항상 혼란과 논쟁의 원천이었습니다. 1970 년대로 돌아가 거리에서 누군가를 중지시키고 스마트 폰을 꺼내어 Google지도를 보여 주었다고 상상해보십시오. 일단 당신이 그녀를 납득 시키면 당신은 이상하게 옷을 입고있는 마법사가 아니었고, 주머니에서 꺼낸 것은 검은 예술 부적이 아니라 아폴로 셔틀에 탑승 한 것보다 더 강력한 작은 컴퓨터였습니다. Google지도는 거의 확실했습니다. 그녀에게 “인공 지능”의 설득력있는 예처럼 보입니다. 매우 실제적인 의미에서 그렇습니다. 지도를 읽고 쓰는 사람이 관리 할 수있는 모든 일을 호텔에서 공항으로 가져 오는 등의 작업을 할 수 있습니다.하지만 훨씬 빠르고 안정적으로 수행 할 수 있습니다. 또한 인간이 간단하고 명백하게 할 수없는 일을 할 수 있습니다. 트래픽을 평가하고, 최적의 경로를 계획하고, 잘못된 출구를 취할 때 방향을 바꿀 수 있습니다.
그러나 실제로 오늘날 아무도 Google지도에 명예의 “인공 지능”을 부여하지 않으므로 감정적이고 겸손한 것은 우리가 “지능”이라는 단어를 사용함에 있습니다. 인공 지능은 HAL을 무엇이든지간에 구별하는 것이어야합니다. 베틀이나 수레가 할 수 있습니다. 우리가 작업을 자동화 할 수있는 순간, 관련 기술을 단순한 메커니즘 중 하나로 다운 그레이드합니다. 오늘날 Google지도는 로봇이라는 용어를 경멸 적으로 보입니다. 단순한 요구 (한 곳에서 다른 곳으로 갈 필요가 있음)를 받아들이고 가능한 한 효율적으로 그 요구를 충족 시키려고합니다. 따라서 “인공 지능”에 대한 목표 게시물은 끊임없이 후퇴합니다.
그는 조심 구분을 할 수있는 기회를 가질 때, 피차 이는 AI의 현재 응용 프로그램과의 궁극적 인 목표 구별 “인공 일반 지능.”인공 일반 지능이 암시 적으로 시설을 보여줄 것 대신에 명시 적으로 지시에 충실한 준수를 포함하지만,하지 않습니다 , 해석 적. 그것은 일반적인 목적으로 일반적인 상황에서 설계된 일반적인 도구가 될 것입니다. Pichai는 그의 회사의 미래가 이와 같은 것에 달려 있다고 믿습니다. 구글 맵스에 “공항에 가고 싶지만 조카를 위해 선물을 사는 길에 들러야한다”고 상상해 보라. 좀 더 일반적으로 지능형 버전의 서비스 인 유비쿼터스 조수, Sparke Jonze의 “Her”에서 3 년 전에 기억에 남는 스칼렛 요한슨이 친한 친구 또는 열렬한 인턴이 알 수있는 모든 종류의 것들을 알고있을 것입니다 : 조카의 나이와 평소 얼마나 좋아하는지 아이들을위한 선물에 쓰고, 오픈 스토어를 어디에서 찾을 수 있는지 알려줍니다. 그러나 진정으로 지능적인지도는 조카 학교의 미취학 아동들 사이에서 유행에 불과했던 것, 또는 더 중요한 것은 사용자가 실제로 원하는 것처럼 친한 친구가 모르는 모든 종류의 것을 알 수 있습니다. 지능형 기계가 우리가 과거에 한 일에 관한 데이터의 복잡한 규칙 성을 식별 할 수 있었다면, 우리가 완전히 자신을 알지 못한다 할지라도 우리의 후속 욕구에 대해 추론 할 수있을 것입니다.
인공 지능 강화 조수의 새로운 물결 – 애플의 시리, 페이스 북의 M, 아마존의 에코 -는 비슷한 의도로 지어진 기계 학습의 모든 창조물입니다. 그러나 기계 학습을위한 기업의 꿈은 소비자 투시의 목표에 의해 고갈되지 않습니다. 삼성의 의학 이미징 자회사는 올해 새로운 초음파 장치가 유방암을 발견 할 수 있다고 발표했다. 경영 컨설턴트들은 스스로를 프로그램하는 컴퓨터의 산업 응용 분야를 넓히기 위해 임원들을 준비하기 위해 혼자 힘을 쓰고 있습니다. 2014 년에 구글을 인수 한 딥 마인드 (DeepMind)는 고대 보드 게임 인 고 (Go)의 일류 지배인을 격파했다.
유명한에서 1,950 에세이 , 텍스트 교환 5 분에 걸쳐 성공적으로 진짜 인간의 대담을 속일 수있는 컴퓨터 : 앨런 튜링은 인공 일반 지능에 대한 테스트를 제안했다. 한 기계가 두 가지 자연어간에 유창하게 번역 할 수있게되면 언젠가 그럴듯한 대화를하기에 충분할 정도로 인간 언어를 “이해할”수있는 기초가 마련되었습니다. 구글 브레인 (Translator)의 멤버들은 번역 프로젝트를 감독하고 돕는 일을 추진해 왔으며, 그러한 머신이 일반적으로 지능적이고 포괄적 인 개인용 디지털 보조기로 활동할 것이라고 믿고있다.
첫 번째 또는 두 개의, 다음 서너 및 백보다 마지막으로 더에서 – – 그 방향으로 상당한 진전을 여기에서 다음과 구글의 연구자와 엔지니어 팀이 방법의 이야기이다. 그것은 우리가 익숙해 진 많은 실리콘 밸리의 고정 관념을 무시하기 때문에 모든면에서 다재다능한 이야기입니다. 그의 차고에서 불안한 땜장이 때문에 내일이나 다음 날에는 모든 것이 알 수 없게 달라질 것이라고 생각하는 사람들이 없습니다. 그것은 기술이 우리의 모든 문제를 해결할 것이라고 생각하는 사람들에 관한 이야기도 아니고 기술이 묵시적인 새로운 것을 창조하는 데 불가능한 수단으로 생각하는 사람들에 관한 이야기도 아닙니다. 적어도 단어가 쓰이는 경향이있는 것은 아닙니다.
사실, Google 번역의 AI에 대한 성공적인 변신 – 기술적 인 이야기, 제도적인 이야기 및 아이디어의 진화에 관한 이야기에 수렴되는 세 개의 겹치는 이야기입니다. 이 기술 이야기는 한 회사의 한 제품에 대한 한 팀에 관한 것이 었습니다. 그리고 그들이 포함 된 사람이 합당하게 가질 수있는 시간의 약 4 분의 1 만에 새로운 제품을 세련되고 테스트하고 도입 한 프로세스입니다. 예상했다. 이 기관의 이야기는 그 회사 내의 작지만 영향력있는 인공 지능 그룹의 직원에 관한 것이 었으며, 입증되지 않은 널리 퍼진 컴퓨팅 개념에 대한 직관적 인 믿음이 큰 반경 내 다른 모든 회사를 뒤덮었을 때의 과정에 관한 이야기입니다. 아이디어의 이야기는 오랫동안 애매 모호한인지 과학자, 심리학자 및 숙련 된 기술자, 표면 상으로는 비합리적인 신념으로 궁극적으로는 기술뿐만 아니라 이론적으로는 의식 그 자체에 대한 우리의 이해의 패러다임 변화에 영향을 미쳤습니다. .
그것은 우리가 익숙해 진 많은 실리콘 밸리의 고정 관념을 무시하기 때문에 모든면에서 다재다능한 이야기입니다.
첫 번째 이야기 인 Google 번역의 이야기는 Mountain View에서 9 개월 동안 진행되며 기계 번역의 변형을 설명합니다. 두 번째 이야기는 Google Brain과 그 많은 경쟁사에 대한 이야기이며 5 년 동안 실리콘 밸리에서 열렸으며 전체 커뮤니티의 변화를 설명합니다. 세 번째 이야기, 즉 깊은 학습 이야기는 스코틀랜드, 스위스, 일본, 그리고 대부분의 캐나다 전역의 다양한 실험실에서 70 년이 넘는 시간 동안 진행되고 있으며, 이는 자율 학습의 개정에 크게 기여할 것입니다. 생각하는 맨 먼저의 존재로서의 이미지.
세 가지 모두 인공 지능에 관한 이야기입니다. 7-10 년 이야기는 우리가 생각하거나 예상 할 수있는 것에 관한 것입니다. 5 년짜리 이야기는 가까운 장래에 어떻게 될지에 관한 이야기입니다. 9 개월짜리 이야기는 바로 지금 할 수있는 일에 관한 이야기입니다. 이 세 가지 이야기는 그저 개념의 증거 일뿐입니다. 이 모든 것은 시작일뿐입니다.
1 부 : 학습 기계
1. 뇌의 탄생
제프 딘 (Jeff Dean)은 자신의 직함이 선임 연구원이긴하지만 사실상 Google Brain의 머리입니다. 딘 (Dean)은 길고 좁은 얼굴, 깊은 눈, 진지하고 비누 상자 같은 열정을 지닌 힘 있고 에너지 효율적인 남성입니다. 의료 인류 학자이자 공중 보건 역학의 아들 인 딘 (Dean)은 미네소타, 하와이, 보스턴, 알칸사스, 제네바, 우간다, 소말리아, 애틀란타에서 전 세계적으로 자랐으며 고등학교와 대학에서는 세계 보건기구. 그는 1999 년부터 25,000 명의 직원으로 Google에 근무했으며 그 이후 거의 모든 중요한 사업 아래 핵심 소프트웨어 시스템에 손을 대었습니다. 기업 문화의 사랑하는 유물은 제프 딘 사실 척 노리스 사실의 스타일로 작성된이, 밈 “제프 딘의 PIN이 파이의 마지막 네 자리입니다.”, “알렉산더 그레이엄 벨이 전화를 발명 할 때, 그가에서 부재 중 전화를 보았다 Jeff Dean “”제프 딘 (Jeff Dean)은 최대 레벨이 10 인 시스템에서 레벨 11로 승급되었습니다. “(이 마지막 하나는 사실입니다.)
2011 년 1 월, 딘 (Dean)은 Google 캠퍼스의 “microkitchens”중 하나 인 Mountain View 복합 건물의 대부분 층에있는 공유 휴게 공간에 대한 “Googley”라는 단어를 사용하여 젊은 스탠포드 컴퓨터 과학인 Andrew Ng를 만났습니다. 컨설턴트로 회사에서 일하는 교수. Ng는 프로젝트 마빈 (Marvin Minsky)의 이름을 따서 명명 한 내부 노력 인 “마빈 (Marvin) 프로젝트”에 관해 이렇게 말했습니다. 그는 최근에 뇌 구조에 느슨한 기반을 둔 유연한 디지털 격자를 “신경 네트워크”로 실험하는 것을 도왔습니다. 딘 자신은 1990 년 미네소타 대학 (University of Minnesota)에서 학부생으로서 원시적 인 기술 버전을 연구했다. 이제는 지난 5 년 동안 신경 네트워크를 연구하는 학자의 수는 소수에서 수십에 이르기까지 다시 증가하기 시작했습니다. Ng는 Google의 비밀 X 실험실에서 인수 중이던 Project Marvin이 이미 유망한 결과를 얻었습니다.
Dean은 Google 직원이 핵심 업무 이외의 프로그램에 기여할 것으로 예상되는 근무 시간 중 일부인 20 %를 프로젝트에 빌려주기도했습니다. 얼마 지나지 않아 그는 Ng에게 신경 과학 배경을 가진 Greg Corrado와 함께 다른 동료를 데려 오라고 제안했습니다. (대학원에서 Corrado는이 기술에 대해 간단하게 가르쳤지 만 엄격한 역사적 호기심으로 가르쳐졌습니다. “그날 수업에서주의를 기울이는 것이 좋았습니다.”라고 나는 농담을했습니다.) 늦은 봄, 그들은 Ng의 최고 중 하나를 가져 왔습니다. 대학원생, Quoc Le, 프로젝트의 첫 번째 인턴. 그때까지 Google 엔지니어 중 상당수는 Project Marvin을 Google Brain이라는 다른 이름으로 언급했습니다.
“인공 지능 (artificial intelligence)”이라는 용어가 처음 만들어 지자 1956 년 여름 다트머스 (Dartmouth)에서 일종의 헌법 컨벤션을 통해 많은 연구자들이 오랫동안 인공 지능을 창조하는 가장 좋은 방법은 매우 크고 포괄적 인 논리적 추론의 규칙과 세계에 대한 충분한 지식을 제시 한 프로그램. 당신이 영어에서 일본어로 번역하고자한다면, 예를 들어, 컴퓨터에 영어 문법 규칙의 모든 프로그램과 것이다 다음 옥스포드 영어 사전에 포함 된 정의의 전체, 다음 일본어의 문법 모든 규칙, 뿐만 아니라 일본 사전의 모든 단어로, 오직 그 모든 후 소스 언어로 그것을 문장을 공급하고 대상 언어에 해당하는 문장을 집계하도록 요청합니다. Borges가 그랬던 것처럼 지역의 크기 인 언어 맵을 기계에 제공하게됩니다. 이 관점은 일반적으로 “상징적 인공 지능”이라고 부릅니다. 왜냐하면 그 인식의 정의는 상징적 논리에 기반을두고 있기 때문에 – 또는 비열하게도 “훌륭한 구식 인공 지능”
구식 접근 방식에는 두 가지 주요 문제점이 있습니다. 첫 번째는 사람이 끝내는 데 시간이 오래 걸린다는 것입니다. 두 번째는 규칙과 정의가 매우 명확한 도메인에서만 작동한다는 것입니다 (예 : 수학 또는 체스). 그러나 번역은 단어가 사전 정의로 축소 될 수 없기 때문에 그리고 언어가 규칙을 지닌 것만큼 많은 예외를 갖는 경향이 있으므로이 접근법이 무시 무시하게 실패하는 분야의 예입니다. 종종 이런 식의 시스템은 “농업 장관”을 “농업의 제사장”으로 번역해야 할 의무가 있습니다. 수학과 체스의 경우에는 위대한 일을했으며 상징적 인 AI의 지지자들은 ” 일반 정보 “를 수학 및 체스보다 뛰어나다.
그러나이 시스템이 할 수있는 것에 한계가있었습니다. 1980 년대 카네기 멜론 (Carnegie Mellon)의 로봇 연구원은 컴퓨터를 성인용으로 사용하는 것이 쉽지만 1 살짜리 어린이가 볼을 잡거나 고양이를 식별하는 것과 같은 일을하도록하는 것은 거의 불가능하다고 지적했습니다. 1990 년대까지, 컴퓨터 체스의 진보를 처벌 했음에도 불구하고 우리는 여전히 인공 지능에 멀지 않았습니다.
컴퓨터가 위에서 아래로 (규칙에 따라)보다는 위에서 (데이터를 통해) 배울 것이라고 반대 의견 인 AI에 대한 또 다른 비전이 항상있었습니다. 이 개념은 유연한 자동화 된 지능을위한 최상의 모델이 뇌 자체라는 연구자에게 일어난 1940 년대 초반에 시작됩니다. 어쨌든 두뇌는 뉴런 (neurons)이라 불리는 위젯의 무리 일 뿐이며, 이웃들에게 전기 요금을 부과하거나받지 못한다. 중요한 것은 그것들 사이의 다양한 연결보다 개별 뉴런 자체가 덜 중요하다는 것입니다. 이 구조는 단순함으로 인해 뇌에 적응력이 풍부한 장점을 제공합니다. 두뇌는 정보가 부족하거나 빠진 환경에서 작동 할 수 있습니다. 통제력을 완전히 상실하지 않으면 심각한 피해를 견딜 수 있습니다. 엄청난 양의 지식을 매우 효율적으로 저장할 수 있습니다. 그것은 명확한 패턴을 분리 할 수 있지만 모호성을 처리하는 데 필요한 난장음을 유지합니다.
거기에 당신이 전자 형태로이 구조를 모방하려고 할 수없는 이유가 없었으며, 1943 년에 이 나타났다 간단한 인공 신경 세포의 배열이 기본 논리 기능을 수행 할 수있다. 그들은 또한 이론적으로 적어도 우리가하는 방식을 배울 수 있습니다. 인생 경험에 따라, 특정 사람의 시련과 오류에 따라, 뉴런 쌍 사이의 시냅스 연결이 강해지거나 약해진다. 인공 신경망은 유도 된 시행 착오를 바탕으로 인공 신경 세포 간의 수치 관계를 점차적으로 변경함으로써 비슷한 것을 할 수 있습니다. 고정 된 규칙으로 미리 프로그램 할 필요는 없습니다. 대신에 흡수 된 데이터의 패턴을 반영하기 위해 스스로를 다시 연결합니다.
인공 지능에 대한 이러한 태도는 창조론 자라기보다는 진화론적인 것이었다. 유연한 메커니즘을 원한다면 환경에 적응할 수있는 메커니즘을 원했습니다. 당신이 적응할 수있는 무엇인가를 원한다면, 당신은 체스의 규칙을 주입하는 것으로부터 시작하고 싶지 않았습니다. 고급 기술이 유기적으로 등장하기를 원한다면 아주 기본적인 능력 (감각 지각과 운동 조절)으로 시작하고 싶었습니다. 인간은 사전이나 문법 책을 암기하여 언어를 이해하는 법을 배우지 않으므로 컴퓨터가 그렇게 할 것을 기대해야하는 이유는 무엇입니까?
Google Brain은 AI Dean에 대한 사고 방식으로 구체화 된 가능성에 투자 한 최초의 주요 상업 기관이었으며 Corrado와 Ng는 시간제 협력 실험으로 업무를 시작했지만 즉각적인 진전을 이루었습니다. 그들은 최근의 이론적 개요와 1980 년대와 1990 년대 이후 선반에 있었던 아이디어를 바탕으로 자신의 모델에 대한 건축 영감을 얻었으며 회사의 독보적 인 데이터 보유량과 거대한 컴퓨팅 인프라를 모두 활용했습니다. 그들은 막대한 은행의 “분류 된”데이터 (말하자면 예를 들어 정확한 필사본)를 네트워크에 지시했으며, 컴퓨터는 현실에보다 잘 부응하기 위해 응답을 개선했습니다.
“동물이 눈을 개발하는 진화의 부분이 큰 개발했다”딘은 관습 삼가과 어느 날 나에게 말했다. 우리는 평소와 같이 화이트 보드 회의실에 앉아있었습니다. 그 회의장에서 Google Brain의 붐비는 뱀의 타임 라인과 신경 네트워크의 최근 역사에서 변곡점과의 관계를 그렸습니다.“이제 컴퓨터는 눈을 가지고있다. 사진을 이해하기 위해 현재 존재하는 기능을 중심으로 구축 할 수 있습니다. 로봇이 대폭 변형 될 것입니다. 그들은 많은 다른 문제에, 알 수없는 환경에서 작동 할 수있을거야. “그들이 구축 한이 용량은 기본 보였을 수 있지만, 그 의미는 심오했다.
2. 가능성이없는 인턴
Dean이 말했듯이 1 년 된 재능을 가진 기계를 개발 한 첫 해에 Brain은 실험을 통해 큰 효과를 얻었습니다. 음성 인식 팀은 기존 시스템의 일부를 신경 네트워크로 바꿔 놓았습니다. 20 년 만에 최고 품질의 개선이 이루어졌습니다. 그들의 시스템의 물체 인식 능력은 몇 배 향상되었습니다. 이것은 Brain의 인력이 불과 1 년 만에 새로운 아이디어의 장을 창출했기 때문이 아닙니다. Google이 마침내 컴퓨터와 점점 더 많은 인력을 투입하여 오랜 기간 동안 주변에 있었던 윤곽을 채우기 위해 노력했기 때문입니다.
이러한 현존하고 무시당한 관념에 대한 큰 우세가 Geoffrey Hinton이라는 peripatetic 영어 polymath에 의해 제안되거나 정제되었습니다. Brain이 존재하는 2 년차에 Hinton은 Andrew Ng가 떠남에 따라 Brain에 모집되었습니다. (Ng는 현재 Baidu에서 1,300 명의 AI 팀을 이끌고 있습니다.) Hinton은 토론토 대학교에서 3 개월 밖에 머물고 싶지 않았기 때문에 계약상의 이유 때문에 인턴으로 고용해야했습니다. 인턴 교육을 받으면 오리엔티어 리더는 “사용자의 LDAP에 입력하십시오. 사용자 로그인”이라고 말하면서 도우미에게 “LDAP 란 무엇입니까?”라고 묻습니다. 출석 한 25 세의 똑똑한 사람 인공 지능의 사인이 아닌 단지 깊은 학습 만이 알려졌다. “누가 그 노인이야? 왜 그가 그것을 얻지 못하니? “
“점심 시간,”힌튼 말했다, “큐에 누군가가 소리 쳤다 : ‘교수 힌튼! 나는 네 코스를 들었어! 너 여기서 뭐하고 있니? ‘그 후, 모든 권리했다. “
몇 달 후, 힌튼과 그의 제자 중 두 입증 컴퓨터 원숭이를 식별 할뿐만 아니라 거미 원숭이와 구별 할뿐만 아니라 요청 ImageNet라는 오픈 소스 단체에 의해 실행 큰 이미지 인식 경연 대회에서 정말 놀라운 이득을, 하울 러 원숭이, 신의 사이에서 고양이의 얼마나 많은 다른 유형이 있는지 알고있다. Google은 Hinton과 그의 학생들에게 곧 제안을했습니다. 그들은 받아 들였다. “우리 지적 재산권에 관심이 있다고 생각했습니다.” “그들은 우리에게 관심을 보였습니다.”
힌튼은 지적인 경관을 가로 지르는 편심한 각도의 Darwins와 같은 옛 영국 가정에서 태어났다. 여기서 유명한 선집에 관계없이 천문학이나 유체 역학의 사소한 문제에 도움을 줄 것으로 기대된다. 그의 위대한 증조부였던 조지 부울 (George Boole)은 상징적 논리의 기초 작업으로 컴퓨터를 뒷받침했습니다. 또 다른 위대한 증조부는 유명한 외과 의사 였고 그의 아버지는 벤츄라의 곤충 학자였으며 그의 아버지의 사촌은 로스 알 라모스의 연구원이었다. 그 목록은 계속된다. 그는 케임브리지와 에딘버러에서 훈련을 마친 후 토론토에 도착하기 전에 카네기 멜론 (Carnegie Mellon)에서 가르쳤다. 그는 여전히 그의 시간의 절반을 보낸다. (그의 작품은 오랫동안 캐나다 정부의 후원에 의해지지를 받았다.) 나는 구글의 그의 사무실에서 그를 방문했다. 그는 성숙한 Noel Gallagher 스타일로 빗나간 노랑 – 백랍 머리카락을 집어 넣었으며, 쭉쭉 뻗은 끈적 거리는 드레스 셔츠와 눈에 띄는 코 끝에 떨어지는 타원형 안경을 착용했습니다. 그는 shambolic 지혜라면 운전에 대해 말하고 “컴퓨터는 미국인들이하기 전에 풍자를 이해할 것”이라고 말한다.
Hinton은 1960 년대 후반 케임 브리지에서 학부생으로 근무한 이후로 신경 네트워크 작업을하고 있었으며 그는 현대 분야의 지적 초 기자 (intellectual primogenitor)로 간주됩니다. 그 당시 대부분의 사람들은 기계 학습에 관해 이야기 할 때마다 프톨레마이오스 구체에 대해 이야기하거나 거머리들에게 유혈 사태에 대해 이야기하는 것처럼 그를 보았습니다. 신경망은 1950 년대 후반 코넬 심리학자 인 프랭크 로젠 블랏 (Frank Rosenblatt)이 개발 한 인공 신경망 인 퍼셉트론 (Perceptron)과 같은 과장된 프로젝트를 토대로 대단히 어리 석다. New York Times는 기계의 스폰서 인 미국 해군이 “걸을 수 있고, 말하고,보고, 쓰고, 재현하고, 존재를 의식 할 수있을 것”이라고 예상했다. . 미국의 인공 지능 학과장 인 마빈 민스키 (Marvin Minsky)는 1954 년 프린스턴 논문을 위해 신경망을 연구했지만 이후 브론스 사이언스 (Bronx Science)의 현대인 로젠 블랫 (Rosenblatt)이 신경 패러다임을 만들었다는 주장에 지쳤다. (그는 또한 국방부의 자금 지원을 위해 경쟁했다.)는 MIT 동료와 함께, 민스키는 퍼셉트론 해결할 수 없었습니다 간단한 문제는 고통이 있었다는 것을 입증 책을 출판했다.
퍼셉트론의 민스키의 비판은 하나의 “레이어”의 네트워크 확장, 즉 기계에 공급하고 당신이 그것을 기대하는 무슨 사이 인공 뉴런의 한 층 – 나중에 생활에서, 그는 현대 깊은 학습과 매우 유사한 아이디어를 강론. 그러나 힌튼은 이미 여러 층에 의지가 있다면 복잡한 작업을 수행 할 수있는 시간에 알고 있었다. 뉴럴 네트워크의 간단한 설명은 데이터의 패턴을 발견 할 수있는 능력에 기초하여 분류 또는 예측을 만드는 시스템의 점이다. 하나의 층으로, 당신은 단순한 패턴을 찾을 수; 더 이상, 당신은 패턴의 패턴을 볼 수 있었다. 라는 진기한에 의존하는 경향이 영상 인식의 경우 가져 가라 “길쌈 신경 그물을.”(이은으로 정교하고 독창적 인 1,998 종이 누구의 주 저자 인, 프랑스 인은 얀 LeCun 이름 힌튼에서 토론토에서 자신의 박사 후 연구를했고, 지금 페이스 북에서 거대한 AI 노력을 지시합니다.) 네트워크의 첫 번째 층은 의미 없다 “, 가장자리의”의 아주 기본적인 시각적 비유를 식별하기 위해 배우는 것도 a로 다음 (오프 픽셀) 뭔가를 (온 – 픽셀) 또는 그 반대의 경우도 마찬가지. 네트워크의 각 연속적인 층은 이전의 층에 패턴을 찾습니다. 가장자리의 패턴은 원형 또는 사각형 수 있습니다. 원 또는 사각형의 패턴은 얼굴이 될 수 있습니다. 등등. 그것은 다시 위로 시각 피질을 통해 망막의 광 수용체에서 이동할 때이 다소 평행선는 방법 정보가 점점 더 추상적 인 방법으로 조립된다. 각 개념 단계, 즉시 관련이 없습니다 세부 사항에서 폐기된다. 여러 가장자리와 동그라미가 얼굴을 만들기 위해 함께 온다면, 당신은 얼굴이 시야에서 발견된다 정확히 걱정하지 않는다; 당신은 그냥 얼굴 있다는 걱정.
1990 년대 후반에 의해 미국에있는 모든 검사의 10 ~ 20 퍼센트를 처리하는 연구원 얀 LeCun의 길쌈 신경망의 초기 버전을 보여주는 1993에서 데모. 유사한 기술은 현재 가장 최신의 영상 인식 시스템을 구동한다. 비디오 얀 LeCun에 의해 유튜브에 게시
다층, “깊은”신경 네트워크와의 문제는 시행 착오 부분은 매우 복잡있어이었다. 단일 층에서, 쉽다. 당신이 함께 연주하는 것을 상상해보십시오. 당신은 아이에게 “녹색 공을 들고 상자 A.에 넣어”아이는 녹색 공을 집어 들고 당신은 “상자 A에 녹색 공을 넣어 다시 시도”라고 말할 상자 B.로를 박았 아이는 상자 A. 브라보를 시도합니다.
이제, 아이에게 “녹색 공을 들고, 문을 통해 이동 3을 표시하고 박스 A.으로 녹색 공을 넣어”아이가 빨간 공을 취 상상이 표시된 문을 통해 이동하고 상자에 빨간 공을 넣습니다 B. 당신은 어떻게 아이를 해결하기 위해 시작합니까? 아이가 자신이 잘못되는 시점에서 알 수 없기 때문에 당신은, 초기 지시 사항을 반복 할 수 없습니다. 실제 생활에서, 당신은 빨간 공 및 녹색 공을 잡고, 말함으로써 시작 있습니다 “빨간 공, 녹색 공을.”기계 학습의 요점을하지만, 명시 적 멘토링의 종류를 방지하는 것입니다. 힌튼과 몇 가지 다른 사람에 갔다 해결책을 발명 (또는 오히려, 재발견 일 이전 ) 1970 년대 후반과 1980 년대의 정지 과정을 통해,이 계층-오류 문제를 신경 네트워크의 컴퓨터 과학자들 사이 관심이 간략하게 부활했다. “사람들은 그것에 대해 매우 흥분”고 말했다. “그러나 우리는. 그것을 과매도”컴퓨터 과학자들은 신속하게 힌튼 같은 사람들이 괴물과 신비 주의자라고 생각하고 다시 갔다.
이 아이디어는 그러나 “connectionism”또는 “병렬 분산 처리.” “이 아이디어를 호출 철학자와 심리학자, 중, 횃불 연소를 유지하는 몇 사람, 그것은 멋진 신화”힌튼은 나에게 말했다 “인기 남아 있었다. 그것은 인공 지능 내에서 사실이었다. 하지만하지만 접근 방식을 믿는 사람들의 심리를 많이 내 그냥. 그렇게하지 “나도 할 수 없습니다 수 힌튼, 캐나다 정부의 관용에도 불구하고. “충분한 컴퓨터의 전원 또는 데이터가 충분하지 않았다. 우리 쪽 사람들은 말하고 있었다 ‘그래,하지만 난 정말 큰 일이 있다면, 그것은 작동합니다.’ 그것은 매우 설득력 인수되지 않았습니다. “
‘ 동물의 눈을 개발하는 진화의 부분에 큰 발전이 있었다. 이제 컴퓨터는 눈을 가지고있다. ‘
깊은 학습 3. 깊은 설명
피차 구글이 이제부터는 것이라고 말했을 때 “AI 첫째,”그는 단지 자신의 회사의 사업 전략에 대한 주장을하지 않은; 그는이 긴 쓸모없는 아이디어를 자신의 회사의 많이 던지고 있었다. 자원의 피차의 할당은 딘과 같은 사람들이 설득력있는 주장을 긴 마지막으로, 충분한 컴퓨터와 충분한 데이터에서 힌튼 같은 사람들이 가지고 것이라는 점을 보장 할 수 있음을 보장. 평균 뇌는 1000 억 뉴런의 순서에 뭔가가있다. 각각의 신경 세포가 시냅스의 수가 100 조 1000 억 사이 즉, 최대 10,000 다른 뉴런에 접속된다. 1940 년대에 제안 된 종류의 간단한 인공 신경망의 경우, 시도조차이 상상할 수 있었다 복제하려고합니다. 우리는 아직까지 그 크기의 네트워크의 구성에서,하지만 구글 뇌의 투자는 쥐의 뇌에 필적하는 인공 신경 네트워크의 생성을 허용했다.
규모가 중요한 이유, 이해하기하지만, 정확히, 기계 지능 그들이 소비하는 데이터로 무엇을하고 있는지의 기술적 세부 사항의 일부를 이해하기 시작한다. 그들은 단지 도서관에서 반사회적 신동 같은 지식을 진공 청소기로 청소하고 있는지, 그리고 인공 지능 언젠가는 개미 나 상추 같은 인간을 치료하는 결정할 수 있습니다 종이 클립을 만들기 위해 구성한다는 생각에 AI의 나머지 부분에 대한 우리의 주변 두려움을 많이합니다. 작동 방식이 바로이 아니다. 그들이하고있는 모든 공통점을 찾아 주변 정보를 셔플입니다 – 처음에 기본 패턴 다음 더 복잡한 것들 – 그리고 잠시 동안, 적어도 가장 큰 위험은 우리가 공급하고있는 정보가에 편향되어 있다는 것입니다 처음.
그 간단한 설명이 충분히 안심 보이는 경우, 안심 비 기술적 독자는 고양이에 관한 다음 섹션, 앞으로 이동하도록 초대한다. 그렇지 않으면, 다음에 읽어 보시기 바랍니다. (이 부분은 고양이에 대해, 운좋게도 있습니다.)
당신이 이전 상징적-AI 모델에 고양이 인식기를 프로그램 할 상상해보십시오. 당신의 철저한 명시 적 정의와 기계를 미리로드 일 동안 깨어 “고양이.”당신은 고양이 등 4 개의 다리와 뾰족한 귀, 수염과 꼬리, 그리고이 있는지를 알려줍니다. 이 모든 정보는 고양이라는 메모리의 특별한 장소에 저장됩니다. 이제 당신은 사진을 보여줍니다. 먼저, 시스템은 이미지의 다양한 별개의 소자들을 분리한다. 그런 다음 이러한 요소를 가지고 메모리에 저장된 규칙을 적용한다. 만약 (다리 = 4), 경우 (귀 = 뾰족한)과 경우 (위스커 = 예) 그리고 만약 (꼬리 = 예) 그리고 만약 다음 (식 = 얕보), (고양이 = 예). 그러나이 고양이 인식기에게 스코틀랜드 배, 배 오버 귀를 축 늘어진로 연결되는 소중히 유전 적 결함을 가진 마음 박살 품종을 보였다 무슨 경우? 우리의 상징적 인 AI는 (귀 = 뾰족한)에 도착하고, 엄숙하게 머리를 흔들 “고양이를하지 않습니다.”그것은 hyperliteral, 또는이다 “취성.”심지어 두꺼운 아이가 훨씬 더 추론 시력을 보여줍니다.
이제 컴퓨터의 메모리의 한 위치에 저장 분류를위한 일련의 규칙과 시스템을 하드 배선 대신에, 당신은 신경 네트워크에 같은 일을 시도 상상. 의 정의에 저장할 수있는 특별한 장소가 없다 “고양이.”경로에서 포크 등 상호 연결된 스위치의 단지 거대한 덩어리가있다. 블롭의 한쪽에, 당신은 입력 (사진)를 제시; 다른 측면에서, 당신은 해당 출력 (라벨)을 제시한다. 그럼 당신은 그냥 일을 말해 , 자체 데이터가 입력이 올바른 출력에 매핑되도록해야 어떤 경로 이러한 상호 모든 스위치의 개별 교정을 통해. 훈련은 정교한 터널의 미로 시리즈는 블롭, 적절한 출력에 주어진 입력을 연결하는 터널을 굴착하는 과정입니다. 당신이 더 트레이닝 데이터, 큰 파고 수있는 터널의 수와 복잡함. 교육이 완료되면, 블롭의 중간 그것은 한 번도 본 적이없는 데이터를 처리하는 방법에 대한 신뢰성있는 예측을 할 수있는 충분한 터널이있다. 이것은 “지도 학습”이라고합니다.
네트워크가 많은 뉴런 너무 많은 데이터를 필요로하는 이유는 거대한 기계 민주주의 일종의 같은 방식으로 기능한다는 것이다. 당신이 다섯 가지 항목 중에서 구별하기 위해 컴퓨터를 훈련 할 상상해보십시오. 고양이 한 개를위한 하나, 거미 원숭이 하나, 숟가락 하나와 제세 동기에 대해 하나의 : 네트워크의 연결의 수백만로 구성되어 있습니다 “유권자,”누구의 각각 다섯 가지 카드를 주어졌다. 당신은 위에서 아래로, “이 고양이, 개, 거미 원숭이, 숟가락 또는 제세 동기인가?”모두 같은 방법으로이 그룹에 수집 투표 뉴런 및 네트워크 주임 동료를 당신의 유권자 사진 질문을 표시하고 대부분의 분류를 식별 : “개를?”
당신은 말한다 : “아니, 마에스트로, 그것은 고양이입니다. 다시 시도하십시오. “
이제 네트워크 감독은 유권자들이 “고양이”뒤에 자신의 체중을 던져하지 않았다 식별로 되돌아 간다. . “고양이”- “고양이”를받은 사람은 바로 자신의 투표는 두 번 다음에 시간을 계산 얻을 그들은 그들이 개와 제세동을 따기에도 좋은 것 여부를 독립적으로 증명해야 그들이 투표하고 적어도 때,하지만 한 가지 그 각각의 유닛이 다른 원하는 결과를 다르게 기여할 수 있다는 점이다 신경망 너무 유연합니다. 중요한 것은 정확히 개별 투표,하지만 투표의 패턴이다. 조, 프랭크와 메리 함께 모든 투표, 그것은 개가 있다면, 조, 케이트와 제시카가 함께 투표를하는 경우, 그것은 고양이입니다; 케이트, 제시카와 프랭크 함께 투표 할 경우, 그것은 제세 동기입니다. 신경망 그냥 어딘가에 승률은 “말을 정기적으로 식별 신호의 정도를 등록 할 필요는 픽셀이 특정 배열은 이러한 인간이 계속 전화 뭔가 나타내는 ‘고양이.’ ” 더 ” 유권자 ” 당신이 그들을 투표 할 당신이, 그리고 더 많은 시간, 더 날카롭게 네트워크도 매우 약한 신호를 등록 할 수 있습니다. 당신은 단지 조, 프랭크와 메리가있는 경우, 당신은 아마 고양이, 개 및 제세 동기를 구별 만 사용할 수 있습니다. 당신이 다른 방법으로 수십억에 연결할 수있는 다른 유권자의 수백만이있는 경우, 당신은 믿을 수 단위로 데이터를 분류 배울 수 있습니다. 당신의 훈련을받은 유권자 어셈블리는 레이블이없는 사진을보고 어느 정도 정확하게 식별 할 수있을 것입니다.
그 이유의 일부는 컴퓨터 과학 부서의 아이디어에 너무 많은 저항이 출력 패턴의 패턴에 따라 단지 예측이기 때문에, 완벽 않을거야, 그리고 기계가 당신을 위해 정의 할 수 없을 것입니다 있었다 무엇을, 정확히, 고양이입니다. 그것은 그들을 볼 때 그것은 단지 그들을 알고있다. 이 양털 모양 그러나 점이다. 그들은 다양한 고양이 장면의 수백만에 노출 된 바와 같이 신경 “유권자들은”한, 태양과 어수선한 쓰레기 상자의 그림자로부터 눈부신 화가 난 고양이에 졸고 행복한 고양이를 인식합니다. 있는지 확인하기 위해 – 당신은 제비와 유권자를 많이 필요로 일부 네트워크의 일부, 예를 들어, 축 늘어진 귀 스코티시 폴드에, 심지어 매우 약한 규칙 성을 집어 – 충분한 표시된 데이터는 네트워크가 보았다 확인 현상의 넓은 가능한 분산.
이는 신경망이 자연 확률 사실들이 모든 작업에 적합하지 않은 것을 의미한다는 점에 유의하는 것이 중요하다. 그들이 개 같은 고양이 1 %로 분류해서는, 또는 경우에 잘못된 영화에 당신을 보내지 만 자기 차를 운전과 같은에서 우리 모두가 더 큰 보장을 할 경우 더 큰 비극 없습니다. 이것은 유일한주의가 아닙니다. 지도 학습에 기초하여 시행 착오 과정 표시된 데이터. 기계 학습을 수행 할 수 있지만, 입력의 최초 분류에 강한 소자 인간이 남아있다. 데이터가 한 남자의 사진 누군가가 표시했다고 정장에 여성이 있다면 “그녀의 상사와 여자,”그 관계는 이후의 모든 패턴 인식으로 인코딩된다. 레이블이 데이터는 인간의 라벨러는 오류를 범할 수있는 방식 때문에 오류를 범할 수있다. 기계가 대출 신용 할 후보를 식별하기 위해 요청 된 경우 중죄 유죄 판결과 같은 데이터를 사용할 수 있지만 중죄 유죄 판결이 처음부터 불공정 있다면 – 그들이에 기반한다면, 말, 차별적 인 약물 법 – 후 대출 추천도 억지로 것 오류를 범할 수.
우리의 고양이 식별자와 같은 이미지 인식 네트워크가 깊은 학습의 많은 종류의 하나이지만, 각 층은 인간에게 적어도 막연하게 인식 할 수있는 무언가를하기 때문에 그들이 불균형 교육 예로서 호출 – 첫째, 다음 원을 가장자리를 골라, 그 다음에 직면 해있다. 이 오류에 대한 보호가 의미합니다. 예를 들어, Google의 이미지 인식 소프트웨어의 초기 이상한은 항상 팀이 운동 종류를 많이 포함 된 이미지 세트에 훈련을했다하더라도, 격리에 바벨을 식별 할 수있는 것을 의미했다. 시각화 툴은 트레이닝 세트의 모든 아령가 팔에 부착 되었기 때문에 시스템이 “아령 + 아암”NOT “덤벨”그러나 개념의 개념을 배운을 보였다. 그들은 솔로 아가씨의 약간의 사진을 혼합 훈련에 던졌다. 문제가 해결되었다. 모든 것이 쉽습니다.
구글 뇌의 투자는 쥐의 뇌에 필적하는 인공 신경 네트워크의 생성을 허용했다.
4. 고양이 종이
첫 해 두의 과정 동안, 두뇌의 노력은 1 세의 기술 팀이 X 실험실에서 그리고 폭 넓은 연구 조직으로 졸업 한만큼 길조했다 기계로 육성한다. (구글 X의 머리는 한 번 뇌가 X의 비용 전체를 지불했다고 말했다.) 그들은 여전히 10 개 미만의 사람을 가지고 있었고, 단지 막연한 느낌 궁극적으로 모두의 올 수도 것에 대해. 그러나 심지어 그들은 무슨 일이 다음에 무슨 일이 일어날한다고에 앞서 생각했다. 먼저 인간의 마음은 공을 인정 배우고 잠시 달성 쉽게 달려 있지만, 조만간, 그것은 공을 요청하고자합니다. 그리고 그것은 언어로에서 wades.
그 방향으로 첫 번째 단계였다 고양이 종이 뇌 유명했다.
그 점에 대한 공개 신경망보다 큰 백 번, 아직 우리의 두뇌보다 작은 크기의 또 많은 주문 – – 원시, 레이블이없는 데이터를 관찰 할 수있는 어떤 고양이 종이 입증하는 것은 이상 억 “시냅스”연결이 신경 네트워크는 것이 었습니다 자체에 대한 상위 인간의 개념을 선택합니다. 뇌 연구원은 YouTube 동영상에서 스틸 프레임의 네트워크 수백만을 표시했고, 순수한 감각 기관의 웰터급에서 네트워크는 유아 나 다람쥐 고양이의 얼굴로 순간의 주저없이 인식 할 것이다 안정적인 패턴을 격리했다. 기계는 고양이의 예지로 프로그래밍되지 않은; 그것은 세계에 직접 도달 자체에 대한 아이디어를 압수. (연구자들은 유령 고양이 얼굴이 가장 큰 집단 열정과 인공 뉴런에 “투표”를 발생하는 것을 그들에게 보여준 MRI, 같은의 신경망에 해당 이것을 발견했다.) 그 시점을 배우는 대부분의 기계에 의해 제한했다 표시된 데이터의 양. 고양이 종이 기계는 원료를 처리 할 수 있음을 보여 주었다 레이블이없는 데이터, 인간이 아니 예지를 설립했다 그 중 아마도 데이터입니다. 이 고양이 인식 연구에서뿐만 아니라 전체 인공 지능뿐만 아니라 주요 사전처럼 보였다.
고양이 종이의 리드 저자는 쿠크 르이었다. 르 빠른, 수수께끼의 미소와 반짝이 블랙 페니 로퍼로, 짧고 버드 나무와 부드러운 음성이다. 그는 색조, 베트남 외부에서 자랐습니다. 그의 부모는 쌀 농부했다, 그는 집에서 전기를하지 않았다. 그의 수학적 능력은 어릴 때부터 분명했다, 그는 과학 자석 학교에서 공부를 보냈습니다. 1990 년대 후반, 여전히 학교에있는 동안, 그는 얘기하는 chatbot를 구축하기 위해 노력했다. 그는이 어떻게 하드가 될 수 생각?
” 그러나 실제로는, ” 그는은 whispery 무표정한에 나에게 말했다 ” 는 ‘ 매우 어렵다. “
그는 컴퓨터 비전 등의 AI 작업에 종사 캔버라, 호주의 대학에 장학금에 논을 떠났습니다. 가장자리와 같은 것들에 대한 시스템 정의를 공급 관련된 시간의 지배적 인 방법은, 부정 행위처럼 그 느꼈다. 르는 알고, 또는 그가했던 것처럼 기계가 처음부터 배울 수 있는지, 상상 도움이되지 수있는 다른 세계에서 적어도 수십 컴퓨터 과학자가 있다고 만 어렴풋이 알고하지 않았다. 2006 년 르 T의의 중세 독일 대학 도시에서 생물 인공 두뇌 학에 대한 막스 플랑크 연구소의 위치를했다 ü의 빙엔. 이 독서 그룹에서, 그는 발견 이 새로운 논문을 제프리 힌튼에 의해. 모든 변환 이야기가 긴 디아스포라 동안 훈련을 입력하고, 르 그 논문을 읽을 때, 그는 비늘을 느낀 사람들은 그의 눈에서 멀리 떨어진다.
” 큰 논쟁이 있었다, ” 그는 나에게 말했다. ” 아주 큰 논쟁. ” 우리는 작은 인테리어 회의실, 단지 작은 테이블과이 화이트 보드로 복 좁은, 높은 천장 공간에 있었다. 그는 곡선을보고 ‘ 그 뒤에 화이트 보드에 그려진 D와 다시 다음 부드럽게 털어 ” 나는 ‘ 같은 큰 논쟁을 본 적이했습니다. “
그는 독서 그룹에 서 서 하 고, 말을 기억하고 “이것은 미래입니다.”그것은, 그는 말했다에 “당시 인기없는 결정.”호주의 전직 보좌관, 그는 가까이 머물렀다 누구와 함께였다가 할 수 없었던 아주 르의 결정을 이해한다. “왜 이러는거야?”그는 이메일에서 르 물었다.
” 나는 didn를 ‘를 t은 그때 좋은 대답이, ” 르 말했다. ” 난 그냥 궁금 해서요. 이 성공적인 패러다임은했지만, 나는 새로운 패러다임에 대한 그냥 궁금해서 정직하게. 2006 년, 거의 활동이 있었다. ” 그는 스탠포드에서 잉에 가입 가서 힌튼 추구하기 시작했다 ‘ 의 아이디어를. ” 2010 년 말, 나는 일이 일어날 꽤 확신했다. “
궁극적으로 고양이 종이가 된의 확장 – 무슨 일이 있었는지, 곧 이후, 르 그는 자신의 논문 작업과에서 실시 최초의 인턴으로 뇌에 갔다이었다. 간단한 수준에서, 르 컴퓨터가 자체에 지정된 이미지에 절대적으로 필수적 정보를 식별하는 훈련을 할 수 있는지보고 싶었다. 그는 아직도 자신이 YouTube에서 촬영했다 신경망 a를 공급. 그 후 그는 그것이 나 버리지 말아야 할 것을 지정하지 않았지만, 이미지에 포함 된 정보의 일부를 버릴 신경망 말했다. 기계는 초기 랜덤, 정보의 일부를 버린. 그리고 그는 말했다 : “그냥 농담! “이미지를 요약”그가 할 수있는 방법을 찾기 위해 컴퓨터를 묻는 것처럼 그것은이었다 “이제. 당신 만이 유지 된 정보를 기반으로 게재 된 초기 이미지를 다시 한 다음 다시 원래로 요약에서 확장합니다. 요약이 부적합 데이터에 기초한 경우 – 하늘보다는 수염의 존재의 색상처럼 – 기계 유능한 재구성을 수행 할 수있다. 그 반응은 그의 테이크 아웃 세이버 – 이빨 호랑이 그의 짧은 노출 그들이 움직일 때 그들이 편안한 휙 소리를 한 것으로이었다 먼 조상의 그것과 유사하다. 르의 신경 네트워크는 그 조상과는 달리, 다시 다시 다시 다시 시도 도착합니다. 이 수학적으로 “선택”할 때마다 서로 다른 정보의 우선 순위를 더 나은 점진적으로 수행합니다. 신경망 그러나 블랙 박스였다. 이 패턴을 점쳐하지만 확인 된 패턴은 항상 인간의 관찰자에게 직관적 인 이해가되지 않았다. 고양이의 우리의 개념에 명중 동일한 네트워크는 또한 오스만과 염소 사이의 십자가처럼, 가구 동물 화합물의 일종처럼 보였다 패턴에 대한 열정이되었다.
르 언어 사람으로 그 앞뒤를 헤아 리지 않는 고양이 년 동안 자신을 보지 않았다, 그러나 그는 그의 초기 chatbot에 점을 연결하는 충동을 느꼈다. 고양이 종이 후, 그는 당신이 사진을 요약하는 네트워크를 요청할 수 있다면, 당신은 아마도 또한 문장을 요약하도록 요청할 수 있다는 것을 깨달았다. 이 문제는 다음 2 년 동안, 토마스 Mikolov라는 이름의 두뇌 동료와 함께 르를 정신.
그 시간에, 뇌 팀은 그의 주위에 여러 사무실을 빨리 성장. 잠시 동안 그들은 경영진과 공유 바닥에 있었다. 그들은 사람들이 래리 페이지 (Larry Page)와 세르게이 브린 (Sergey Brin)의 스위트 룸 앞에 소파에 잠을 할 수 있도록 중지하십시오 것을 요청하는 관리자의 한 지점에서 이메일을 받았습니다. 그것은 그들은 다음 마이크로 키친에서의 교류가 맞는 정중 한 잡담에 낭비되지 않을 것이다 거리를 가로 질러 연구 건물의 일부를 할당 된 불안 들어오는 VIP를. 즉, 중간도 잡을 구글의 경쟁 업체 측의 전용 시도를 보았다. 르 토마스 Mikolov과의 긴밀한 협력에 대해 이야기로서 (그는 “나는 마침내 자신을 도울 수 없습니다. 르가 너무 엄숙한 것 같았다 적이 없었다. 통렬한 소리 주술 방법으로, 반복해서 Mikolov의 이름을 반복 유지하고 묻기 시작 그가 …? “르가 고개를 끄덕였다.”페이스 북에 “라고 대답했다.)
그들은 정적이었다 간단한 사진 분류,뿐만 아니라 언어 나 음악처럼, 시간이 지남에 따라 전개 복잡한 구조뿐만 아니라 수용 할 수 신경 네트워크 아키텍처를 마련하려고이 기간을 보냈다. 이들의 대부분은 처음 한 1990 년대에 제안 , 르와 그의 동료들은 이삭 수있는 것을보고 그 긴-무시 기여에 다시 갔다. 예를 들어, 이메일에 적절한 응답을 예측, 또는 재치있는 대화의 흐름을 예측처럼 – 그들은 당신이 기본 언어 적 예측과 설비를 설립 한 번, 그 다음에 다른 지능형 사물의 모든 종류를 할에 갈 수 있다는 것을 알고 있었다. 당신은 외부에서 적어도, 생각처럼 많이 보일 것이다 무용의 종류까지 사이들 수있다.
파트 II : 언어 기계
5. 언어의 전원을 켭니다
뇌의 백 정도 현재 회원 – 종종 적게는 클럽이나 학력 사회 나 은하계 칸 티나가보다 거대한 기업 계층 구조 내에서 부서 같은 느낌 – 자유롭고 가장 널리 존경 직원들 사이에서 계산 개입 년 동안왔다 전체 Google 조직입니다. 큰 창문이 회사의 주요 마운틴 뷰 캠퍼스의 잎이 많은 북서부 프린지에, 협박 진회색 착 색으로 그들은 지금, 계층이 층 달걀 껍질 건물에 등분한다. 그들의 마이크로 키친 내가 사용하는 본 적이없는 주최 테이블이 있습니다; 내가 사용하는 본 적이 락 밴드 설정; 나는 보았다 이동 키트는 몇 가지 경우에 사용된다. (I는 한 번 젊은 뇌 연구 담당자가, 잘 익은 잭 프루트에 그의 동료를 소개 칠면조처럼 거대한 뾰족한 구를 조각 참조했다.)
나는 뇌의 사무실에서 시간을 보내는 시작했을 때 6 월에, 빈 책상의 일부 행이 있었다, 그러나 대부분은 표지 된 포스트 – 그것과 같은 것들을 말했다 노트 “제시, 6/27을.”이제 사람들은 모두 점령하고 있습니다. 내가 처음 방문했을 때, 주차 문제가 아니었다. 가장 가까운 공간은 임산부 또는 테 슬러 예약 사람들을했지만, 로트의 나머지 부분에 충분한 공간이 있었다. 나는 9:30 이후에 나타났다 경우 10 월, 나는 거리를 가로 질러 지점을 발견했다.
뇌의 성장은 회사가 요구를 처리하기 위해가는 방법에 대한 딘은 약간 긴장했다. 이론에있는 회사의 능력이 실제로 제품을 구현하는 능력을 능가하는 상황 – 그는 “성공 재해”로 알려져 구글에서 무엇을 피하기 위해 원했다. 특정 시점에서 그는 두 슬라이드 프레젠테이션에서 어느 날 경영진에게 제시 몇 백 – 중 – 봉투 계산을했다.
” 미래에 모든 사람이 삼분 하루 동안 자신의 안드로이드 전화로 말을하면, ” 그는 그들에게 ” 이것은 우리가 얼마나 많은 기계입니다 ‘ 필요하겠다. ” 그들은 두 번이나 글로벌 계산 발자국을 배로해야합니다.
” 즉, ” 그가 작은 연극 꿀꺽 꿀꺽 및 확대의 눈으로 관찰, ” 무서운 소리. 당신은 ‘ (D)에있다 ” – 그 결과를 상상하기 망설 – ” 새로운 건물을 구축 할 수 있습니다. “
또 다른 옵션은, 그러나,이 있었다 : 그냥 대량 생산, 설계 및 분산 된 데이터에 설치 한 센터들은 빨리 모든 것을 할 수있는 칩의 새로운 종류. 이 칩은 TPU에, 또는 “텐서 처리 장치,”자신의 가치를 호출 할 것 – 직관과는 반대로 – 그들은 의도적으로 일반 칩보다 정확한 있다는 것입니다. 12.246 회 54.392을 계산하는 것이 아니라, 그들은 신경 네트워크가 수행 행렬 곱셈의 수천 수백 또는 수천 또는 수만 단지 구조화 된 일련 오히려 은유 한 것보다, 수학 수준에 당신에게 12 회 (54)에 대한 형식적인 대답을 줄 것이다 연속 아웃하고는 정확하게보다 이러한 프로세스가 빠른 것이 훨씬 더 중요하다. “일반적으로,”딘은 말했다, “특수 목적 하드웨어는 나쁜 생각입니다. 보통 한 가지를 가속화하기 위해 노력하고 있습니다. 그러나 때문에 신경 네트워크의 일반성, 당신은 다른 많은 것들이 특수 목적 하드웨어를 활용할 수 있습니다. “
칩 설계 프로세스가 거의 완료 한 것처럼 르 두 동료 마지막 신경망 언어의 구조를 처리하도록 구성 될 수 있음을 보여 주었다. 그는이었다라는 생각, “단어 묻어”에 그린 10 년 이상 주변 . 당신이 이미지를 요약하면 요약의 각 단계의 모습의 사진 신성 수 – 등이 유사한 방식으로 언어를 요약하면 가장자리, 원을, 당신은 기본적으로 일반적인 사용에 따라, 거리의 다차원 맵을 생성 하나의 말과 언어 하나 하나 다른 단어 사이. 기계는 방식으로 데이터를 “분석”되지 않도록 우리 수도, 동사 등의 명사와 다른 사람으로 그 중 일부를 식별 언어 규칙. 대신, 이동 및 비틀림 및지도에 주변의 단어를 휘게된다. 두 가지 차원에서, 당신이지도가 유용 할 수 없습니다. 당신이 시도하려는 때문에 “밈”당신이 원하는, 예를 들어, “고양이”는 “개”의 거친 근처에있을 수 있습니다하지만 당신은 또한 “고양이”근처 “꼬리”근처 “얕보는”가까운되고 싶어 다른 모든 관계를 캡처 – 강하고 약한 두 – 단어 “고양이”다른 단어가있다. 그것은 그것을 다른 차원에서 그들 각각에 관련된 경우에만 동시에 모든 다른 단어와 관련 될 수있다. 당신은 쉽게 160,000 차원지도를 만들 수는 없지만, 당신이 단순한 천 정도 크기에서 꽤 잘 언어를 나타낼 수 있습니다 밝혀 – 즉, 우주가있는 각 단어는 천 번호 목록에 의해 지정된다 . 르가이지도의 정신 사진에 대한 내 지속적인 요청에 대해 나에게 좋은 성질이 힘든 시간을 주었다. “기드온은,”그는 “나는 일반적으로 3 차원 공간에 천 차원 벡터를 시각화하려고 좋아하지 않는다.”바틀비의 무딘 일반 demurral으로 말할 것
그럼에도 불구하고, 공간의 특정 크기, 그것은 성별 상대적 크기와 같은 읽기 쉬운 인간의 범주를 나타내는 것 같다 않았다 밝혀졌다. 당신은 문자 그대로 “왕”을 의미하고, 천 번호를했다 경우 만 공제 는 경우가 숫자에서 “여자”에 대한 숫자를 뺀 것처럼 “남자.”같은 수치 결과를 얻었다 그리고 “여왕”의미 천 번호를 당신은, 당신은 적어도 이론적으로 하나의 공간에서 문장을 다른에 해당하는 제안하는 방법은 네트워크를 훈련 할 수있는 영어와 프랑스어의 전체 공간의 전체 공간을했다. 당신은 한쪽과 다른 한편으로는 자신의 원하는 프랑스어 출력에 입력으로 그것을 수백만와 영어 문장의 수백만 제공했고, 이미지 분류 픽셀에 해당 패턴을 인식하는 시간을 통해 그 단어의 관련 패턴에게 방법을 인식 할 것이다. 그런 다음 그것을 영어로 문장을주고 최고의 프랑스어 아날로그를 예측하도록 요청할 수 있습니다.
단어와 화소들 사이의 큰 차이는 있지만, 즉 시간에 걸쳐 진행하는 반면에 표시하는 화상의 모든 화소가 동시에 존재한다는 것이다. 전체 경로를 마지막으로 첫 번째 단어에서 – 당신은 네트워크가 연대 기적 순서의 진행 “마음에 개최”할 수있는 방법이 필요했습니다. 일주일 정도의 기간에서, 2014 년 9 월에 세 개의 논문이 나왔다 – 르 하나 의 학자에 의해 두 개의 다른 캐나다 와 독일 – 에서 마지막으로 이런 종류의 작업을 수행하는 데 필요한 모든 이론적 도구를 제공하는 것이다. 그 연구는 뇌와 같은 개방형 프로젝트에 대해 허용 ‘ 의 마젠타, 기계 예술과 음악을 생성하는 방법에 대한 조사. 또한 기계 번역 같은 악기 작업을 향해 길을 지워. 힌튼은 (는)이 후속 작업은 적어도 다섯 년 이상 걸리는 시간에 생각 하더군요.
신경망이 개 같은 고양이 1 %로 분류해서는 안 경우는 더 큰 비극 없지만 자기 차를 운전과 같은에서 우리 모두가 더 큰 보장을 할 수 있습니다.
6. 매복
르의 논문은 신경 번역 그럴듯한였다,하지만 그는 단지 상대적으로 작은 공공 데이터 세트를 사용했다. (소형 구글, 즉 -.. 실제로 세계에서 가장 큰 공공 데이터 세트였다 이전 10 년은 더 큰 백 천 번 사이였습니다 생산 데이터를 수집했다 번역) 더 중요한 르의 모델은하지 않았다 일곱 단어보다 긴 문장 매우 잘 작동합니다.
다음 뇌에서 직원 연구 과학자였다 마이크 슈스터는 지휘봉을 집어 들었다. 그는 다른 사람이 것, 구글은 생산 수준이 이론적 통찰력을 확장 할 수있는 방법을 발견하지 않은 경우 것을 알고 있었다. 이 프로젝트는 향후 2 년간 그에게했다. “뭔가를 번역, 당신은 단지 데이터를 얻는 실험을 실행하고 완료,하지만 그렇게 작동하지 않습니다.”슈스터는 말한다 “당신은 생각”
슈스터는 인 긴장, 집중하는 무두질, 피스톤 모양의 머리, 좁은 어깨, 무릎과 네온 녹색 나이키 Flyknits 아래에 묶여 긴 카모 카고 반바지에있는 영원한. 그는 그의 작은, 무테, 타원형 안경에 도달 로터스 위치에 일어났다 보존 도토리의 겸손한 부분의 형태로 칼로리를 허용하고 사무실로가는 길에 편안한 사막 종 경기를 완료 것처럼 보인다; 실제로, 그는 만 18 마일 자전거 편도를 타고있어, 나에게 말했다. 슈스터는 전 서독의 고로 지구에, 뒤스부르크에서 성장, 조기 신경 네트워크에서 작동하는 교토로 이동하기 전에 전기 공학을 공부했다. 1990 년대에 그는 회의실로 큰 신경 네트워킹 시스템과 실험을 실행; 그것은 수백만 달러의 비용과 지금 시간 이내에 바탕 화면에 할 수있는 뭔가를 주 동안 훈련을했다. 그는 게시 된 1997 년 종이 거의 십 년 반 동안 인용되었다; 올해는 그 150 배의 주위에 인용되고있다. 그는 유머가 아니다, 그러나 그는 자주 독일어 구속과 일본의 구속의 자신의 서명을 조합했다 약간의 요철 (凹凸)의 식을 착용 않습니다.
문제 슈스터는 얽힌 된 처리했다. 우선, 르의 코드는 사용자 작성하고, 구글이 다음 TensorFlow 개발 된 새로운 오픈 소스 기계 학습 플랫폼과 호환되지이었다. 딘은이 새로운 시스템에 르의 결과를 복제 이개월 단지 그들을했다 2015 년 가을에, 다른 두 엔지니어의 Yonghui 우 및 Zhifeng 첸 슈스터 지시. 르 주위했지만 심지어 그는 항상 그들이 한 일의 머리 또는 꼬리를 만들 수 없습니다.
슈스터가 말했듯이, “물건 중 일부는 전체 의식에서 수행되지 않았습니다. 그들은 일을 왜 그들은 자신을 몰랐어요. “
올해 2 월, 구글의 연구 기관 – 기업의 느슨한 부문 모두에서 약 천 직원의-기대하고 분류 할 전용 – 웨스틴 세인트 프랜시스에서 오프 사이트 후퇴에 소집 그들의 리드, 유니온 스퀘어 (Union Square), A의 구글의 자신의 샌프란시스코보다 약간 덜 화려한 고급 호텔은 동쪽으로 그렇게 마일이나 가게. 아침은 연구 해안가를 덮 “, 번개 회담”의 라운드 빠른 업데이트를 예약하고, 오후는 부서 간에서 멀리 유휴했다 “용이 토론.”희망은 후퇴가 예측할 수없는, 경사에 대한 기회를 제공 할 수있는 것이 었습니다 , 벨 연구소 틱 성숙한 회사는 다작의 유지 교환.
점심 시간에, 코라와 딘은 맥더프 휴즈, 구글의 이사 번역을 찾아 짝. 휴즈 단독 섭취시키고, 두 뇌 부재 양쪽에 위치했다. 코라가 말했듯이, “우리는 그를 습격.”
” OK, ” 코라 효과에 대한 자신의 숨을 들고 조심 휴즈에게 말했다. ” 우리는 당신에 게 뭔가. “
엔지니어의 수백의 코드를 10 년 동안 – – 신경 네트워크와 그들은 2016 년 구글의 정밀 검사가 번역 고려하는 좋은 시간처럼 듯 휴즈 말했다. 기존 시스템은 모든 기계 번역 약 30 년 동안 일했다 방법을했다 : 그것은, 각각의 연속적인 문장 조각을 압수 큰 통계적으로 파생 된 어휘 표에 그 단어를 조회 한 후 적절한 엔딩을 부착하고 재 배열하는 후 처리 규칙의 배터리를 적용 모든 감각을 확인합니다. 시스템이 다음 구절에 도달하는 시간으로,이 마지막이 무엇인지 모르기 때문에 접근 방식은 “구문 기반의 통계적 기계 번역 ‘이라고합니다. 의 번역 출력이 가끔 냉장고 자석의 동요 가방처럼 보였다 이유입니다. 이 함께 온 경우 뇌의 교체, 읽고 한 드래프트에서 전체 문장을 렌더링합니다. 과 의미에 가깝다 뭔가 – 그것은 문맥을 캡처합니다.
최소한의 수익을 창출 번역, 그것은 아마 항상 것입니다 : 말뚝은 낮은 듯 수 있습니다. 대부분의 영어권 사용자의 경우, 서비스의 성능에도 급진적 인 업그레이드가 거의 예상 증가 범프보다 더 아무것도 환영되지 않을 것입니다. 그러나 인간의 품질 기계 번역 단기적인 필요성뿐만 아니라, 장기적으로 매우 높다 개발뿐만 아니라 것으로 판정되는 경우에는, 변형 증명 있었다. 가까운 미래에, 회사의 비즈니스 전략에 매우 중요합니다. Google은 인터넷 50 %의 세계 인구의 20 %가 아마도 말한다 영어는 것을 추정한다. 검색 엔진 트래픽 시장 점유율의 대부분은 경쟁 바이 지배 – – 구글이 중국에서 경쟁하려고 한 경우 또는 인도, 괜찮은 기계 번역 인프라의 필수 불가결 한 부분이 될 것입니다. 바이두 자체가 게시 한 선구 종이 2015 년 7 월 신경 기계 번역의 가능성에 대해합니다.
‘ 당신은 단지 데이터를 얻을 실험을 실행 뭔가를 번역하는 생각이 ‘ 다 다시,하지만 아무튼 ‘ 같은 t 작업. ‘
그리고 더 먼, 투기 미래에, 기계 번역은 아마도 인간의 언어와 일반적인 전산 시설을위한 첫 걸음이었다. 이 중요한 변곡점을 나타내는 것이다 – 아마도 주요 변곡점을 – 진정한 인공 지능 같은 느낌이 뭔가의 개발.
휴즈는 오는이 매복을 보았다 그래서 실리콘 밸리에있는 대부분의 사람들은 빠른 속도로 접근 수평선과 같은 기계 학습 알고 있었다. 그는 의심의 여지가 남아 있었다. 지저분 적갈색 머리가 사원에서 어지는 이른 중년의 겸손, 튼튼 내장 사람, 휴즈는 클래식 라인 엔지니어, 보잉 1970 년대에 제도 테이블에 장소에서하지 않았을 것이다 장인의 일종이다. 그의 청바지 주머니는 종종 그 주위에 이식 테이프 또는 열전대를 측정하고, 그를 위해 일하는 젊은 사람들의 많은 달리 것처럼, 그는 회사의 기어에 옷장 unreliant가, 꼴 사나운 차원의 호기심 도구 부담을 찾습니다. 하지 실험실에서하지만 생산 규모에서 – – 년 동안 거의 소용 그는 다양한 장소 구글과 다른 곳에서 다양한 사람들이 신경 번역 작업을 만들려고 노력했던 것을 알고 있었다.
휴즈는 말에, 자신의 경우를 듣고, 그들은 3 년을 해낼 수 어쩌면 것처럼 그에게 소리 것을 조심스럽게 말했다.
딘은 달리 생각했다. “우리가 우리의 마음을 세우면 우리는 올해 말까지 그것을 할 수 있습니다.”이유 중 하나는 사람들이 좋아 너무 딘 그가 성공적으로 자신의 마음을 퍼팅의 긴 기록했다이었다 존경. 또 그는 같은 진심으로 말을하는 것이 전혀 당황하지 않았다이었다 “우리가 우리의 마음을 넣어합니다.”
휴즈는 변환이 조만간 일어날 수 없습니다 확신했다, 그러나 그는 개인적 이유가 상관하지 않았다. “의 2016 년을 준비하자”고 되돌아 가게되었고, 그의 팀에게 말했다. “나는 제프 딘은 속도를 제공 할 수없는 말을 하나가 될 않을거야.”
한 달 후, 그들은 마침내 휴즈의 이전과 슈스터의 새로운 시스템을 비교하는 병렬 실험을 실행 할 수 있었다. 슈스터는 영어 – 프랑스어를 실행하고 싶었다, 그러나 휴즈는 다른 무언가를 시도하라고 조언했다. “영어 – 프랑스어,”그는 “개선이 명확하지 않을 것이다 너무 좋다”고 말했다.
그것은 슈스터가 저항 할 수있는 도전이었다. 기계 번역을 평가하기위한 벤치 마크 메트릭 많은 신뢰성 인간 번역 평균 기계 번역을 비교하는 BLEU 점수 불린다. 당시 영어 – 프랑스어에 가장 BLEU 점수가 높은 20 대에 있었다. 한 점의 개선은 아주 좋은 하였다 두개의 개선이 뛰어난 여겨졌다.
신경 시스템은 영어 – 프랑스어 언어 쌍에 7 점의 기존 시스템에 비해 개선을 보여 주었다.
휴즈는 지난 4 년 동안 자신의 시스템에 강력한 개선으로 절반도 없었했다 슈스터의 팀 말했다.
이 메트릭에 약간의 우연이 아니었다 확실히, 그들은 또한 나란히 비교를 할 인간 계약자의 자신의 수영장으로 향했다. 개발의 전체 수명 기간 동안 기존 시스템의 총 이익이 거의 비슷 – 샘플 문장이 0~6에서 등급 된에 사용자 인식 점수는 0.4의 평균 개선을 보여 주었다.
월 중순에, 휴즈는 그의 팀 이메일을 보냈습니다. 기존 시스템의 모든 프로젝트는 즉시 정지했다.
7. 이론은 제품이되다
슈스터, 우 첸 – – 그때까지 신경 번역 팀은 삼명 있었다 그러나 휴즈의 지원, 광범위한 팀은 합체하기 시작했다. 그들은 석영 호수라는 뇌 건물의 코너 룸에서 오후 2시 수요일 슈스터의 지휘하에 만났다. 회의는 일반적으로 이상 12 명의 회전 주조 참석했다. 휴즈 또는 코라가 있었다, 그들은 일반적으로 단지 영어를 모국어로했다. 그들은 대부분 자신의 효율적 피진과 수학 이야기하지만 엔지니어들은, 중국어, 베트남어, 폴란드어, 러시아어, 아랍어, 독일어, 일본어 말했다. 이 회의를 실행 구글에 항상 완전히 분명하지 않지만 슈스터의 경우에 모호성이 없었다.
그들은 심지어 한 후, 수행하는 데 필요한 단계는, 전적으로 명확하지 않았다. “이 이야기는 불확실성에 대한 많은입니다 – 전 과정에 걸쳐 불확실성,”슈스터는 한 지점에서 나에게 말했다. “소프트웨어, 데이터, 하드웨어, 사람들. “- 그의 좁은 어깨에서 팔꿈치에 약간 구부러진 그의 길고 날씬한 팔을 확장 -“그것은 같았다. 진흙의 큰 바다에서 수영하고, 당신 만이 지금까지 볼 수 있습니다 “그는 팔인치에 그의 손을 밖으로 개최 그의 가슴의 앞에. “이 목표는 곳, 그리고 어쩌면이있다.”
구글의 회의실의 대부분은, 모니터 영상 채팅 할이있는 경우 초기 화면 극도 실번의 꿈의 정경 또는 오로라 나 독일의 고해상도 과포화 공개 Google+ 사진. 슈스터는 밤에 워싱턴 기념비의 결정 여전히를 보였다 패널 중 하나를 향해 몸짓.
” 외부에서보기는 모든 사람이 쌍안경을 가지고 있으며, 지금까지 미리 볼 수 있다는 것입니다. “
학술 과학자들은 “단순한”공학으로 해제 할 수있는 부분 – – 덜 어려웠다 이미 근면과 인출되어 있지만 시도가 가능한 제품으로 바꿀했다 이론적 작업이 시점에 그들을 얻을 수 없습니다. 우선, 그들은 좋은 데이터를 훈련하고 있는지 확인이 필요했습니다. 교육의 단어를 구글의 수십억은 대부분이 헤밍웨이에서 찾을 수있는 물건의 종류와 같은 온건 한 복잡성의 완전한 문장들로 구성했다 “판독”을. 이 중 일부는 공개 도메인에 : 통계적 기계 번역의 원래 로제타 스톤은 캐나다 의회의 전체 이중 언어 기록 페이지의 수백만이었다. 그것의 대부분은, 그러나, 열정적 인 응답자에서 크라우드 소싱 된 인간의 번역을 포함하여 수집 된 데이터, 10 년에서 수집되었다. 연구팀은 “. 즉”자신의 창고에 약 97,000,000 독특한 영어했다하지만 그들은 이모티콘과 맞춤법 오류 및 중복을 제거하면, 그들은 단지 16 만 주위의 작업 어휘를했다.
그런 다음 사용자가 실제로 자주가 사용된다 합리적으로 언어와는 매우 작은 있던, 번역 원한에 집중할했다. 많은 사람들은 구글이 발견했다, 전체, 복잡한 문장을 번역하는 서비스에 보이지 않는; 그들은 언어의 이상한 작은 파편을 번역합니다. 당신은 사용자 쿼리의 스트림을 처리 할 수 있도록 네트워크를 원한다면, 당신은 그 방향으로 방향을해야했다. 네트워크는에 훈련 된 데이터에 매우 민감했다. 휴즈는 어느 곳에서 나에게 넣어 같이 “신경 번역 시스템은 할 수있는 모든 것을 배우고있다. 그것은 유아 같아요. ‘그가 화가 때 아, 아빠는 그 단어를 말한다!’ ” 그는 웃었다. ” 당신은 조심해야합니다. “
더 무엇보다,하지만 그들은 모든 일이 자신의 사용자가주의하지 않을 것이라고 빠르고 충분히 신뢰할 수있는 것을 확인했습니다. 월에 10 단어 문장의 번역은 10 초 걸렸습니다. 그들은 천천히 그 어떤 것도 소개하지 않을 수 있습니다. 번역 팀 허용치를 식별하기 위해 위조 지연의 형태로 사용자의 작은 비율에 대기 실험을 시작했다. 그들은 두 배 긴했다 번역, 심지어 5 배만큼, 등록 할 수 없습니다 것을 발견했다. 8 배나 둔화는 것. 그들은이 모든 언어에서 사실 확인이 필요하지 않았다. 프랑스어, 중국어와 같은 트래픽이 높은 언어의 경우, 그들은 사실상 침체를 묵인 수 없었다. 더 애매한 뭔가를 들어, 그들은 더 나은 품질을 받고 있다면 사용자가 그래서 약간의 지연으로 꺼져 무서워하지 않을 것을 알고 있었다. 그들은 그냥 포기하고 일부 경쟁 업체의 서비스로 전환하지 못하도록하고 싶었다.
슈스터, 그 부분에 대해, 그들도 충분히 빠르게 만들 수 있다면 그는 단지 몰랐 인정했다. 그는 첸로 전환하고, 상기하는 동안 마이크로 키친의 대화를 기억 “이 충분히 빨리 만들기 위해 우리가 모르는 뭔가해야하지만, 나는 그것을 할 수 있는지 모르겠어요.”
그는 그들이 이상의 컴퓨터를 필요가 있다고하지만, 알지 못했다 – “GPU는,”그래픽 프로세서는 신경 네트워크를 재구성 – 훈련.
휴즈는 그가 무슨 생각을 물어 슈스터에 갔다. “우리는 천의 GPU를 요청해야합니까?”
슈스터는 “2000 왜?”고 말했다
더 먼, 투기 미래에, 기계 번역은 아마도 인간의 언어와 일반적인 전산 시설을위한 첫 걸음이었다.
열흘 후, 그들은 추가 2000 프로세서 있었다.
두뇌 측에 르 같은 그들 중 일부, 그리고 번역의 많은 – 4 월, 세 가지의 원래 라인업은 30 명 이상이되었다. 월, 휴즈는 각 언어 쌍에 임시 소유자의 종류를 지정하고, 그들 모두는 성과 평가의 큰 공유 스프레드 시트로 결과를 확인. 주어진 시간에, 적어도 20 명이 자신의 독립적 인 일주일 간의 실험을 실행하고, 예상치 못한 문제가 들어오는대로 처리. 어느 날 모델은 분명한 이유도없이,이 문장에서 건너 온 모든 숫자를 복용하고이를 폐기하기 시작했다. 이 모든 터치이었고, 이동 개월이 있었다. “사람들은 거의 고함 있었다”슈스터 고 말했다.
늦은 봄으로 여러 가지가 함께오고 있었다. 연구팀은 “단어 조각 모델,”A “에 따르면 저하”, “길이 정상화라는 것을 도입했다.”각 부분은, 슈스터는 말한다, 어쩌면 몇 % 포인트 만 집계 그들이 상당한 효과를 가지고 결과를 향상시켰다. 모델 표준화 하였다되면 오히려 현재 사용 번역 150 다른 모델보다, 시간이 지남에 따라 개선 할 단일 다 언어 모델 일 것이다. 그러나 역설 – 학습 시스템을 통해 더 일반화 만들어진 도구, 자동화 프로세스가 공동 인간의 창의력과 노력 등의 특별한 금액을 요구하는 것이이 – 그들에 손실되지 않았습니다. 그들이 무슨 짓을했는지 너무 많은 단지 직감했다. 당신은 얼마나 많은 뉴런 층 당을 사용 했습니까? 1024 또는 512? 몇 층? 한 번에 얼마나 많은 문장을 통해 실행 했습니까? 당신은 얼마나 훈련을 했습니까?
” 우리는 실험의 수백했다, ” 슈스터는 나에게 말했다 ” 우리는 우리가 일주 후 훈련을 중지 할 수 있다는 것을 알고 있었다 때까지. 당신은 ‘ 항상 말을 다시 : 언제 우리가 중지합니까? 어떻게 내가 아는 ‘ 다 있어요? 당신은 당신이 모르는 ‘ 일 다시. 기계 학습 메커니즘을 완벽 적이 없다. 당신은 훈련해야하고, 어떤 시점에서 중지해야합니다. 그것은 ‘ 이 전체 시스템의 매우 고통스러운 성격이야. 그것은 ‘ 어떤 사람들에게는 어렵다. 그것은 ‘ 약간에게 예술이야 – 이 좋은 수 있도록 당신이 당신의 브러시를 넣어. 그것은 단지 그 일에서 비롯됩니다. 어떤 사람들은 몇 가지 더, 더 낫다. “
월함으로써, 뇌 팀은 유일한 방법은 그들도 그들이 TPU에, 딘 요구했던 특수 목적 칩에서 실행 할 수 있다면 제품이 있다는 구현 충분히 빠르게 시스템을 만들려고 있다고 이해했다. 첸 넣어 같이 코드가 작동한다면 “우리는 알지도하지 않았다. 그러나 우리는 TPU를하지 않고, 그것이 알고 않았다 확실히 작동하지 않을했다. 우리를 위해 뭔가를 예약하십시오. “딘을 예약했다”그는 주장 하나에 딘 하나에가는 기억합니다 “. 의 TPUs 그러나, 상자 밖으로 바로 작동하지 않았다. 우 이유를 파악하기위한 시도로 다음 하드웨어 팀의 누군가에 앉아 두 달 동안. 그들은 단지 모델을 디버깅되지 않았다; 그들은 칩 디버깅했다. 신경 번역 프로젝트는 전체 인프라 투자에 대한 개념 증명 될 것이다.
유월 안에 하나 수요일, 석영 호수에서 회의에 대한 들려오로 시작 바이 용지 최근 분야의 최고 온라인 포럼에 출연했다. 슈스터는 주문 방을 가져왔다. “예, 바이두는 종이로 나왔다. 그것은 우리의 어깨를 통해 찾고 사람 같은 느낌 -. 비슷한 구조, 유사한 결과 “회사의 BLEU 점수 구글이 월과 3 월에 내부 테스트에서 달성 본질적으로 무엇인가. 르 프릴 보이지 않았다; 그의 결론은 구글이 바른 길에 있던 기호라고 보입니다. “그것은 우리의 시스템과 매우 유사하다”고 조용한 승인했다.
Google 팀은 이전에 결과를 게시 한 수 있음을 알고 아마도 그들의 경쟁을 구타,하지만 슈스터 그것을 넣어 : “런칭은 게시보다 더 중요하다. 사람들은 ‘아, 내가 먼저 뭔가했다’라고하지만 누가 결국, 관심? “
이것은, 그러나, 그것은 필수적가 처음과 더 나은 자신의 서비스를 얻을 수 있도록했다. 휴즈는 그들은 심지어 스위치의 사용자들에게 알려하지 않을 환상을 가지고 있었다. 그들은 단지 기다릴 소셜 미디어는 광대 한 개선 사항에 대한 의혹에 불을 경우 볼 것입니다.
” 우리는 돈 ‘를 t이하고 싶은 말은 ‘ 아직 새로운 시스템을이야, ” 그는 노동절 이후 오후 5:36 이일 저에게 1 분 그들이 말하지 않고, 자신의 사용자의 10 %로 중국에 영어를 출시하기 전에 누군가. ” 우리는 그것이 작동하는지 확인하고 싶습니다. 이상적인는 점이다 ‘ : 트위터에 폭발하는 s의 ‘ 당신은 구글이 가지고 번역 방법 멋진 봤어? ‘ “
8. 축하
한여름의 pluots에서 초가을의 아시아 배, 후유 감에 – – 기술 진보의 지그재그 seasonless 실리콘 밸리에서 시간의 두 신뢰할 수있는 조치는 microkitchens 계절 과일의 회전이다. 9 월 말에 거의 불편 따뜻한 월요일 오후, 팀의 종이되었다 마침내 발표했다. 그것은 거의 코믹 (31) 작가를했다. 다음 날, 뇌의 회원과 자체 번역 마이크로 키친에서 작은 기념 리셉션 던져 수집 번역. 아마도 자신의 디아스포라의 긴 겨울에 경의에, 알래스카 로케일의 이름을 따서 명명 된 뇌 건물에 객실; 번역 건물의 주제는 하와이입니다.
하와이 마이크로 키친은 하나의 벽, 종이 등불을 닮은 장착 센터 및 천장 비품에 박제 앵무새 작은 레이 – 화환 초가 오두막 서비스 카운터에 약간 거친 해변 사진을 보유하고 있습니다. 대나무의 두 스파 스 히스토그램은 잘못 방어 열대 요새의 글처럼, 측면 라인. 양쪽에 동일한 회색 책상의 행 위에 열려 대나무, 유리 벽과 문 너머. 그날 아침 번역 10 년을 존중하는 새로운 후드 스웨터의 도착을 보았다, 많은 팀 구성원들은 새로운 장비에서 자신의 책상에서 파티에 갔다. 그들은 집단 일 자신의 십 년간 그 날의 등, 퇴직 도중에, 있다는 사실을 축하 부분에 있었다. 다른 기관에서, 새로운 후드 따라서 사별의 의상이 될 수도 있지만, 두 팀의 엔지니어 및 컴퓨터 과학자들은 모두 기뻐 보였다.
‘ 그것은 진흙의 큰 바다에서 수영처럼, 그리고 당신은 단지 여기까지 볼 수 있습니다. ‘ 슈스터는 그의 가슴 앞에서 손 팔인치을 개최했다.
구글의 신경 번역은 마지막 작업이었다. 파티의 시간으로,이 회사의 중국 영어 시험은 이미 1800 만 쿼리를 처리했다. 번역 팀의 한 엔지니어는 바이두의 대안을 사용하여 영어로 중국어에서 전체 문장을 번역하려고, 자신의 휴대 전화 밖으로 돌아 다니고 있었다. 그는 듣지도 않을거야 누구에 기쁨과 함께 울었다. “당신이 한 번에 두 개 이상의 문자를 넣어 경우, 시간 초과!”(Baidu는이 문제는 사용자가보고 된 적이 말한다.)
단어를 구글이 영어로 중국어 신경 번역을 도입했다고, 다음 주에 걸쳐 확산하기 시작했을 때, 어떤 사람들은 그 회사가 괜찮은 결과를 가지고있는 유일한 언어 쌍 이었기 때문에 그것이 것으로 추측. 파티에서 모두가 자신의 성취의 현실은 11 월에 분명히있을 것이라고 알고 있었다. 다음으로, 그러나, 그들 중 많은 사람들이 다른 프로젝트에있을 것입니다.
휴즈는 그의 목을 삭제하고 티키 바의 앞 계단. 그는 가볍게 속건의 어두운 밴드로 중앙부를 가로 질러 패터닝 구겨진 모습 칼라와 머 금고 녹색 폴로를 착용했다. 종이에 매우 큰 측정 오차 및 시스템의 이상한 문장 부호 관련 버그를 포함하여 최신 문제, 다음 마지막 마지막 순간에 문제가 있었다. 그러나 모든 것이 해결되었다 – 또는 적어도 충분히 순간 결심했다. 손님은 앉았다. 휴즈는 maundering 또는 측면 대화에 대한 낮은 허용 오차, 효율적이고 생산적인 회의를 실행,하지만 그는 행사의 중력에 의해 일시 정지를 받았다. 그는 그가 은유 스트레칭, 아마도 것을 인정하지만 사실을 강조하기 위해 그에게 중요했다, 그는 신경 번역 프로젝트 자체가 표현되는 것을 시작 “다른 언어를 말했다 그룹 간의 협력을.”
그들의 신경 – 번역 프로젝트, 그는 계속 “앞으로 단계 기능의”대표 – 즉, 불연속 사전, 수직 도약보다는 부드러운 곡선을. 관련 번역은 두 팀 사이에 있지만 이론에서 현실로 단지 있었다. 그는 비싼 보이는 샴페인의 플라스틱 데미 플루트를 올렸다.
” 통신에, ” 그는 말했다, ” 협력! “
조립 엔지니어들은 서로에 주위를 둘러 보았다 거의 신중 와아하는 외침 소리와 박수에 자신을 이상했다.
제프 딘은 마이크로 키친의 중심 근처에 서서 자신의 주머니에 자신의 손, 어깨는 코라와 슈스터와 약간 안쪽으로 구부리고. 딘은 그 행사의 준수에 기여 일부 확산 선호도가 있다고보고, 그는 빛, 빠르고 간결한 추가와 더불어, 특징적으로 절제된 방식으로 그렇게했다.
그들이 보여 주었다 무엇 딘은 한 번에 두 가지 일을 할 수 있다고했다, 말했다 : “. 연구를 수행하고 난 절반 억 명을 몰라 앞에 그것을 얻을”
모든 사람은 과언이 아니었다 때문에 웃었다 그러나 그것은 아니었다 때문이다.
에필로그 : 유령없이 기계
아마도 인공 지능의 가장 유명한 역사적인 비판, 또는 그 대신의 주장은, 번역의 문제를 연루. 중국 룸 인수는 버클리 철학자 존 설에 의해 1980 년에 제안되었다. Searle은의 사고 실험에서, 단일 언어 영어 스피커는 셀에 혼자 앉아있다. 보이지 않는 간수는 한자로 표시된 종이 전표, 도어의 슬롯을 통해 그에게 전달합니다. 수용자는 회신 조성물 영어로 테이블 및 규칙 집합을 받고있다. 그는 자신의 대답이 곧입니다이 지침에 매우 숙달된다 “중국어 스피커와는 절대적으로 구별.”불운 한 죄수 중국을 “이해”라고 할 것인가? Searle은 대답은 분명하지라고 생각했다. 컴퓨터에 대한이 은유는 Searle은 나중에 썼다는 주장 폭발 “오른쪽 입력과 출력을 적절하게 프로그램 된 디지털 컴퓨터함으로써 인간의 마음을 가지고 정확하게 의미에서 마음을해야합니다.”
구글 브레인 팀,하지만, 또는 실리콘 밸리의 기계 학습에서 작동 다른 거의 모든 사람을위한, 해당 뷰는 완전히 지점 옆에있다. 이것은 그들이 단지 철학적 질문을 무시하는 것은 아닙니다. 그것은 그들이 마음의 근본적으로 다른 전망을 의미한다. Searle은 달리, 그들은 “의식이”특별한, numinously 빛나는 정신의 속성이라고 생각하지 않습니다 -. “기계의 유령”철학자 길버트 라일이라는 것을 그들은 단지 기술의 복잡한 구색은 우리가 “의식”전화 대신 생각 무작위로 여러 가지 간단한 메커니즘의 조정 활동에서 등장했다. 암시는 우리가 생각의 높은 레지스터를 고려할 것을 우리 시설 우리는 낮은 레지스터로 인식하고 싶어하는지의 종류에는 차이가 없다는 것이다. 논리적 추론은,이 계정에, 행운의 적응으로 볼 수있다; 그래서 던져 공을 잡으려고하는 기능입니다. 인공 지능은 마음을 건물에 관하여이지 않는다; 그 문제를 해결하기위한 도구의 개선에 관하여. 코라가 구글 내 첫 날 나에게 말했듯이, “그것은 ‘하지’기계가 ‘알고있다’또는 ‘이해’하지만 어떤 것에 대해 아니에요 및 – 더 중요한 것은 – 아직하지 않는 것을.”
당신이 “일”대 “알고”에 내려와 경우 실제 문화적, 사회적 의미를 가지고있다. 파티에서, 슈스터 용지의 미디어 리셉션 자신의 불만을 표현하는 나에게 다가왔다. “당신은 첫 기자 봤어?”그가 나에게 물었다. 그는 그 아침부터 제목을 의역 그가 그것을 항에있어서, 자신의 손으로 말씀으로 그것을 단어 차단 : Google은 AI의 번역은 ‘경우 인체 구별 할 수 있다고 말했습니다. 용지의 조성의 마지막 주 동안 팀이 고생했다; 슈스터는 종종 용지의 메시지는 “그것은 그 이전보다 훨씬 더하지만, 인간만큼 좋은 아니에요.”그는 그들의 노력은 사람을 대체하지만 그들을 돕는 대해되지 않은 것이 분명 될 것 기대했던 것을 반복했다.
우리가 우리를 위해 특별한 장소를 개척하는 그럼에도 불구하고 기계 학습의 상승은 더욱 어렵게 만든다. 당신이 생각하는 경우, Searle은 함께, 인간에 대한 특별한 뭔가가 있음을 “통찰력은,”당신은 자동화에서 인간을 구분하는 명확한 선을 그릴 수 있습니다. 당신이 Searle은의 길항제에 동의하는 경우, 당신은 할 수 없습니다. 많은 사람들이 이전보기로 빠른 집착하는 이유는 이해할 수있다. 인공 지능의 뿌리에 대한 2015 MIT 컨퍼런스에서 노암 촘스키는 그가 기계 학습 어떻게 생각하는지 질문을 받았다. 그는 단순한 통계 예측, 영광 일기 예보로 전체 기업을 푸우 – poohed. 신경 번역 최적 기능을 달성하더라도 언어의 기본 특성에 대한 지대한 것도 알려주지 것이다. 대명사가 여격 또는 대격 사건을했다 경우 당신을 말하지 않을 수 있습니다. 예측의이 종류는 우리의 목적을 달성하기 위해 좋은 도구를 만들지 만, 그것은 일을 그들이 할 방법이 일어날 이유에 대한 우리의 이해를 발전의 기준으로 성공하지 않습니다. 기계는 이미 인간의 방사선보다 더 나은 의료 검사에서 종양을 감지 할 수 있지만 기계는 암을 일으키는 무엇을 말할 수 없다.
그럼 다시, 방사선과 의사가 할 수있는?
의료 진단은 대부분 즉시 하나의 필드, 그리고 아마도 예측할 수, 기계 학습에 의해 위협했다. 방사선은 광범위하게 교육을 매우 잘 지불, 우리는 전문적인 통찰력의 하나로서 자신의 기술을 생각하는 – 생각의 가장 높은 레지스터. 혼자 지난해 연구자들은 보여 주었다뿐만 아니라 신경 네트워크는 훨씬 이전에 자신의 인간에 비해뿐만 아니라 기계도 병리 보고서의 텍스트에서 이러한 진단을 할 수있는 의료 영상에서 종양을 찾을 수있다. 무엇 방사선 할 것은 논리적 분석보다 예측 패턴 일치에 훨씬 더 가까이 뭔가 것으로 밝혀졌습니다. 그들은 암의 원인을 알려주하지 않는; 그들은 그냥 거기 말하고 있습니다.
당신이 하나의 목적을 위해 강력한 패턴 매칭 장치를 구축 한 후에는 다른 사람의 서비스 불통 될 수있다. 하나는 엔지니어가 그 작품을 판단하기 위해 함께 넣어 네트워크를 가져다 자치 무선 조종 자동차를 운전하는 데 사용 번역. 고양이를 인식하도록 구축 된 네트워크는 돌아 보았고, CT 스캔에 대한 교육을 할 수 있습니다 – 그리고 무한히 더 많은 예제에 심지어 최고의 의사는 지금까지 검토 할 수있는 것보다. 시간의 가장 작은 부분에서의 법률 발견 된 문서의 페이지의 수백만을 통해 일할 수있는 번역 구축 된 신경망은 가장 비싸게 자격을 변호사를 취할 것입니다. 자동 기계에 의해 촬영 작업의 종류는 더 이상 예전 만 반복 작업 수 없습니다 – 부당,이 강조되어야한다 – 교육받지 못한 계급의 가정 낮은 지능과 관련. 우리는 세 가지 곧 경력을 결여 수 50 만 트럭 운전사에 대해 얘기 아닙니다. 우리는 재고 관리자, 경제학자, 금융 컨설턴트, 부동산 에이전트에 대해 얘기하고. 무엇 뇌 아홉 달 동안 한 일은 큰 회사에서 작은 그룹 이제까지 기계와 관련된 것 태스크 아무도을 자동화 할 수 있습니다 얼마나 빨리의 한 예입니다.
지금 실리콘 밸리에서 일어나는 가장 중요한 것은 중단되지 않습니다. 규모에 모두 인류 역사상 아마 전례가있다 속도로 – 전력의 통합 – 오히려 기관 건물입니다. 뇌는 인턴이있다; 그것은 주민이있다; 그것은 다른 부서에있는 사람들을 훈련하는 “닌자”클래스가 있습니다. 모든 지역이 무료 자전거 헬멧의 쓰레기통, 무료 녹색 우산 이틀 비가 년, 그리고 약간의 과일 샐러드, 그리고 낮잠 포드, 공유 트레드밀 데스크, 마사지 의자, 하이 엔드 파이의 임의의 종이팩이 있고, 아기 옷 기부 장소 및 일정 강사와 함께 두 개의 층 등반 벽, 독서 그룹과 정책 회담 및 다각적 지원 네트워크. 그들이 어떤 디지털 소금 광산에서 proles에 대한 특권보다 훨씬 더 많은 것을 위해 – – 인간의 재배에서 이러한 주요 투자받는 사람은 손에 4 개 대륙 충분한 전기 그릴, 데이터 센터에 13 데이터 센터에 분산 복잡하게 통합 된 서버의 전원을 대도시에 불을합니다.
그러나 구글과 같은 심지어 거대한 기관은 자동화의 물결 대상이 될 것입니다; 기계가 인간의 연설에서 배울 수하면, 프로그래머도 편안한 작업이 위협 받고있다. 티키 바에서 파티가 끝 나가고 된 바와 같이, 번역 엔지니어는 휴즈 뭔가를 보여주기 위해 자신의 노트북을 통해 가져왔다. 화면이 소용돌이 주기적으로 한 번 더 분산하기 전에 성운으로 붕괴 긴 루프 궤도에 밝은 색깔 분야의 생생한, 만화경 애니메이션 펄스.
휴즈는 지금 당장 무엇인지,하지만 난 모든 이름보고하기 전에 면밀히 지켜 볼 수밖에 없었습니다 – 사람과 파일을. 그것은 모든 마지막 팀 구성원에 의해 번역 코드베이스, 매일 윙윙과 피 기여에 대한 변경의 10 년 역사의 애니메이션이었다. 휴즈는 일시 중지하고 먼 캠페인, 이제 다른 곳에서 흡수하는 나 자신에 파열에 의해 서둘러 고대 승리 또는 재앙을 기억 한 동안 모든 중지, 2,008에서 2,006 사이에서 2015 년, 앞으로 건너 뛰기 부드럽게 이상에 도달했습니다. 휴즈는 제프 딘의 이름이 빛나는 구체에 여기 저기 확장하는 빈도를 지적했다.
휴즈는 코라를 통해이라고, 이들은 꿰 서 있었다. 우울한 향수의 마법을 깰, 코라는, 상처를 조금보고, 고개를 말했다 “그래서 때 우리가 그것을 삭제 어떻게해야합니까?”
‘ 돈 ‘ 그것에 대해 t 걱정, ” 휴즈는 말했다. ” 새로운 코드베이스는 증가 할 것입니다. 모든 성장한다. “