차원이 다른 구글 번역기의 도래 (12)
2017년 1월 30일  |  By:   |  IT, 세계  |  5 Comments

구글이 인간의 신경망을 본뜬 인공신경망에 딥러닝을 적용해 지금까지 우리가 알던 번역기와는 차원이 다른 인공지능 번역기를 선보였습니다. 지난달 14일 새로운 구글 번역기를 집중적으로 분석한 뉴욕타임스의 기사 “The Great A.I. Awakening”을 소개합니다.

처음부터 보기

11부 보기

 

에필로그: 귀신 씌우지 않은 기계

역사상 인공지능에 대한 가장 유명한 비판, 혹은 인공지능의 한계를 드러내려 한 주장을 꼽을 때 빠지지 않고 등장하는 사례가 아마도 인공지능의 번역 능력의 한계를 지적한 실험일 것이다. 중국어방 논쟁(Chinese Room argument)이라 불리는 이 사고 실험은 1980년 버클리대학교의 철학자 존 설(John Searle)이 고안해냈다. 영어밖에 말할 줄 모르는 사람이 방 안에 혼자 있고, 중국어가 적혀있는 종이 여러 장이 주어진다. 이어 중국어로 적힌 질문지가 주어지는데, 현재 처한 상황과 실험 규칙, 그리고 미리 주어진 답안지의 보기가 각각 어떤 뜻인지는 영어로 설명해준다. 이 사람은 중국어를 전혀 할 줄 모르지만, 이내 상황을 숙지해 주어진 질문에 한해서는 중국어 원어민에 전혀 뒤지지 않는 정답을 내놓게 된다. 그렇다면 이 사람이 중국어를 알아듣는다고 할 수 있을까? 당연히 그렇지 않다. 설도 그렇게 생각했다. 설은 나중에 이 상황을 컴퓨터에 비유하며 “입력값과 출력값을 잘 맞춰 프로그램화한 디지털 컴퓨터가 사람의 마음과 마찬가지로 마음을 갖게 된다”는 주장을 일축했다.

하지만 구글 브레인 팀원이나 실리콘 밸리에 있는 머신러닝 관련 종사자 대부분은 설의 논리가 완전히 요점에서 벗어났다는 걸 잘 알고 있다. 이들이 철학적 논의 자체를 무시하거나 외면한다는 뜻이 아니다. 다만 이들이 생각하는 마음에 대한 정의는 설이 내린 정의와 근본적으로 다르다. 설과 달리 그들은 의식 혹은 지각(consciousness)을 어떤 특별한 것, 혹은 신비하고 성스러운 정신 작용이나 정서적 속성이라고 여기지 않는다. 철학자 길버트 라일(Gilbert Ryle)은 “귀신 씌운 기계(ghost in the machine)”라는 표현을 썼다. 대신 그들이 생각하는 의식 혹은 지각이란 수많은 간단한 메커니즘이 무작위로 선택되는 가운데 조화롭게 작용해 일어나는 복잡한 기술의 종합일 뿐이다. 다시 말해 우리가 이른바 고차원적인 기능이나 특징이라고 여기는 것도 사실은 상대적으로 간단하고 기본적인 기능이라고 생각하는 것과 근본 원리가 전혀 다르지 않다는 뜻이다. 논리적 추론 기능이 공을 던지거나 받는 기능보다 더 뛰어나거나 우수하지 않고, 그저 운이 좋아서 더 복잡한 과정을 수행하게 된 것이다. 인공지능에 접근하는 철학도 이런 생각에 기반을 둔다. 무언가 신비로운 마음을 인위적으로 만들어내는 게 아니라, 그저 문제를 해결하는 데 필요한 도구를 좀 더 복잡한 임무를 해낼 수 있게 가다듬는 것이다. 내가 구글에 처음 방문한 날 코라도가 내게 했던 말도 결국 정확히 같은 맥락이다. “기계가 무엇을 알고, 이해하느냐는 중요하지 않아요. 기계가 무슨 임무를 수행하느냐가 중요하죠. 그보다 아직 기계로 해보지 않은 일이 무언지 그 미답의 영역을 탐구하는 일이 결국 더 중요하겠지만요.”

“아는 것”과 “하는 것”의 차이를 둘러싼 해석은 사실 문화적, 사회적 함의가 매우 큰 부분이기도 하다. 축하파티 자리에서 슈스터는 내게 연구 논문을 보도하며 언론들이 뽑은 제목에 적잖이 당황했다고 털어놓았다. “뉴스 보셨어요?” 그는 그날 조간신문에 실린 기사의 제목을 한 단어 한 단어 짚어가며 이미 외운 듯이 읽어 내려갔다. “인공지능 번역은 이제 인간이 한 번역과 구분하기 어려운 수준까지 왔다고 구글이 말했다.” 논문 마무리 단계에서 팀 전체가 사실 이 문제로 머리를 싸맸다. 슈스터는 이 논문의 요지가 “지난 번역기보다는 훨씬 나아졌지만, 여전히 사람의 번역에는 미치지 못한다.”는 것이라고 여러 차례 강조했다. 그는 또한 구글이 사람을 대체하려는 기술을 개발하는 게 아니라 기술을 통해 사람에게 도움을 주고자 한다는 점이 부각되면 좋겠다고 생각했다.

머신러닝의 발전으로 결국 인간만이 할 수 있는 고유의 영역이 점점 줄어드는 건 분명한 사실이다. 존 설이 그랬던 것처럼 인간의 고유한 “통찰력”이라는 것이 있다고 믿는다면 인간과 기계를 명확히 구분할 수 있다. 반대로 설의 논지와 가정을 받아들이지 않는다면, 인간이 한 일과 기계가 한 일 사이에 근본적인 차이는 없다는 결론에 이르게 된다. 많은 사람은 전자의 견해, 즉 사람과 기계는 근본적으로 다르다는 생각을 좀처럼 버리지 못한다. 2015년에 MIT에서 인공지능의 기원을 논의하는 콘퍼런스가 열렸다. 머신러닝에 관해 어떻게 생각하느냐는 질문에 노암 촘스키(Noam Chomsky) 교수는 머신러닝 기술과 관련 산업이 잘 포장한 기상 예보 같다며 정교한 통계 예측에 불과하다고 평가했다. 신경망 번역이 뛰어난 성능을 입증했다지만, 결국 재료로 쓰는 언어 자체에 대해서는 아무런 깊이 있는 분석도 내놓지 못했다는 설명이 뒤따랐다. 어떤 대명사가 이 문장에서 여격으로 쓰였는지 직접목적격으로 쓰였는지 인공지능은 알려주지 않는다. 인공지능이 내놓는 분석과 예측은 우리가 이루고자 하는 바를 이루는 데 도움이 되지만, 분석한 현상 자체가 왜 일어났는지 근본적인 원인을 탐구하는 데는 별 도움이 되지 않는다. 기계는 이미 방사선과 의사보다 종양을 더 잘 찾아낸다. 그렇지만 기계는 암이 왜 일어났는지는 전혀 모른다.

여기서 잠깐, 그렇다고 방사선과 의사가 암을 진단할 때 그 원인까지 알려주나? 그렇지도 않다.

의료 진단 분야는 아마도 예상외로 머신러닝을 장착한 기계가 사람이 하던 일을 가장 빨리 대체하게 될 분야 가운데 하나로 꼽힌다. 폭넓은 분야에서 힘든 수련 과정을 거치는 방사선 전문의들은 많은 돈을 번다. 우리는 대개 방사선 전문의의 기술이 대단히 고차원적 사고에 해당하는 전문적인 통찰의 영역이라고 생각한다. 하지만 지난해 연구진은 인공지능 신경망이 엑스레이를 비롯한 의료 영상을 보고 사람보다 훨씬 빨리 종양을 발견해낼 수 있다는 사실뿐 아니라, 의료 기록 등 병리 보고서 내용을 분석해 진단을 내릴 수 있다는 사실도 입증했다. 방사선 전문의가 하는 일이란 결국 대단히 고차원적인 논리 분석이라기보다 환자에게서 나타나는 여러 가지 패턴을 분석해 예후를 알려주는 일에 가까웠던 셈이다. 의사도 환자가 왜 암에 걸렸는지 원인을 짚어주지는 않는다. 그저 지금 종양이 어디에 있다는 소식을 알려줄 뿐이다.

어떤 임무를 수행하는 데 필요한 패턴 인식 및 분석을 훌륭히 수행하는 장치는 원리만 같다면 다른 일에도 응용할 수 있다. 구글 번역팀의 엔지니어 한 명은 그가 만든 신경망으로 예술 작품을 평가하게 해봤고, 자율 무선 조종 자동차를 조종하는 일도 맡겨봤다. 고양이를 판별하는 데 쓴 신경망은 CT 사진을 학습하고 분석하는 데 쓰일 수 있다. 신경망은 제아무리 최고의 의사라도 인간이 평생 섭렵할 수 있는 사진보다 더 많은, 사실상 무한대에 가까운 사진을 학습하고 저장할 수 있다. 번역을 하도록 제작된 신경망이 수백만 쪽에 달하는 법률 문서를 분석하는 데 드는 시간은 얼마 되지 않는다. 변호사들에게 값비싼 돈을 치르고 맡기면 적어도 몇 달은 걸리던 작업이 순식간에 완료된다. 자동화로 인해 사라질 일자리는 더이상 주로 교육수준이 낮은 노동계급이 하는 일로 여겨지던 소위 반복적인 저숙련 노동만이 아니다. 자율주행 자동차가 상용화되면 가장 먼저 일자리를 잃게 될 트럭 운전사 350만 명에 국한된 이야기가 아니라는 뜻이다. 재고 관리 책임자, 경제학자, 금융 전문가, 공인중개사까지 사실상 거의 모든 분야가 자동화의 영향을 받게 된다. 구글 브레인이 불과 아홉 달 만에 이뤄낸 성과는 지금껏 아무도 기계가 할 수 있다고 진지하게 생각한 적 없던 일을 기계에 학습하고 훈련하는 데 성공한 사례다. 그것도 대기업에 있는 아주 작은 부서의 몇 안 되는 사람이 이룩한 성과다.

실리콘 밸리 하면 떠오르는 단어 가운데 이른바 판을 깨는 혁신적인 변화를 뜻하는 ‘disruption’이란 단어가 있다. 지금 실리콘 밸리에서는 그저 이렇게 판을 깨는 변화만 일어나는 게 아니다. 대신 인류 역사상 아마도 전례가 없는 규모와 속도로 새로운 체제가 형성되고 그를 둘러싼 권력이 이미 굳어지고 있다. 구글브레인 팀에 속한 인턴과 겸직 상주 직원들은 구글 내 다른 부서에 아무도 모르게 파견을 다니며 구글에서 일하는 동료들을 가르친다. 누구나 쓸 수 있는 무료 자전거 헬멧, 일 년에 비 오는 날이 기껏해야 이틀쯤 되지만 언제나 비치된 녹색 우산, 과일 샐러드, 낮잠을 자거나 눈을 붙일 수 있는 소파, 누구나 운동하며 업무를 볼 수 있는 공용 트레드밀 책상, 마사지 의자, 종종 등장하는 고급 빵을 담은 소쿠리, 아기 옷을 나누어 쓰고자 기증을 받는 곳, 정해진 시간에 강사가 오는 실내 암벽등반 코스, 독서 모임, 정책 집담회에 수많은 지원 혜택에 이르기까지, 구글 직원이 누리는 혜택은 다른 디지털 회사에서 일하는 직원들보다 훨씬 다양하다. 이런 혜택을 누리는 구글 직원들은 전 세계 4개 대륙에 걸쳐 있는 13개 데이터 센터를 총괄하는 대단히 복잡한 협업 서버를 관리한다. 구글의 데이터 센터는 워낙 방대해 이를 가동하는 데만 웬만한 대도시의 전력 수요를 충당하고도 남을 만한 전기가 든다.

하지만 이렇게 거대한 구글 같은 조직도 자동화의 물결을 온전히 피해갈 수 없다. 기계가 사람의 언어와 대화를 완전히 분석하고 이해하게 되면 프로그래머 직종이 위협받을 날이 올 것이다. 구글 번역팀에서 열린 자축연이 끝나갈 무렵, 엔지니어 한 명이 자신의 랩톱 컴퓨터를 들고 오더니 휴즈에게 무언가를 보여줬다. 긴 궤도를 도는 밝은색의 구(球)들이 선명하고 변화무쌍한 모습으로 맥박이 뛰듯 움직이다가 주변의 성운으로 소용돌이치듯 흡수되고 다시 분해되기를 반복하는 화면이었다.

휴즈는 엔지니어가 들고 온 화면이 무언지 단번에 알아차렸지만, 나는 도무지 감을 잡을 수 없었다. 화면을 자세히 들여다보니 무수히 많은 사람 이름과 파일 목록이 있었다. 지난 10년간 구글 번역팀이 개발하고 활용한 각종 코드와 관련 팀원의 이름, 이들의 업적을 빠짐없이 모아 시각화 영상으로 만든 것이었다. 휴즈는 화면을 빠르게 감으며 2006년에서 2008, 이내 2015년으로 넘겼다. 오래전 진행했던 기억에 남는 프로젝트나 성과 혹은 실패를 떠올리며 잠깐이지만 기억에 잠기는 듯했다. 이제 이 모든 과거와 자산은 새로운 시스템에 흡수되거나 임무를 마치고 역사로 기록될 운명이었다. 휴즈는 제프 딘의 이름이 여기저기서 수도 없이 등장하는 영상을 가리켰다.

휴즈는 코라도를 불렀다. 그들은 꼼짝 않고 서서 영상을 바라보았다. 아련한 과거의 기억에서 벗어나기라도 하려는 듯 코라도가 휴즈에게 말했다.

“이 기록은 언제 지우면 될까요?”

그러자 휴즈가 말했다.

“걱정 말아요. 이내 새로운 코드 양식이 발전해 과거를 대체할 테니까요. 정말 금방이더라고요.” (뉴욕타임스)

원문보기

 

다음은 오늘 소개한 부분의 영어 원문을 구글 번역기가 우리말로 옮긴 것입니다. (맞춤법, 띄어쓰기, 문장의 종결 어미, 고유명사 등은 일부 고쳤습니다)

—–

에필로그 : 유령없이 기계

아마도 인공 지능의 가장 유명한 역사적인 비판, 또는 그 대신의 주장은, 번역의 문제를 연루. 중국 룸 인수는 버클리 철학자 존 설에 의해 1980 년에 제안되었다. Searle은의 사고 실험에서, 단일 언어 영어 스피커는 셀에 혼자 앉아있다. 보이지 않는 간수는 한자로 표시된 종이 전표, 도어의 슬롯을 통해 그에게 전달한다. 수용자는 회신 조성물 영어로 테이블 및 규칙 집합을 받고있다. 그는 자신의 대답이 곧입니다이 지침에 매우 숙달된다 “중국어 스피커와는 절대적으로 구별.”불운 한 죄수 중국을 “이해”라고 할 것인가? Searle은 대답은 분명하지라고 생각했다. 컴퓨터에 대한이 은유는 Searle은 나중에 썼다는 주장 폭발 “오른쪽 입력과 출력을 적절하게 프로그램 된 디지털 컴퓨터함으로써 인간의 마음을 가지고 정확하게 의미에서 마음을해야 합니다.”

구글 브레인 팀, 하지만, 또는 실리콘 밸리의 기계 학습에서 작동 다른 거의 모든 사람을위한, 해당 뷰는 완전히 지점 옆에있다. 이것은 그들이 단지 철학적 질문을 무시하는 것은 아니다. 그것은 그들이 마음의 근본적으로 다른 전망을 의미한다. Searle은 달리, 그들은 “의식이”특별한, numinously 빛나는 정신의 속성이라고 생각하지 않습니다 -. “기계의 유령”철학자 길버트 라일이라는 것을 그들은 단지 기술의 복잡한 구색은 우리가 “의식”전화 대신 생각 무작위로 여러 가지 간단한 메커니즘의 조정 활동에서 등장했다. 암시는 우리가 생각의 높은 레지스터를 고려할 것을 우리 시설 우리는 낮은 레지스터로 인식하고 싶어하는지의 종류에는 차이가 없다는 것이다. 논리적 추론은,이 계정에, 행운의 적응으로 볼 수 있다; 그래서 던져 공을 잡으려고하는 기능입니다. 인공 지능은 마음을 건물에 관하여이지 않는다; 그 문제를 해결하기위한 도구의 개선에 관하여. 코라가 구글 내 첫 날 나에게 말했듯이, “그것은 ‘하지’기계가 ‘알고있다’또는 ‘이해’하지만 어떤 것에 대해 아니에요 및 – 더 중요한 것은 – 아직하지 않는 것을.”

당신이 “일”대 “알고”에 내려와 경우 실제 문화적, 사회적 의미를 가지고있다. 파티에서, 슈스터 용지의 미디어 리셉션 자신의 불만을 표현하는 나에게 다가왔다. “당신은 첫 기자 봤어?”그가 나에게 물었다. 그는 그 아침부터 제목을 의역 그가 그것을 항에있어서, 자신의 손으로 말씀으로 그것을 단어 차단 : Google은 AI의 번역은 ‘경우 인체 구별 할 수 있다고 말했습니다. 용지의 조성의 마지막 주 동안 팀이 고생했다; 슈스터는 종종 용지의 메시지는 “그것은 그 이전보다 훨씬 더하지만, 인간만큼 좋은 아니에요.”그는 그들의 노력은 사람을 대체하지만 그들을 돕는 대해되지 않은 것이 분명 될 것 기대했던 것을 반복했다.

우리가 우리를 위해 특별한 장소를 개척하는 그럼에도 불구하고 기계 학습의 상승은 더욱 어렵게 만든다. 당신이 생각하는 경우, Searle은 함께, 인간에 대한 특별한 뭔가가 있음을 “통찰력은,”당신은 자동화에서 인간을 구분하는 명확한 선을 그릴 수 있습니다. 당신이 Searle은의 길항제에 동의하는 경우, 당신은 할 수 없습니다. 많은 사람들이 이전보기로 빠른 집착하는 이유는 이해할 수있다. 인공 지능의 뿌리에 대한 2015 MIT 컨퍼런스에서 노암 촘스키는 그가 기계 학습 어떻게 생각하는지 질문을 받았다. 그는 단순한 통계 예측, 영광 일기 예보로 전체 기업을 푸우 – poohed. 신경 번역 최적 기능을 달성하더라도 언어의 기본 특성에 대한 지대한 것도 알려주지 것이다. 대명사가 여격 또는 대격 사건을했다 경우 당신을 말하지 않을 수 있습니다. 예측의이 종류는 우리의 목적을 달성하기 위해 좋은 도구를 만들지 만, 그것은 일을 그들이 할 방법이 일어날 이유에 대한 우리의 이해를 발전의 기준으로 성공하지 않습니다. 기계는 이미 인간의 방사선보다 더 나은 의료 검사에서 종양을 감지 할 수 있지만 기계는 암을 일으키는 무엇을 말할 수 없다.

그럼 다시, 방사선과 의사가 할 수있는?

의료 진단은 대부분 즉시 하나의 필드, 그리고 아마도 예측할 수, 기계 학습에 의해 위협했다. 방사선은 광범위하게 교육을 매우 잘 지불, 우리는 전문적인 통찰력의 하나로서 자신의 기술을 생각하는 – 생각의 가장 높은 레지스터. 혼자 지난해 연구자들은 보여 주었다뿐만 아니라 신경 네트워크는 훨씬 이전에 자신의 인간에 비해뿐만 아니라 기계도 병리 보고서의 텍스트에서 이러한 진단을 할 수있는 의료 영상에서 종양을 찾을 수있다. 무엇 방사선 할 것은 논리적 분석보다 예측 패턴 일치에 훨씬 더 가까이 뭔가 것으로 밝혀졌습니다. 그들은 암의 원인을 알려주하지 않는; 그들은 그냥 거기 말하고 있습니다.

당신이 하나의 목적을 위해 강력한 패턴 매칭 장치를 구축 한 후에는 다른 사람의 서비스 불통 될 수있다. 하나는 엔지니어가 그 작품을 판단하기 위해 함께 넣어 네트워크를 가져다 자치 무선 조종 자동차를 운전하는 데 사용 번역. 고양이를 인식하도록 구축 된 네트워크는 돌아 보았고, CT 스캔에 대한 교육을 할 수 있습니다 – 그리고 무한히 더 많은 예제에 심지어 최고의 의사는 지금까지 검토 할 수있는 것보다. 시간의 가장 작은 부분에서의 법률 발견 된 문서의 페이지의 수백만을 통해 일할 수있는 번역 구축 된 신경망은 가장 비싸게 자격을 변호사를 취할 것입니다. 자동 기계에 의해 촬영 작업의 종류는 더 이상 예전 만 반복 작업 수 없습니다 – 부당,이 강조되어야한다 – 교육받지 못한 계급의 가정 낮은 지능과 관련. 우리는 세 가지 곧 경력을 결여 수 50 만 트럭 운전사에 대해 얘기 아닙니다. 우리는 재고 관리자, 경제학자, 금융 컨설턴트, 부동산 에이전트에 대해 얘기하고. 무엇 뇌 아홉 달 동안 한 일은 큰 회사에서 작은 그룹 이제까지 기계와 관련된 것 태스크 아무도을 자동화 할 수 있습니다 얼마나 빨리의 한 예입니다.

지금 실리콘 밸리에서 일어나는 가장 중요한 것은 중단되지 않습니다. 규모에 모두 인류 역사상 아마 전례가있다 속도로 – 전력의 통합 – 오히려 기관 건물입니다. 뇌는 인턴이있다; 그것은 주민이있다; 그것은 다른 부서에있는 사람들을 훈련하는 “닌자”클래스가 있습니다. 모든 지역이 무료 자전거 헬멧의 쓰레기통, 무료 녹색 우산 이틀 비가 년, 그리고 약간의 과일 샐러드, 그리고 낮잠 포드, 공유 트레드밀 데스크, 마사지 의자, 하이 엔드 파이의 임의의 종이팩이 있고, 아기 옷 기부 장소 및 일정 강사와 함께 두 개의 층 등반 벽, 독서 그룹과 정책 회담 및 다각적 지원 네트워크. 그들이 어떤 디지털 소금 광산에서 proles에 대한 특권보다 훨씬 더 많은 것을 위해 – – 인간의 재배에서 이러한 주요 투자받는 사람은 손에 4 개 대륙 충분한 전기 그릴, 데이터 센터에 13 데이터 센터에 분산 복잡하게 통합 된 서버의 전원을 대도시에 불을합니다.

그러나 구글과 같은 심지어 거대한 기관은 자동화의 물결 대상이 될 것이다; 기계가 인간의 연설에서 배울 수하면, 프로그래머도 편안한 작업이 위협 받고있다. 티키 바에서 파티가 끝 나가고 된 바와 같이, 번역 엔지니어는 휴즈 뭔가를 보여주기 위해 자신의 노트북을 통해 가져왔다. 화면이 소용돌이 주기적으로 한 번 더 분산하기 전에 성운으로 붕괴 긴 루프 궤도에 밝은 색깔 분야의 생생한, 만화경 애니메이션 펄스.

휴즈는 지금 당장 무엇인지,하지만 난 모든 이름보고하기 전에 면밀히 지켜 볼 수밖에 없었습니다 – 사람과 파일을. 그것은 모든 마지막 팀 구성원에 의해 번역 코드베이스, 매일 윙윙과 피 기여에 대한 변경의 10 년 역사의 애니메이션이었다. 휴즈는 일시 중지하고 먼 캠페인, 이제 다른 곳에서 흡수하는 나 자신에 파열에 의해 서둘러 고대 승리 또는 재앙을 기억 한 동안 모든 중지, 2,008에서 2,006 사이에서 2015 년, 앞으로 건너 뛰기 부드럽게 이상에 도달했습니다. 휴즈는 제프 딘의 이름이 빛나는 구체에 여기 저기 확장하는 빈도를 지적했다.

휴즈는 코라를 통해이라고, 이들은 꿰 서 있었다. 우울한 향수의 마법을 깰, 코라는, 상처를 조금보고, 고개를 말했다 “그래서 때 우리가 그것을 삭제 어떻게해야합니까?”

‘ 돈 ‘ 그것에 대해 t 걱정, ” 휴즈는 말했다. ” 새로운 코드베이스는 증가 할 것입니다. 모든 성장한다. “