차원이 다른 구글 번역기의 도래 (6)

2017년 1월 12일 | By: ingppoo | IT, 세계 | No Comment

구글이 인간의 신경망을 본뜬 딥러닝을 적용해 지금까지 우리가 알던 번역기와는 차원이 다른 인공지능 번역기를 선보였습니다. 지난달 14일 새로운 구글 번역기를 집중적으로 분석한 뉴욕타임스의 기사 “The Great A.I. Awakening”을 소개합니다.

5부 보기

—–

3. 딥러닝 자세히 알아보기

최고경영자 순다 피차이가 구글이 앞으로 “인공지능 중심 기업”으로 거듭날 것이라고 말했을 때 이는 단지 사업 전략에 관한 전망이 아니었다. 피차이는 오랫동안 실현 불가능한 것으로 여겨지던 아이디어에 구글의 미래를 걸겠다고 선언했던 것이다.

구글은 실제로 가용 자원을 아낌없이 인공지능 연구와 개발에 쏟아부었다. 제프 딘에게 구글 브레인을 맡기고 제프리 힌튼에게는 가설을 검증해볼 수 있도록 충분한 컴퓨터와 방대한 데이터에 접근할 수 있게 해주었다. 사람의 뇌에는 평균 약 1천억 개의 뉴런이 있다. 각각의 뉴런은 보통 약 1만여 개의 다른 뉴런과 연결돼 있다. 즉, 뇌 속에 뉴런과 뉴런의 연결고리인 시냅스가 1천조 개 있다는 뜻이 된다. 1940년대에 처음 인공 신경망이라는 개념이 대두했을 때 아주 간단한 신경망을 구축하는 일조차 불가능하게 여겨졌던 이유가 이토록 어마어마한 숫자의 연결고리였다. 아직 우리는 그만한 크기의 네트워크를 구축하지 못한다. 하지만 구글 브레인이 지금껏 투자한 자원으로 우리는 쥐의 뇌 정도 역량을 지닌 인공 신경망을 만들 수 있게 됐다.

크기가 왜 이렇게 중요한지 살펴보기에 앞서 기계로 구현한 지능이 입력한 데이터를 어떻게 다루고 처리하는지 그 과정을 좀 더 자세히 이해할 필요가 있다. 사실 우리 주변에서 쉽게 접할 수 있는 인공지능에 대한 두려움을 자세히 해부해보면 인공지능을 도서관에 틀어박혀 아무런 감정도 없이 그저 지식을 끝없이 빨아들이는 소시오패스 같은 존재로 여기거나 종이 클립을 만드는 용도로 고안된 인공지능이 언젠가는 인간을 개미나 상추와 마찬가지로 취급하게 될지 모른다는 막연한 공포와 마주하게 된다. 하지만 인공지능은 절대 그런 식으로 작동하지 않는다. 인공지능은 기본적으로 수많은 정보를 샅샅이 훑어 보편적인 공통점을 찾아낸다. 우선은 기본적인 경향을 찾고 이어 좀 더 복잡한 패턴으로 세분화하는 식이다. 지금 상황에서 가장 큰 위험은 인공지능의 작동 원리에 내재한 불확실성이 아니라 오히려 우리가 인공지능에 입력하는 데이터와 정보 자체가 편향된 상황이다.

만약 지금 이 설명에 고개가 끄덕여진다면, 기술과 관련해 배경지식이 충분하지 않은 독자라도 바로 고양이에 관해 다룬 다음 장 4장으로 넘어가셔도 좋다. 만약 여전히 인공지능 자체는 위험하지 않다는 의견을 수긍하기 어렵다면 계속 읽으시면 된다. (어쨌든 이번 장에도 고양이에 관한 이야기가 나온다, 바로 다음 문단부터)

당신이 구식 상징적 인공지능에 고양이를 분간해내는 고양이 감별 프로그램을 입력한다고 가정해보자. 당신은 일단 몇 날 며칠을 고양이에 대한 상세한 정의를 담은 방대한 정보를 기계에 주입해야 한다. 다리가 네 개, 쫑긋 세운 귀 한 쌍, 수염은 어떻게 나 있고 꼬리는 어떤 식이라는 등등. 이 모든 정보는 ‘고양이’라는 제목의 특수 기억장치에 저장된다. 이제 기계에 사진을 보여줄 차례다. 먼저 기계는 사진에 드러난 여러 가지 요소를 분류한다. 그리고 각각을 저장된 메모리에 견주어 본다. 다리가 네 개 맞는지, 귀가 있다면 쫑긋 섰는지, 수염이 있다? 꼬리는? 어딘가 거만한 표정이 보인다? 그렇다면 고양이가 맞다는 식의 감별 과정을 거친다. 하지만 만약 당신이 이 고양이 감별 프로그램에 스코티시 폴드(Scottish Fold)의 사진을 보여주면 어떤 일이 일어날까? 스코티시 폴드는 가슴 아프게도 유전적 결함으로 귀가 다른 고양이처럼 쫑긋 서지 않고 축 늘어진 종이다. 상징적 인공지능을 기반으로 만든 고양이 감별 프로그램은 스코티시 폴드를 절대로 고양이로 인식하지 못한다. 입력한 정보를 토대로 세운 기준에 부합하지 않는 한 결과는 바뀌지 않는다. 문자 그대로 입력값을 이해하고 해석하다 보니 가끔 추론 능력에서는 갓난아기만도 못할 때가 있는 것이다.

이번에는 특수 기억장치에 저장한 입력값에 따라서만 움직이는 기계 대신 신경망 인공지능을 통해 고양이를 감별한다고 가정해보자. 고양이는 어떻다는 정의는 기계 어디에도 입력되어 있지 않다. 서로 얽히고설킨 스위치들이 갈림길처럼 나뉘어 커다란 방울 속에 자리 잡은 모습을 상상하면 된다. 이 방울의 한쪽 면에 입력값(사진)을 넣는다. 반대편에는 사진 속 대상이 무엇인지 그 이름을 표시해 알려준다. 나머지는 기계가 알아서 분석하도록 내버려 둔다. 서로 연결된 수많은 스위치와 갈림길을 통해 인공지능은 해당 사진을 주어진 표식으로 인식하는 과정에서 습득한 정보를 저장해 둔다. 기계는 방울 속 수많은 미로 속에서 사물을 정확히 인식하는 데 필요한 과정 하나하나를 정교한 터널처럼 뚫어놓는다. 어떤 입력값이 주어졌을 때 정확한 결과를 도출해내는 데 필요한 터널은 더 많은 데이터를 입력해 훈련을 거듭할수록 튼튼하고 정확해진다. 이런 터널이 충분히 마련돼 한 번도 본 적 없는 사진을 보여줘도 기존의 정보와 분석한 내용을 토대로 믿을 만한 예측값을 내놓을 수 있게 되면 훈련은 종료된다. 고양이 감별 프로그램은 이제 임무를 수행할 수 있게 된다. 이 과정을 “지도 학습”이라 부른다.

거대한 기계는 일종의 민주적인 방식으로 작동한다. 기계가 수없이 많은 신경 세포와 어마어마한 데이터가 있어야 하는 이유도 여기에 있다. 당신은 다섯 가지 다른 사물을 분간할 수 있도록 컴퓨터를 훈련하고자 한다. 먼저 당신의 신경망은 수백, 수천만 뉴런들의 투표에 준거해 사물을 인식한다. 당신은 사진 한 장을 보고 당신의 뉴런들에게 묻는다. 사진 속 사물은 고양이, 개, 거미원숭이, 숟가락, (심정지 환자를 응급처치할 때 쓰는) 제세동기 다섯 가지 가운데 하나다. “이것이 무엇이냐?” 같은 결과를 도출해낸 뉴런끼리 뭉친다. 이를 집계하는 뉴런이 결과를 들고 당신에게 신호를 보낸다. 처음에 개가 아니냐는 질문에 뇌는 답한다.

“주인님, 개가 아니라 고양이 같습니다. 다시 한 번 보시죠.”

실제로 그 사진은 고양이 사진이었다. 집계 요원 뉴런이 다시 투표 기록을 살핀다. 어떤 뉴런들은 고양이를 맞췄고, 어떤 뉴런은 그러지 못했는지. 고양이를 맞춘 뉴런의 표는 다음번에 고양이를 판별할 때 가중치를 얻는다. 고양이를 맞췄다고 개나 제세동기를 분간하는 데 뛰어난 능력을 발휘한다는 보장은 없지만, 우리의 신경망은 각각의 신경세포가 어떤 일을 잘 처리하는지 파악한 뒤 잘하는 일에 집중할 수 있도록 업무를 유연하게 배분하기도 한다. 중요한 것은 각각의 투표 기록이 아니라 연이은 투표(인식값)에서 나타나는 경향이다. 조, 프랭크, 매리가 같은 의견이라면 이것은 개, 반대로 조와 케이트, 제시카가 같은 의견이라면 고양이, 또 케이트, 제시카, 프랭크가 같은 의견이면 제세동기, 이런 식으로 신경망이 파악하고자 하는 정보는 전체 투표값에서 나타나는 경향이다. ‘사람들이 고양이라고 부르는 어떤 사물 혹은 그 사물을 찍은 사진의 특정 픽셀에는 이러이러한 특징이 있다.’는 식의 결론이 저장된다. 투표값이 쌓일수록 기계는 미묘한 차이도 분간해낼 수 있는 정보를 습득해 기준을 보강한다. 조, 프랭크, 매리밖에 없다면 고양이와 개, 제세동기를 분간하는 작업밖에 할 수 없겠지만, 데이터가 많이 쌓이면 훨씬 자세한 사항까지 분류해낼 수 있는 정보를 얻게 되는 셈이다. 당신의 머릿속 훈련된 뉴런은 오늘도 새로운 사물을 보고 이것을 무엇으로 인식할지 투표를 진행한다. 투표의 정확도는 그동안의 경험과 저장된 기억에 달렸다.

마찬가지 원리로 작동하는 인공지능 신경망 개념을 컴퓨터과학자들이 그토록 거부했던 이유는 바로 신경망 방식이 도출하는 결과라는 것이 결국 경향의 경향을 분석한 확률일 수밖에 없기 때문이다. 확률은 완벽하지 않다. 게다가 대단히 미묘한 차이까지 파악해 고양이를 분류해낼 수 있는 기계가 정작 고양이가 무엇인지 정의를 내리라고 하면 아무것도 하지 못한다. 하지만 바로 이처럼 단정할 수 없는 확률적 특징이 바로 신경망 방식의 장점이기도 하다. 수없이 다양한 고양이 사진을 분석하고 입력해둔 신경망은 따스한 햇살 아래 기분 좋게 낮잠을 자는 고양이도, 지저분한 쓰레기통 옆에서 경계심을 가득 품고 무언가를 쏘아보는 고양이도 정확히 잡아낼 수 있다. 분석한 데이터가 많을수록 몇 가지 특이 사항에도 흔들리지 않고 이를 파악할 수 있다. 신경망 고양이 감별 프로그램은 귀가 축 늘어진 스코티시 폴드를 보고도 다른 부분에서 고양이라 할 만한 특징이 확실히 나타났다면 이를 고양이로 인식한다. 이제는 귀가 쳐진 고양이도 있다는 정보가 다시 한 번 쌓이고, 다음번 감별 정확도는 더 높아진다.

이 시점에서 신경망 방식이 확률에 기댄 작업이므로 모든 임무에 적합하지 않다는 점을 짚고 넘어갈 필요가 있다. 인공지능이 개나 고양이를 100번 중 1번꼴로 오인하거나 실수로 당신이 보고 싶지 않은 영화를 골라주는 것은 별 문제가 아닐 수 있다. 하지만 예를 들어 자율주행 자동차에 장착한 인공지능의 정확도에 대한 기준은 훨씬 높고 엄격해야 할 것이다. 그뿐만 아니다. 지도 학습은 미리 분류해놓은 데이터를 바탕으로 시행착오를 겪으며 기계가 정보를 습득하는 과정이다. 정보를 쌓고 분석하는 건 기계의 몫이라 해도 처음 작업을 분류하고 입력값을 정하는 데는 여전히 인간이 어마어마한 영향을 미칠 수 있다. 만약 정장을 입은 여성과 남성이 같이 있는 사진이 있는데, 그 사진 제목을 “직장 상사와 함께 있는 여성”이라고 붙인다면, 사실 여부와 관계없이 둘 사이의 관계는 그렇게 입력된다. 남자와 여자가 함께 있는 경우 남자가 상사, 여자가 부하직원이라고 인식하는 경향이 추가된다. 기계는 데이터를 곧이곧대로 받아들인다. 사람의 오류 탓에 데이터에 남아있는 오류는 그대로 반영된다. 대출자격 심사를 기계가 보조하는 경우도 마찬가지다. 기계는 범죄에 기소된 적이 있는지 등을 토대로 판단을 내리는데 만약 범죄 기소 자체가 처음부터 공평하지 않았다면 기계의 판단이 공평하기를 기대할 수는 없는 노릇이다.

고양이 감별 프로그램으로 예를 들었던 사물 인식, 사진판독 기능은 딥러닝의 수많은 활용 사례 가운데 하나이긴 하지만, ‘테두리를 먼저 인식하고 둥글면 얼굴’ 같은 식으로 각 과정을 사람들에게 직관적으로 설명하기 상대적으로 쉽다 보니 딥러닝의 대표 사례로 너무 많이 소개된 측면이 없지 않다. 어느덧 고양이 감별은 인공지능이 거의 실수 없이 완벽함에 가깝게 수행하는 대표 기능처럼 되어버렸다. 하지만 여전히 인공지능의 실수 사례는 무수히 많다. 예를 들어 구글의 사진인식 소프트웨어는 초반에 사진 속 역기를 좀처럼 인식하지 못했다. 수많은 운동 장면 속 역기 사진을 다양하게 보여주고 입력한 뒤에도 특히 역기만 덩그러니 놓인 사진을 보여주면 도무지 이를 인식하지 못했다. 기계의 학습 과정을 시각화해 살펴본 결과 문제의 실마리를 찾을 수 있었다. 기계는 아령이나 역기의 이미지를 그 자체로 습득하지 않고 항상 “(사람의) 팔이 들고 있는 아령” 같은 식으로 연관 지어 사물을 파악했다. 운동 장면을 찍은 사진 속 아령은 거의 예외 없이 팔에 가까이 붙어있었기 때문에 이런 상황이 벌어진 것이다. 구글은 다시 역기만 있는 사진을 여러 장 보여주며 기계를 새로 훈련했다. 그제야 사진인식 소프트웨어는 덩그러니 놓인 물체를 역기라고 인식하기 시작했다. 세상에 정말 쉬운 일이 없다. (뉴욕타임스)

원문보기

7부 보기

다음은 오늘 소개한 부분의 영어 원문을 구글 번역기가 우리말로 옮긴 것입니다. (맞춤법, 띄어쓰기, 문장의 종결 어미, 고유명사 등은 일부 고쳤습니다)

—–

3. 깊은 학습 깊은 설명

피차 구글이 이제부터는 것이라고 말했을 때 “AI 첫째,” 그는 단지 자신의 회사의 사업 전략에 대한 주장을하지 않은; 그는 이 긴 쓸모없는 아이디어를 자신의 회사의 많이 던지고 있었다. 자원의 피차의 할당은 딘과 같은 사람들이 설득력있는 주장을 긴 마지막으로, 충분한 컴퓨터와 충분한 데이터에서 힌튼 같은 사람들이 가지고 것이라는 점을 보장 할 수 있음을 보장. 평균 뇌는 1000 억 뉴런의 순서에 뭔가가 있다. 각각의 신경 세포가 시냅스의 수가 100 조 1000 억 사이 즉, 최대 10,000 다른 뉴런에 접속된다. 1940 년대에 제안 된 종류의 간단한 인공 신경망의 경우, 시도조차이 상상할 수 있었다 복제하려고 한다. 우리는 아직까지 그 크기의 네트워크의 구성에서,하지만 구글 뇌의 투자는 쥐의 뇌에 필적하는 인공 신경 네트워크의 생성을 허용했다.

규모가 중요한 이유, 이해하기하지만, 정확히, 기계 지능 그들이 소비하는 데이터로 무엇을하고 있는지의 기술적 세부 사항의 일부를 이해하기 시작한다. 그들은 단지 도서관에서 반사회적 신동 같은 지식을 진공 청소기로 청소하고 있는지, 그리고 인공 지능 언젠가는 개미 나 상추 같은 인간을 치료하는 결정할 수 있다. 종이 클립을 만들기 위해 구성한다는 생각에 AI의 나머지 부분에 대한 우리의 주변 두려움을 많이 한다. 작동 방식이 바로이 아니다. 그들이하고있는 모든 공통점을 찾아 주변 정보를 셔플입니다 – 처음에 기본 패턴 다음 더 복잡한 것들 – 그리고 잠시 동안, 적어도 가장 큰 위험은 우리가 공급하고있는 정보가에 편향되어 있다는 것이다 처음.

그 간단한 설명이 충분히 안심 보이는 경우, 안심 비 기술적 독자는 고양이에 관한 다음 섹션, 앞으로 이동하도록 초대한다. 그렇지 않으면, 다음에 읽어 보시기 바란다. (이 부분은 고양이에 대해, 운좋게도 있습니다.)

당신이 이전 상징적-AI 모델에 고양이 인식기를 프로그램 할 상상해보십시오. 당신의 철저한 명시 적 정의와 기계를 미리로드 일 동안 깨어 “고양이.”당신은 고양이 등 4 개의 다리와 뾰족한 귀, 수염과 꼬리, 그리고이 있는지를 알려준다. 이 모든 정보는 고양이라는 메모리의 특별한 장소에 저장된다. 이제 당신은 사진을 보여준다. 먼저, 시스템은 이미지의 다양한 별개의 소자들을 분리한다. 그런 다음 이러한 요소를 가지고 메모리에 저장된 규칙을 적용한다. 만약 (다리 = 4), 경우 (귀 = 뾰족한)과 경우 (위스커 = 예) 그리고 만약 (꼬리 = 예) 그리고 만약 다음 (식 = 얕보), (고양이 = 예). 그러나이 고양이 인식기에게 스코틀랜드 배, 배 오버 귀를 축 늘어진로 연결되는 소중히 유전 적 결함을 가진 마음 박살 품종을 보였다 무슨 경우? 우리의 상징적 인 AI는 (귀 = 뾰족한)에 도착하고, 엄숙하게 머리를 흔들 “고양이를 하지 않는다.”그것은 hyperliteral, 또는이다 “취성.”심지어 두꺼운 아이가 훨씬 더 추론 시력을 보여준다.

이제 컴퓨터의 메모리의 한 위치에 저장 분류를위한 일련의 규칙과 시스템을 하드 배선 대신에, 당신은 신경 네트워크에 같은 일을 시도 상상. 의 정의에 저장할 수있는 특별한 장소가 없다 “고양이.”경로에서 포크 등 상호 연결된 스위치의 단지 거대한 덩어리가 있다. 블롭의 한쪽에, 당신은 입력 (사진)를 제시; 다른 측면에서, 당신은 해당 출력 (라벨)을 제시한다. 그럼 당신은 그냥 일을 말해 , 자체 데이터가 입력이 올바른 출력에 매핑되도록해야 어떤 경로 이러한 상호 모든 스위치의 개별 교정을 통해. 훈련은 정교한 터널의 미로 시리즈는 블롭, 적절한 출력에 주어진 입력을 연결하는 터널을 굴착하는 과정이다. 당신이 더 트레이닝 데이터, 큰 파고 수있는 터널의 수와 복잡함. 교육이 완료되면, 블롭의 중간 그것은 한 번도 본 적이없는 데이터를 처리하는 방법에 대한 신뢰성있는 예측을 할 수있는 충분한 터널이있다. 이것은 “지도 학습”이라고 한다.

네트워크가 많은 뉴런 너무 많은 데이터를 필요로하는 이유는 거대한 기계 민주주의 일종의 같은 방식으로 기능한다는 것이다. 당신이 다섯 가지 항목 중에서 구별하기 위해 컴퓨터를 훈련 할 상상해보십시오. 고양이 한 개를위한 하나, 거미 원숭이 하나, 숟가락 하나와 제세 동기에 대해 하나의 : 네트워크의 연결의 수백만로 구성되어 있다. “유권자,”누구의 각각 다섯 가지 카드를 주어졌다. 당신은 위에서 아래로, “이 고양이, 개, 거미 원숭이, 숟가락 또는 제세 동기인가?”모두 같은 방법으로이 그룹에 수집 투표 뉴런 및 네트워크 주임 동료를 당신의 유권자 사진 질문을 표시하고 대부분의 분류를 식별 : “개를?”

당신은 말한다 : “아니, 마에스트로, 그것은 고양이입니다. 다시 시도하십시오. ”

이제 네트워크 감독은 유권자들이 “고양이”뒤에 자신의 체중을 던져하지 않았다 식별로 되돌아 간다. . “고양이”- “고양이”를받은 사람은 바로 자신의 투표는 두 번 다음에 시간을 계산 얻을 그들은 그들이 개와 제세동을 따기에도 좋은 것 여부를 독립적으로 증명해야 그들이 투표하고 적어도 때, 하지만 한 가지 그 각각의 유닛이 다른 원하는 결과를 다르게 기여할 수 있다는 점이다. 신경망 너무 유연하다. 중요한 것은 정확히 개별 투표,하지만 투표의 패턴이다. 조, 프랭크와 메리 함께 모든 투표, 그것은 개가 있다면, 조, 케이트와 제시카가 함께 투표를하는 경우, 그것은 고양이입니다; 케이트, 제시카와 프랭크 함께 투표 할 경우, 그것은 제세 동기입니다. 신경망 그냥 어딘가에 승률은 “말을 정기적으로 식별 신호의 정도를 등록 할 필요는 픽셀이 특정 배열은 이러한 인간이 계속 전화 뭔가 나타내는 ‘고양이.’ ” 더 ” 유권자 ” 당신이 그들을 투표 할 당신이, 그리고 더 많은 시간, 더 날카롭게 네트워크도 매우 약한 신호를 등록 할 수 있다. 당신은 단지 조, 프랭크와 메리가있는 경우, 당신은 아마 고양이, 개 및 제세 동기를 구별 만 사용할 수 있다. 당신이 다른 방법으로 수십억에 연결할 수있는 다른 유권자의 수백만이있는 경우, 당신은 믿을 수 단위로 데이터를 분류 배울 수 있다. 당신의 훈련을받은 유권자 어셈블리는 레이블이없는 사진을보고 어느 정도 정확하게 식별 할 수있을 것이다.

그 이유의 일부는 컴퓨터 과학 부서의 아이디어에 너무 많은 저항이 출력 패턴의 패턴에 따라 단지 예측이기 때문에, 완벽 않을거야, 그리고 기계가 당신을 위해 정의 할 수 없을 것이다 있었다 무엇을, 정확히, 고양이다. 그것은 그들을 볼 때 그것은 단지 그들을 알고있다. 이 양털 모양 그러나 점이다. 그들은 다양한 고양이 장면의 수백만에 노출 된 바와 같이 신경 “유권자들은”한, 태양과 어수선한 쓰레기 상자의 그림자로부터 눈부신 화가 난 고양이에 졸고 행복한 고양이를 인식한다. 있는지 확인하기 위해 – 당신은 제비와 유권자를 많이 필요로 일부 네트워크의 일부, 예를 들어, 축 늘어진 귀 스코티시 폴드에, 심지어 매우 약한 규칙 성을 집어 – 충분한 표시된 데이터는 네트워크가 보았다 확인 현상의 넓은 가능한 분산.

이는 신경망이 자연 확률 사실들이 모든 작업에 적합하지 않은 것을 의미한다는 점에 유의하는 것이 중요하다. 그들이 개 같은 고양이 1 %로 분류해서는, 또는 경우에 잘못된 영화에 당신을 보내지 만 자기 차를 운전과 같은에서 우리 모두가 더 큰 보장을 할 경우 더 큰 비극 없습니다. 이것은 유일한주의가 아닙니다. 지도 학습에 기초하여 시행 착오 과정 표시된 데이터. 기계 학습을 수행 할 수 있지만, 입력의 최초 분류에 강한 소자 인간이 남아있다. 데이터가 한 남자의 사진 누군가가 표시했다고 정장에 여성이 있다면 “그녀의 상사와 여자,”그 관계는 이후의 모든 패턴 인식으로 인코딩된다. 레이블이 데이터는 인간의 라벨러는 오류를 범할 수있는 방식 때문에 오류를 범할 수있다. 기계가 대출 신용 할 후보를 식별하기 위해 요청 된 경우 중죄 유죄 판결과 같은 데이터를 사용할 수 있지만 중죄 유죄 판결이 처음부터 불공정 있다면 – 그들이에 기반한다면, 말, 차별적 인 약물 법 – 후 대출 추천도 억지로 것 오류를 범할 수.

우리의 고양이 식별자와 같은 이미지 인식 네트워크가 깊은 학습의 많은 종류의 하나이지만, 각 층은 인간에게 적어도 막연하게 인식 할 수있는 무언가를하기 때문에 그들이 불균형 교육 예로서 호출 – 첫째, 다음 원을 가장자리를 골라, 그 다음에 직면 해있다. 이 오류에 대한 보호가 의미한다. 예를 들어, Google의 이미지 인식 소프트웨어의 초기 이상한은 항상 팀이 운동 종류를 많이 포함 된 이미지 세트에 훈련을했다하더라도, 격리에 바벨을 식별 할 수있는 것을 의미했다. 시각화 툴은 트레이닝 세트의 모든 아령가 팔에 부착 되었기 때문에 시스템이 “아령 + 아암”NOT “덤벨”그러나 개념의 개념을 배운을 보였다. 그들은 솔로 아가씨의 약간의 사진을 혼합 훈련에 던졌다. 문제가 해결되었다. 모든 것이 쉽다.