인공지능 기술의 숨은 비용(2/2)
2019년 10월 4일  |  By:   |  과학  |  No Comment

이 지적 부채에 대해 대차대조표, 곧 우리가 어떤 영역에 이런 이론 없는 지식을 사용하는지를 추적하는 시스템을 만들 수 있을까요? 이 대차대조표에는 모든 지적 부채가 똑같은 수준의 문제가 아니라는 사실을 고려할 수 있을 것입니다. 어떤 인공지능이 만약 새로운 피자 레서피를 만든다면, 우리는 그냥 그 피자를 맛있게 먹으면 됩니다. 그러나 우리가 인공지능으로 하여금 건강에 관한 예측을 하거나 치료법을 추천하게 만들 경우, 우리는 이와 관련된 모든 정보를 알아야 합니다.

사회적 차원의 지적 부채 대차대조표를 만들고 유지하기 위해서는 기업비밀과 특허를 보다 정교하게 다룰 수 있어야 합니다. 도시의 경우 건축법은 건물주가 자신의 건물을 리노베이션 할 때 그 계획을 공개하도록 요구합니다. 같은 방식으로, 우리는 공적인 용도에 사용되는 데이터와 알고리듬을 도서관이나 학교와 같은 기관에 제3자 예탁 등의 방식으로 맡기게 만들 수 있습니다. 이를 통해 연구자들은 우리가 의존하는 모델과 데이터를 확인하고, 이론을 만들며, 그 지적 부채가 오류나 취약성으로 드러나기 전에 이를 해결하게 만들 수 있습니다.

기계 학습 모델이 사회 여러 분야에 널리 사용되면서, 또 누구나 이를 쉽게 만들 수 있게 되면서 이를 관리하는 것은 더욱 어려운 일이 되고 있습니다. 하지만 이는 꼭 필요한 일입니다. 기계 학습 모델은 하나씩만 사용될때는 정답을 알려주는 블랙박스처럼 매우 유용한 도구가 될 수 있습니다. 하지만 이들은 독립적으로 사용되지 않습니다. 인공지능이 세상의 데이터들을 알아서 수집할 때, 이들은 다른 인공지능이 만들어낸 데이터를 수집하게 됩니다. 이는 작용기전을 알지 못하는 약이 다른 약과 상호작용하면서 문제를 만드는 것과 같습니다.

아주 단순한 알고리듬 끼리의 상호작용도 문제가 될 수 있습니다. 2011년, 생물학자 마이클 아아젠은 자신의 학생들로부터 별로 중요하지 않은 중고 서적인 “파리의 탄생: 동물 설계의 유전학”이 아마존에서 가장 싼 책이 170만 달러(약 19억원)에 배송료 3.99달러를 붙여 판매되고 있다는 것을 들었습니다. 이 책을 두 번째로 싸게 판매하는 다른 판매상은 210만 달러(약 23억원)에 팔고 있었습니다. 이 판매상들은 수천 건의 좋은 평가를 가진 훌륭한 판매상이었습니다. 아이젠은 며칠 동안 이 책의 가격을 계속 추적하였고, 가격 변화의 패턴으로부터 이 책의 가격이 왜 이렇게 높아졌는 지를 알아냈습니다. 첫번째 판매상은 늘 두번째 판매상이 올리는 가격의 99.83%를 책의 가격으로 설정하고 있었습니다. 반면, 두번째 판매상은 매일 첫번째 판매상이 올리는 가격의 127.059%를 책의 가격으로 설정했습니다. 아이젠은 첫번째 판매상은 이 책을 실제로 가지고 있으며, 따라서 항상 가장 최저가를 유지하기 위해 이런 전략을 사용하는 것으로, 그리고 두 번째 판매상은 이 책을 가지고 있지 않기 때문에 주문이 들어올 경우 첫번째 판매상이 파는 책을 구입해 그 책을 보내주기 위해 이런 가격정책을 가지고 있는 것으로 추측했습니다.

두 판매상의 가격 정책은 합리적입니다. 문제는 그들의 알고리듬이 상호작용하면서 이런 황당한 일이 일어났다는 것입니다. 수천 종류의 기계 학습 모델이 이 세상에서 서로 상호작용할 경우 어떤 일이 벌어질 것인지를 예측하는 것은 매우 어려운 일일 것입니다. 최첨단 기계 학습 모델이 이미 사용되고 있는 금융 시장에서는 이미 그런 문제가 발생하고 있습니다. 2010년, 단 36분 동안 발생한 “플래쉬 크래쉬”는 알고리듬 투자의 결과였고 미국의 주요 지수에서 수조달러가 사라졌습니다. 지난해 가을, J.P. 모건의 어낼리스트인 마르코 콜라노비치는 자동화된 트레이딩이 계속 증가하고 있으며 언제든지 이런 크래쉬가 다시 일어날 수 있다고 주장했습니다. 지적 부채는 시스템이 서로 엮이는 영역에서 문제가 될 수 있습니다. 특정한 지적 부채가 어떤 문제를 일으킬지를 전혀 예측할 수 없다는 것 또한 이 부채가 금융의 부채와 유사한 점입니다.

—–

지적 부채의 증가는 우리의 사고 방식에도 우리가 기초 과학보다 응용 기술에 더 관심을 가지게 하는 식으로 영향을 줍니다. 예를 들어 여러 선진국과 학계가 힘을 모아야 하는 입자 가속기와 달리, 기계 학습 도구는 민간 분야에서도 쉽게 사용할 수 있습니다. 사실 유용한 예측이 가능한 종류의 데이터에는 구글이나 페이스북이 학계보다 훨씬 쉽게 접근할 수 있습니다. 기업은 이런 설명이 불가능한 지식에 충분히 만족할 것이며, 지적 부채는 계속 쌓여가게 됩니다. 곧, 지적 부채를 갚는데 관심이 있을 학계에 비해 지적 부채를 쌓는 일이 훨씬 더 앞서나가게 됩니다.

이런 기계 학습 기반의 지식을 쓸 수 있느냐의 문제에 있어 고지식한 방법을 고집하는 학자들이 연구비를 얻기 어렵게 될 가능성은 쉽게 상상할 수 있습니다. 지난해 12월, 단백질 접힘 문제를 연구하는 모함메드 알쿠라이시는 최근 그의 분야가 이룬 발전에 대한 글을 한 편 썼습니다. 바로, 단백질 접힘 문제에 있어 기계 학습 모델이 인간 연구자보다 훨씬 더 정확하게 예측한다는 것입니다. 알큐라이시는 그런 현실을 이해하려 노력하면서도 동시에 이론의 부재를 한탄했습니다. 그는 인터뷰에서 “새로운 분석적 통찰을 알려주는 개념적인 논문을 사람들은 인정하지 않는다”라고 말했습니다. 기계가 발견 속도를 높일수록, 사람들은 이론을 추구하는 학자들을 시대에 뒤떨어진 불필요한 존재로 보게될 것입니다. 특정한 분야에 대한 지식은 그 문제에 대해 답을 바로 알려주는 기계 학습 모델을 만드는 실력에 비해 덜 중요한 것으로 여겨지게 될 것입니다.

금융에서 부채는 채무자에게서 채권자에게로, 그리고 미래로부터 과거로 권력을 이양합니다. 지적 부채 또한 마찬가지입니다. 이해가 없는 지식으로 가득찬 세상은 인과를 구별할 수 없는 세상으로 바뀔 것이며, 우리는 우리의 디지털 비서가 시키는 대로 행하는 존재가 될 것입니다. 대학이 입학 사정관으로 하여금 두꺼운 지원서류를 뒤적이게 하는 대신 기계 학습 모델에 모든 판단을 넘기게 될 수 있으리라는 것은 쉽게 상상할 수 있습니다. 그 기계 학습 모델은 신입생 집단의 학문적 성공 뿐 아니라 학창시절 동안 조화로운 인간관계를 맺고, 졸업 후에는 대학에 큰 기부를 할 수 있는 이들을 학생으로 뽑을 것입니다. 이런 세상에서 원하는 대학에 들어가기 위해서는 학생들 또한 자신만의 인공지능 알고리듬을, 곧 자신의 소셜 미디어 프로필을 그 대학의 학생선발 알고리듬이 가장 선호할 형태로 만들어주는 신경망을 만들어내야 할 것입니다.

아마 이 모든 기술이 처음에는 잘 작동할 것이고, 그러다 어느날 문제가 발생할 것입니다. 오늘날 인공 지능에 대한 적절한 비판의 대부분은 이 인공지능이 제대로 작동하지 않는 경우를 문제삼고 있습니다. 곧, 인공지능은 기존의 편견을 답습하거나 새로 만들 수 있으며, 실수를 할 수 있으며, 악한 존재가 될 수 있다는 것입니다. 하지만 우리는 인공지능이 모든 것을 제대로 해낼 때 과연 세상은 어떤 모습이 될지에 대해서도 준비해야 합니다.

(뉴요커, Jonathan Zittrain)

1부로

원문 보기