Categories: 과학

만국의 데이터 노동자여 단결하라

미국의 예술가인 제니퍼 린 모론은 사람들이 “데이터 노예”로 살고 있다고 말합니다. 이는 인터넷 서비스를 공짜로 받기 위해 그보다 훨씬 더 소중한 자신의 데이터를 아무 댓가 없이 기업에 넘기고 있다는 뜻입니다. “개인 데이터는 당신이 생각하는 것보다 훨씬 더 중요합니다.” 그녀는 이런 현실을 드러내기 위해 “극단적 자본주의(extreme capitalism)”라는 프로젝트를 진행했습니다. 그녀는 자기 자신의 데이터를 직접 판매하는 회사를 만들었고, 런던 갤러리에서 자신의 여러 데이터를 문서로 정리한 뒤 100파운드(약 15만원) 이상의 가격을 붙여 판매했습니다. 그녀의 건강 데이터와 사회보장번호를 비롯한, 그녀에 관한 모든 데이터의 가격은 7,000파운드(약 1,000만원) 정도였습니다.

몇몇 데이터를 판매한 후 그녀는 “모든 것이 부조리하다”고 말했습니다. 하지만 그녀의 작업이 이 시대를 얼마나 정확하게 묘사했는지와 무관하게, 적어도 그녀는 이 사회의 쟁점을 제대로 짚은 것입니다. 지난 3월, 정치 컨설팅 회사인 캠브리지 어낼리틱은 페이스북 사용자 8,700만명의 데이터를 몰래 입수했고, 이후 개인 정보 보호의 목소리는 더욱 높아지고 있습니다. 독일 수상 앙헬라 메르켈 또한 개인정보에 적절한 가격이 필요하다고 말하며, 이 문제의 해결을 요청했습니다.

오늘날 거대 기업들이 데이터를 독점하고 있는 상황에서 개인이 데이터를 판매하겠다는 모론의 아이디어는 별로 현실성이 없어 보입니다. 하지만 실제로 사람들이 자신의 데이터를 팔 수 있게 된다면, 그리고 대기업은 비용을 지불해야만 이를 이용할 수 있게 된다면 어떤 일이 벌어지게 될까요? 그리고 그 상황에서, 데이터 경제는 어떤 모습으로 존재할까요?

중요한 자원이 한때는 댓가 없이 사용되다가 이후 가치를 가지게 된 예는 매우 많이 있습니다. 예를 들어, 토지와 물이 그렇습니다. 하지만 데이터는 시장에서 거래되기가 특별히 더 어려워 보입니다. 데이터는 실제 물리적으로 존재하지 않으며, 경제학자들이 비경합재(nonrival goods)라 부르는, 곧 중복해서 사용이 가능한 자원입니다. 사실 더 많이 사용될수록 이 사회에는 더 유용해집니다. 또한, 끊임없이 발생하는 데이터 유출 사건은 이를 제대로 관리하는 것이 얼마나 어려운지 보여줍니다. 하지만 마이크로소프트 리서치에서 일하는 VR 전문가 재런 라니어와 예일의 경제학자 글렌 바일은 이 문제를 과거의 비슷한 예를 통해 해결할 수 있으며, 또한 이를 통해 “기술봉건주의(technofeudalism)”라는 이 시대가 가진 잠재적인 문제 또한 해결할 수 있을 것이라 주장합니다.

데이터처럼 물리적인 자원이 아니지만 거래가 되는 자원이 있습니다. 바로 노동입니다. 인류의 역사에서 대부분의 시기에 노동자는 노동의 댓가를 제대로 받지 못했습니다. 사람들이 자신의 노동을 자유롭게 팔 수 있게 된 후에도, 임금이 현실적인 수준으로 올라오기 까지는 수십 년이 걸렸습니다. 바일은 시카고 대학의 에릭 포스너와 공동으로 집필한 “급진적 시장(Radical Merkets)”에서 ‘역사는 반복된다’고 주장합니다. 그는 인공지능의 시대에 데이터는 다른 형태의 노동으로 보아야 한다고 말합니다.

이를 이해하기 위해서는 먼저 “인공 지능”이라는 용어에 문제가 있다는 것을 먼저 지적해야 합니다. 바일과 포스너는 “집합 지능(collective intelligence)”이 더 올바른 용어라고 말합니다. 대부분의 인공지능 알고리듬은 인간이 만든 데이터를 이용해 훈련하는 ‘기계학습’이라는 과정이 필요합니다. 인간이 만들어낸, 정답을 포함한 데이터 없이는 번역, 음성 인식, 이미지 인식 등 어떤 인공지능 기술도 불가능합니다. 따라서 인간이 만든 데이터는 인공지능을 가능하게 만드는 노동이라 볼 수 있습니다. 데이터 경제가 발전할수록 이러한 데이터 작업은 다양한 형태를 띄게 될 것입니다. 사람들의 SNS 활동이나 음악 감상, 음식점 추천 등의 활동에서도 새로운 서비스가 탄생할 수 있는 데이터가 만들어지며, 사진에 이름을 붙이거나 도심을 운전하는 것과 같은 보다 능동적인 활동에서 생성된 데이터로도 인공지능을 훈련시킬 수 있습니다.

그러나 이 데이터가 어떻게 만들어지는지와 무관하게, 자신이 만들어낸 데이터가 어떻게 쓰이는지를 추적하거나 그 가치를 매기는 것은 거의 불가능합니다. 설사 그것이 가능하다 하더라도, 인공지능 기업을 대상으로 이를 거래할 수 있는 힘을 개인이 가지기는 어려울 것입니다. 하지만 노동의 역사는 이 문제를 어떻게 해결해야 하는지 알려줍니다. 그것은 바로 노동자의 단체인 노동조합입니다. 역사적으로 노동의 댓가가 적절한 수준으로 오를 수 있었던 데에는 노동조합의 역할이 매우 중요했습니다. 바일은 사람들의 데이터를 관리해주는 “데이터 노동조합”이 탄생할 것이라 말합니다. 바일은 과거 노동조합이 했던 것처럼, 데이터 노동조합 또한 데이터의 가격을 기업과 흥정하며, 회원들의 데이터가 어떻게 쓰여지는지를 추적할 뿐 아니라, 명성 점수 등을 이용해 데이터의 품질을 관리하게 될 것이라 말합니다. 또한 데이터 전문가를 고용하고, 심지어 조합원들의 데이터에 기업의 접속을 막는 식으로 파업을 주동할 수도 있습니다. 같은 방식으로, 조합원들의 데이터를 대신 거래해주는 창구 역할도 할 수 있습니다.

이런 이야기들은 그저 과학 소설로 들릴지 모릅니다. 구글이나 페이스북이 사람들이 공짜로 제공하는 데이터를 바탕으로 광고 수입을 얻는 지금의 모델을 버릴 이유가 있을까요? 2017년 이 두 기업은 광고만으로 1,350억 달러를 벌었습니다. 그들에게 사람들의 데이터에 대해 비용을 내라고 한다면, 그들의 수익은 크게 줄어들 것입니다. 또한 시티즌미(CitizenMe)나 데이타쿠(Datacoup)와 같은 초기 형태의 데이터 노동조합은 아직 성공을 거두지 못하고 있습니다. 한편, 다른 분야에서는 이 인터넷 대기업들이 데이터에 돈을 지불하고 있지만, 이 사실이 공개적으로 알려지지 않도록 조심하고 있습니다. 이들은 자신들의 알고리듬을 검증하고 불량한 콘텐츠를 제거하는 일을 외주로 맡기고 있습니다. 사진에 설명을 다는 일을 아마존의 메커니컬 터크와 같은 집단 고용 플랫폼으로 해결하는 기업도 있습니다. 시애틀에 위치한 스타트업인 마이티AI는 자율주행 알고리듬을 위해 거리 사진에 설명을 붙이는 일을 수 천명의 사람들에게 돈을 주고 시키고 있습니다.

게다가 만약 인공지능이 정말 미래를 좌우하게 된다면, 우리는 더 많은 더 훌륭한 데이터를 필요로 하게될 것입니다. 인공지능 서비스가 더 정교해질수록 더 고품질의 데이터가 필요해지며, 이를 위해 사람들은 돈을 받고 데이터를 만들어 내야할 것입니다. 일단 인터넷 대기업 하나가 데이터에 돈을 주기 시작하면, 다른 기업들도 이를 따르게 될 것입니다.

데이터를 노동으로 다룸으로써 이들 기업의 수익은 줄어들겠지만, 이들의 사업 크기는 더 커질 것입니다. 또한 데이터 노동자들도 이들의 성장을 어느 정도는 함께할 수 있습니다. 이들은 아침에 일어나, 데이터 노동조합이 제공하는 현황판을 확인하고, 광고를 보는 일(컴퓨터 카메라가 사용자의 반응을 수집하는)에서, 짧은 번역이나 가상의 건물을 돌아다니는 일 등, 자신에게 맞는 적절한 일을 찾게될 것입니다. 현황판에는 자신의 과거 데이터에 대한 평가와 수입, 그리고 새로운 기술 추천 등이 올라올 수 있습니다.

하지만 개인의 데이터가 일반적으로 노동처럼 여겨지고 보상이 주어지기 위해서는 더 많은 변화가 필요합니다. 첫째, 이 새로운 데이터 경제를 뒷받침할 적절한 법적 제도적 장치가 있어야 합니다. 지난 5월 발효된 EU의 GDPR 정책은 사람들에게 자신의 데이터를 확인하고, 다운로드 받으며, 심지어 지울 수 있는 권리를 부여했습니다. 둘째, 데이터가 어떻게 사용되는지를 추적하는 기술이 더 발전해야 합니다. 인공지능에 사용되는 특정한 데이터의 가치를 계산하는 방법에 대한 연구는 이제 막 시작하고 있습니다.

세번째 필요한 변화이자 가장 중요한 변화는 사람들이 자신이 데이터 노동자라는 “계급 의식”을 가져야 한다는 것입니다. 대부분의 사람들은 자신의 정보가 보호되기를 원한다고 말하지만 사실 그들은 아무것도 아닌 일에도 자신의 데이터를 쉽게 내어주며, 이는 “개인정보 파라독스”라는 이름으로 알려져 있습니다. 그러나 사람들의 인식은 변하고 있습니다. 퓨 리서치센터의 조사에 따르면, 미국인의 90% 이상이 자신들의 데이터를 누가 가져가는지가 중요하다고 생각하고 있습니다.

회의적인 이들은 사람들이 자신의 데이터로 돈을 벌게 된다 할지라도 그 댓가가 크지 않을 것이라 말합니다. 예를 들어, 페이스북의 모든 수익을 월간 사용자의 수로 나눌 경우 사람들은 1년에 겨우 9달러를 벌 수 있을 뿐입니다. 하지만 이런 계산은 데이터의 시대가 이제 막 시작했다는 사실을 간과한 것입니다. 인공지능은 종종 전기에 비유되며, 전기가 처음 공급되던 19세기 말, 도시 전체의 전기 사용량은 오늘날 한 가정이 사용하는 전기의 양 보다도 작았습니다.

데이터 경제는 불평등을 더 키우지 않을까요? 어떤 이의 데이터는 다른 이의 데이터보다 분명 더 가치있을 수 있습니다. 하지만 바일은 가치있는 데이터를 만들어내는 기술은 생각보다 더 쉽게 전파될 것이며, 따라서 데이터 경제는 기존의 불평등을 보다 낮추게 될 것이라 말합니다. 어떤 경우이든, 사회는 인공지능에 의해 창출되는 부를 공평하게 나눌 방법을 찾을 것입니다. 오늘날 이 부는 인터넷 대기업들이 모두 가져가고 있습니다. 바일은 우리가 이를 바꾸지 않는다면, 사회적 불평등의 수준이 중세 시대로 돌아갈 것이라 경고합니다. 그 경우, 만국의 데이터 노동자들이 단결할 그 날이 오지 않으리라는 법도 없습니다.

(이코노미스트)

원문 보기

veritaholic

Recent Posts

[뉴페@스프] “응원하는 야구팀보다 강한” 지지정당 대물림… 근데 ‘대전환’ 올 수 있다고?

뉴스페퍼민트는 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 글에 관한 해설을 쓰고…

2 일 ago

[뉴페@스프] ‘이건 내 목소리?’ 나도 모를 정도로 감쪽같이 속였는데… 역설적으로 따라온 부작용

* 비상 계엄령 선포와 내란에 이은 탄핵 정국으로 인해 한동안 쉬었던 스브스프리미엄에 쓴 해설 시차발행을…

4 일 ago

살해범 옹호가 “정의 구현”? ‘피 묻은 돈’을 진정 해결하려면…

우리나라 뉴스가 반헌법적인 계엄령을 선포해 내란죄 피의자가 된 윤석열 대통령을 탄핵하는 뉴스로 도배되는 사이 미국에서…

5 일 ago

미국도 네 번뿐이었는데 우리는? 잦은 탄핵이 좋은 건 아니지만…

윤석열 대통령에 대한 탄핵 소추안 투표가 오늘 진행됩니다. 첫 번째 투표는 국민의힘 의원들이 집단으로 투표에…

1 주 ago

“부정 선거” 우기던 트럼프가 계엄령이라는 카드는 내쳤던 이유

윤석열 대통령의 계엄령 선포와 해제 이후 미국 언론도 한국에서 일어나는 정치적 사태에 큰 관심을 보이고…

2 주 ago

트럼프, 대놓고 겨냥하는데… “오히려 기회, 중국은 계획대로 움직이는 중”

트럼프 2기 행정부가 출범하면 미국과 중국의 관계가 어떻게 될지에 전 세계가 촉각을 곤두세우고 있습니다. 안보…

3 주 ago