"빅데이터" 주제의 글
-
2014년 7월 28일. “애플은 정말로 새 제품이 출시되면 기존 모델의 성능을 일부러 떨어트릴까?”
옮긴이: 이 글은 하버드대학 경제학과의 뮬레이네이탄(Sendhil Mullainathan) 교수가 뉴욕타임스 업샷(Upshot)에 쓴 글입니다. Planned Obsolescence. 사전을 찾아보면 ‘계획적 구식화’라고 번역되는 이 말은 새 제품을 출시한 기업이 새 제품의 매출을 늘리기 위해 옛 제품을 구닥다리로 만들어버리는 걸 뜻합니다. 뮬레이네이탄 교수는 음모론자들에게 좋은 먹잇감이 될 만한 이 현상을 두고 특히 곧 출시를 앞둔 새로운 아이폰 모델을 예로 들어 빅데이터(Big Data)가 어디까지 구체적인 증거를 제공하고 현상을 설명하는 데 보탬이 될 수 있는지를 풀어썼습니다. 중간에 삽입한 그래프는 더 보기 -
2014년 6월 19일. 시대에 따른 죄와 벌
1765년, 존 와드(John Ward)는 시계와 모자를 훔친 죄로 교수형을 당했습니다. 2년 뒤, 엘리자베스 브라운리그(Elizabeth Brownrigg)는 어린 고아를 수 주 동안 매달고 옷을 벗기고 채찍으로 상처에 피가 터져나올 정도로 고문한 죄로 역시 교수형을 당했습니다. 이 당시 영국사회와 사법제도는 죄를 구분하지 않았습니다. 소매치기와 살인자는 모두 사형을 당했습니다. 그러나 이로부터 60년이 지나지 않아, 살인자는 사형을 당하거나 호주로 귀양보내어 졌으며 소매치기는 벌금만을 내도록 바뀌었습니다. 사형의 기준이 바뀌었고, 폭력 범죄와 비폭력 범죄는 구분되기 시작했습니다. 어떻게 더 보기 -
2014년 4월 9일. 세상에서 가장 빨리 말하는 랩퍼는?
역자 주: 이 글에서는 새로운 미디어 두 곳을 소개할 예정입니다. 먼저 이 기사를 발췌한 538은 뉴욕타임즈의 네이트실버가 독립하면서 창간한 매체로 각종 사회 이슈에 데이터로 접근합니다. 랩을 숫자로 분석한 아래 글은 전형적인 538의 형식을 보여주지요. (관련기사: 네이트 실버의 538 개장 선언서) 다른 미디어는 매일 중요한 정보 하나를 선정해 인포그래픽으로 선보이는 슬로데이입니다. 이번주부터 매주 수요일 슬로데이에서 뉴스페퍼민트의 글을 인포그래픽으로 만들어 제공할 예정입니다. 제이 지(Jay Z)가 538의 긴 개장 선언서를 랩으로 부르면 51분이 더 보기 -
2014년 3월 14일. (페이스북 데이터과학) 사랑의 지표
페이스북 데이터과학 페이지는 페이스북 빅데이터를 분석하여 여러 가지 재미있는 사회통계를 소개합니다. 화이트데이를 맞아 지난 발렌타인데이 특집으로 올라온 사랑 관련 통계 여섯 가지 가운데 일부를 소개합니다. 관계와 종교 미국인의 86%는 같은 종교의 사람을 택합니다. 그러나 종교가 같다는 사실이 그렇게 중요할까요? 이는 종교에 따라 다릅니다. 모르몬교, 기독교, 이슬람교, 시크교, 여호와의 증인 신자는 같은 종교를 가진 사람을 택할 확률이 확연히 높습니다. 나이 차이? 페이스북에 따르면 사랑에 빠진 남녀의 평균 나이차이는 2.4세 입니다. 남자가 더 보기 -
2014년 1월 7일. 넷플릭스는 어떻게 할리우드 영화를 분해하는가
넷플릭스의 굉장히 구체적인 영화장르 구분이 우스갯소리처럼 거론된 적은 많습니다. “시스템에 맞서싸우는 가슴뭉클한 다큐멘터리” “실화에 기반한 충성심에 대한 시대물” “사탄에 관한 1980년대 외국 영화” 식으로 굉장히 구체적이죠. 도대체 넷플릭스에는 몇 개의 영화장르가 있는 걸까요? 처음에는 저도 가볍게 분석을 시작했습니다. 트위터를 통해 장르 이름을 모으다가, 넷플릭스의 ID 시스템을 알게 되어 스크립트를 써서 모든 URL 밑에 있는 장르이름을 스크랩해 왔죠. 분석해볼수록 끝도 없이 많은 겁니다. 무려 76,897 개의 장르를 찾았고 읽고 복사에 붙여넣으며 더 보기 -
2013년 12월 3일. 루모시티(Lumosity): 과학발전에 기여하는 게임사이트
루모시티(Lumosity)는 사용자의 두뇌를 훈련시키는 웹사이트입니다. 사용자는 이 사이트에 나이와 수면 시간과 같은 몇 가지 개인사항을 입력한 후 간단한 인지 게임을 즐기게 됩니다. 사이트는 당신의 능력 변화를 그래프로 보여줍니다. 예를 들어, 화요일 오전 10시 반, 커피 한 잔 반을 마신 후 당신의 능력이 최고조에 이른다는 것을 알려줍니다. 현재 160개국에 5천만 명의 사용자를 가진 이 게임은 10억 회가 넘는 게임 결과를 저장하고 있습니다. 그리고 이 결과들은 인간의 건강과 행동에 대한 새로운 연구에 더 보기 -
2013년 10월 22일. 구글은 더 좋은 인재를 만들기 위해 어떻게 데이터를 활용하는가
“무시하지마요. 내 말을 뒷받침할 차트와 그래프가 있어요.” (“I have charts and graphs to back me up. So f*** off.”) 구글의 HR(인사관리) 부에는 People Analytics (인력 분석) 부서가 있습니다. 이 곳에서는 구글 직원들이 어떻게 하면 일을 더 잘할 수 있을지 데이터를 분석합니다. “새 직원을 한달 더 일찍 일에 투입하면 어떻게 될까요?” 같은 실용적인 질문부터 “모든 엔지니어가 그들의 가능성을 뛰어넘으면 무슨 일이날까요?” 라는 존재론적인 질문, “구글이 당신 기대 수명을 일년 늘리면 어떻게 더 보기 -
2013년 8월 14일. 빅데이터계의 거물, 네이트 실버와의 인터뷰
네이트 실버는 2008년에는 미국 50개 주 중 49개 주, 그리고 2012년에는 50개 주 전체의 대선 결과를 정확히 예측하여 일대 파장을 일으킨 빅데이터 세계의 거물입니다. FT와의 인터뷰에 연한 하늘색 셔츠와 안경을 쓰고 나타난 네이트 실버는 영락없는 모범생(nerdy nerd)처럼 보였습니다. 그러나 그래보여도 ‘괴짜의 경제학’의 저자들과 ‘머니볼’의 야구 매니저 빌리 빈에 이어 통계학자들의 인기를 최고봉에 올려놓은 스타입니다. “바지지퍼가 열린 것도 아닌데 사람들이 공항에서 저를 쳐다봅니다.” 곧 그는 자신의 인기를 수학적으로 분석하려 합니다. “언제 더 보기 -
2013년 7월 29일. 데이터 과학자들을 그대로 믿어서는 안되는 이유
데이터 과학자가 가지는 장점은 자신이 발표하는 결과들은 과학과 동등한 대접을 받는 반면, 과학에서 매우 중요한 ‘결과의 재현 여부’나 ‘다른 연구자들로부터의 비판’에 대해서는 걱정할 필요가 없다는 점입니다. 내가 이것을 처음 느낀 것은 2년 전 미국의 페이스북 친구연결지도를 블로그에 발표했을 때의 일입니다. 물론 여기에 사용된 자료는 실제 미국인 2억 2천만 명의 자료였고, 나는 미국의 각 도시로부터 그 도시에서 가장 연결이 많은 다른 10개 도시를 연결하는 방법으로 자료를 시각화했습니다. 그리고 얼핏 보기에 연결이 많은 더 보기 -
2013년 5월 7일. 할리우드 영화 대본도 데이터 분석의 시대로
데이터 분석은 선거운동 과정과 온라인 마케팅 분야를 크게 바꾸어 놓았습니다. 영화나 음악 같은 엔터테인먼트 산업에도 이제 데이터의 시대가 도래했습니다. DVD를 대여해주는 넷플릭스(Netflix)의 경우 고객이 지금까지 빌려본 DVD를 분석해 추천작을 골라주는 알고리즘을 이용하고 있고, 판도라 역시 이러한 방법으로 음악을 추천합니다. 이제 이러한 마이크로데이터 분석이 창의성과 직감이 가장 중요하다고 여겨지던 할리우드의 대본 작업에도 이용되고 있습니다. 줄담배를 피워대는 전직 통계학 교수인 비니 브루지스(Vinny Bruzzese)는 ‘대본 평가(script evaluation)’라는 서비스를 할리우드 영화사들에 판매하고 있습니다. 대본 더 보기 -
2013년 4월 16일. 의료기기의 임상적 효과를 측정하려는 시도
대형 의료보험 회사들과 주요 병원들 사이에서 인체 이식용 의료기기의 임상적 효과를 측정하려는 움직임이 나타나고 있습니다. 이 시도는 빅데이터를 이용하고 있으며 의료업계에서 최초로 시도되는 것입니다. 미국 의료보험 회사 중에서 가장 큰 유나이티드 헬스케어(UnitedHealthcare)와 텍사스 주의 베일러 병원그룹(Baylor Health Care System), 캘리포니아 주의 디그니티 병원그룹(Dignity Health), 일리노이 주의 애드보키트 병원그룹(Advocate Health Care)은 쉐어드클래러티(SharedClarity)라는 회사를 공동으로 설립하였습니다. 이 회사는 유나이티드 헬스케어의 보험 청구 데이터와 의료 데이터를 종합하여 어떤 의료기기가 환자에게 임상적으로 가장 효과가 있는지를 더 보기 -
2013년 3월 27일. 새로운 개념의 자선 사업, 데이터 기부
민간 부문의 지원 없이는 공공사업이 발전하기 쉽지 않습니다. 빅 데이터도 마찬가지입니다. 저는 2009년 금융위기 당시 빅 데이터와 정책수립의 연관성을 연구하기 위해 설립된 유엔 글로벌 펄스 이니시에이티브(UN Global Pulse initiative) 의장으로서 데이터 수집의 중요성을 논의하고자 합니다. 개발도상국의 통신회사가 보유한 통화 시간(airtime)의 구매패턴은 각 가정의 소득 상황을 보여줍니다. 블로그나 트위터에 오르내리는 대화는 실업률이나 인플레이션을 실시간으로 짐작할 수 있게 합니다. 미국과 호주의 기관들은 지진 상황과 전염병 유행 경로를 파악하는 데 있어서 톡톡히 덕을 더 보기