"데이터" 주제의 글
  • 2014년 6월 11일. Grantland – 월드컵 특집 축구 관전 가이드 (1)

    옮긴이: 가나와의 평가전 0:4 대패로 한국 대표팀 경기 말고 다른 경기도 흥미를 갖고 지켜봐야 할 이유가 더 늘어난 것 같습니다. 방송 중계기술이 발달하고 전 세계 여러 리그를 안방에서 시청할 수 있게 되면서 정말 축구 전문가들이 많아졌습니다. 웬만큼 알아서는 축구팬 명함도 못 내밀 정도죠. 그러던 중 Grantland라는 스포츠 전문 사이트를 알게 되었습니다. Grantland에서 정리한 월드컵 특집 ‘축구 관전 가이드’를 이틀에 걸쳐 소개합니다. 특히 알아두면 축구를 분석적으로 보는 시야를 넓힐 수 있는 용어들도 더 보기

  • 2014년 5월 29일. 공항 쇼핑의 성황

    4월 30일 개장한 카타르 공항은 25,000 제곱미터 넓이에 온갖 상점과 식당이 입점했습니다. 2017년 개장할 아부다비의 새 공항은 실내 공원에 사막을 테마로 지중해 식물을 들여놓을 예정이죠. 런던 히드로 공항에는 화덕 피자와 쇼핑 컨시어지도 있습니다. 공항의 주요 수익원이던 공항 이용세가 정부의 규제와 저가항공의 번성으로 점점 돈을 걷기 힘들어지면서 쇼핑몰은 새로운 수익원으로 떠올랐습니다. 주류 회사, 화장품 회사, 선글라스 회사는 이제 공항 쇼핑몰이 “제 6의 대륙”이라고 말합니다. 물론 위기도 있었습니다. 1999년 EU 내 항공편에서 면세 더 보기

  • 2014년 5월 8일. 일자리의 미래는 UPS 트럭과 같은 모습일 것입니다

    많은 측면에서 UPS 트럭을 몰고 다니는 택배 기사들의 일상은 과거와 크게 달라보이지 않습니다. 갈색 트럭에서 짐을 내리고, 배송하려는 집을 방문하면 개가 짖고, 그리고 집 주인 아주머니는 시끄럽게 짖어대는 개에 대해 사과를 하면서 물건을 받았다는 수령증에 사인을 하는 일상적인 풍경이 반복됩니다. 하지만 표면에 드러나지 않는 UPS 트럭 기사들의 삶은 큰 변화를 겪고 있습니다. UPS 배송 기사인 빌 얼(Bill Earle) 씨는 1990년대에 UPS에서 일을 시작했는데 그 당시만 해도 그가 배송을 하려 도로를 달릴 때는 더 보기

  • 2014년 4월 18일. 퓰리처상과 신문사의 성공과의 상관 관계

    지난 14일 올해 퓰리처상이 발표되었습니다. 고품격 저널리즘의 상징이기도 한 퓰리쳐상은 올해도 가디언, 워싱턴포스트, 뉴욕타임즈 등의 훌륭한 언론사의 기자들에게 돌아갔습니다. 538에서는 퓰리처상을 휩쓰는 훌륭한 언론이 상업적으로도 성공하고 있는지 알아보았습니다. 특히 지난 10년간 늘어난 독자 수와 퓰리처상 수상 여부가 상관관계가 있는지 알아보았죠. 먼저 2004년 주요 언론사의 구독자 수와 2013년 구독자 수를 찾고, 퓰리처상 수상 혹은 최종 후보에 선정된 횟수를 산정했습니다. 그리고 여기 원본 데이터를 깃허브(Github)에 공유하니 관심 있는 분들은 직접 분석해보세요. 퓰리처상을 가장 더 보기

  • 2013년 10월 22일. 와이파이는 당신이 마트에서 한 일을 알고 있다

    “(손님들은) 보통 계산대에서 2분 정도를 보냅니다. 전체 고객의 절반 정도는 평균 일주일에 두 번 장을 보러 오죠. 10%는 아무 것도 안 사고 빈 손으로 나갑니다. 사려던 물건을 못 찾았기 때문일 거예요. 마트 오른편에 마련한 세일 코너가 왼편에 마련한 코너보다 훨씬 좋은 호응을 얻었습니다. 여기 보시면 고객들이 어디에 오래 머무는 지 알 수 있어요.” 한 마트 점장이 가게의 도면과 함께 소비자들의 소비 성향을 줄줄이 읊어줍니다. 도대체 점장은 이렇게 상세한 정보를 어떻게 더 보기

  • 2013년 8월 30일. 스포츠 제국 ESPN의 미래

    세계 최고의 스포츠 채널. ESPN이 자신을 지칭할 때 즐겨 부르는 말입니다. 2012년 한해 ESPN은 3만 5천 시간 동안 프로그램을 내보냈고 이는 미국에서 일어난 스포츠 경기 생중계의 절반을 포함하는 시간입니다. 모회사 디즈니가 올리는 수익의 절반이 ESPN에서 나옵니다. 스포츠 리그들과의 계약도 적극적입니다. 월요일 저녁 풋볼 중계권은 152억 달러, 메이저리그 야구 중계권은 56억 달러에 사들였습니다. 7개의 TV 채널을 가지고 있고, 인터넷 웹사이트는 물론이며 매거진도 발행하고 있습니다. 이를 고려할 때 34년 역사의 스포츠 미디어 더 보기

  • 2013년 8월 20일. EPL은 이미 데이터를 받아들였습니다

    지난 주말 잉글랜드 프리미어리그(EPL)를 비롯한 유럽 축구리그  대부분이 새 시즌을 시작했습니다. 축구는 지구에서 가장 인기 있는 스포츠고, 세계적인 브랜드로 발돋움한 EPL은 엄청난 수익을 올리고 있습니다. 특히 TV 중계권의 가격이 말그대로 폭등하면서 EPL은 올해만 31억 파운드(5조 4천억 원)를 벌어들일 전망입니다. 리그와 구단의 수익이 늘어나는 만큼 선수들의 몸값도 천정부지로 치솟고 있습니다. 각 구단들은 비교적 싼 값에 훌륭한 재능을 갖춘 어린 유망주를 발굴하기 위해 안간힘을 다하고 있습니다. 전 세계 곳곳에는 유럽 구단들이 파견해 더 보기

  • 2013년 5월 7일. 할리우드 영화 대본도 데이터 분석의 시대로

    데이터 분석은 선거운동 과정과 온라인 마케팅 분야를 크게 바꾸어 놓았습니다. 영화나 음악 같은 엔터테인먼트 산업에도 이제 데이터의 시대가 도래했습니다. DVD를 대여해주는 넷플릭스(Netflix)의 경우 고객이 지금까지 빌려본 DVD를 분석해 추천작을 골라주는 알고리즘을 이용하고 있고, 판도라 역시 이러한 방법으로 음악을 추천합니다. 이제 이러한 마이크로데이터 분석이 창의성과 직감이 가장 중요하다고 여겨지던 할리우드의 대본 작업에도 이용되고 있습니다. 줄담배를 피워대는 전직 통계학 교수인 비니 브루지스(Vinny Bruzzese)는 ‘대본 평가(script evaluation)’라는 서비스를 할리우드 영화사들에 판매하고 있습니다. 대본 더 보기

  • 2013년 5월 1일. 축구의 “머니볼”, 어디까지 왔나

    원작인 책은 물론 영화까지 흥행몰이를 했던 야구데이터분석(Sabermetrics)의 교과서 “머니볼(Money Ball)”에 대해서는 많이들 알고 계실 겁니다. 상대적으로 게임이 정적이고, 그만큼 기록을 수량화하기 쉬운 야구에 비해 90분 내내 선수들이 피치 위를 누비는 축구는 어떨까요? 골라인 판독기술부터 선수들의 몸관리, 부상시 재활치료 과정에는 이미 갖가지 첨단 기술이 동원되고 있습니다. 경기가 진행되는 90분 동안에도 데이터는 곳곳에서 축구의 새로운 지평을 열고 있습니다. 공 점유율, 패스 성공률 등 경기를 분석하고 전술을 짤 때 이제 누구도 데이터를 등한시할 수 더 보기

  • 2013년 4월 26일. 페이스북 세상의 데이터 과학: 페이스북 통계 관한 모든 것

    *역자주: 매쓰매티카(Mathematica) 프로그램으로 유명한 울프램(Wolfram)이 자사의 분석 프로그램을 이용해서 페이스북 사용자들에 관한 다양한 통계를 발표했습니다. 다음은 창업자인 스테픈 울프램(Stephen Wolfram)의 블로그에 올라온 글을 요약 번역 한 것입니다. 더 많은 통계는 원문 읽기를 참고하세요. 1. 연령과 페이스북 친구 수: 친구 수가 가장 많은 연령대는 10대 초반으로 평균 400명 가까이 됩니다. 하지만 사용자의 나이가 많아질수록 친구 수가 줄어듭니다. 연령에 따른 친구들의 나이는 어떻게 변화할까요? 연령에 상관 없이 가장 많은 친구들의 연령대는 사용자 더 보기

  • 2013년 4월 19일. 반박당한 유명 경제학 페이퍼들의 역사

    하버드 대학교의 경제학자 라인하트(Carmen Reinhart)와 로고프(Kenneth Rogoff)가 발표한 GDP 대비 부채 비율과 경제 성장 사이의 관계를 연구한 논문의 오류를 다른 경제학자들이 지적하면서 뜨거운 논쟁이 이어지고 있습니다. 하지만 실제 경제정책에 큰 영향력을 미친 경제학 논문에서 황당한 실수가 발견된 건 이번이 처음은 아닙니다. 사람은 누구나 실수를 합니다. 정년을 보장받은 정교수도 예외는 아닙니다. 하지만 대부분은 의도적인 조작이라기보다 단순한 실수인 경우들이 많습니다. 특히 데이터를 입력하고 코딩을 하는 대학원생 연구 조교(research assistant)들의 실수라고 지적되는 경우가 더 보기

  • 2013년 3월 12일. 항공 승객 보안 검사에 개인 정보 이용하는 것에 관한 논쟁

    미국 항공보안 당국과 관광업계 관계자들이 축적된 개인 정보를 토대로 ‘신뢰할 수 있는 승객’과 ‘위험한 승객’으로 나눠 각기 다른 보안 검사를 실시하겠다는 계획에 개인정보를 보호해야 한다는 시민단체들과 유럽 규제당국이 반대하고 나섰습니다. 지난달 뉴욕 브루클린에서 열린 항공안전에 관한 회의에서 핵심적으로 논의된 문제는 승객들의 정보를 모으고 공유하는 시스템을 구축하는 일에 관한 것이었습니다. 승객에 관한 정보는 승객이 신뢰할 수 있는 승객 프로그램(trusted traveler program)을 통해서 자발적으로 제공하거나 연방 정부가 테러리스트 주의 리스트, 범죄자 정보 등을 통해서 수집하는 방안이 논의되었습니다. 항공 더 보기