Categories: IT과학

시각화된 데이터를 그대로 믿어서는 안되는 이유

지난 주 피터와든이 자신의 블로그에 올린 데이터 과학자를 주의하라는 경고는 많은 사람들의 주목을 받았습니다. 그의 글은 매우 중요한 점을 지적하고 있지만, 저는 그가 나타낸 문제의식을 보다 명확하게 표현하고 싶습니다. 누구나 자신의 데이터를 발표할 때는 주의할 필요가 있습니다. 하지만 데이터를 시각화(visualize)하여 드러낼 때에는 더욱 특별한 주의가 필요합니다.

와든은 자신의 “미국인들의 페이스북 친구지도”에서 자신이 데이터를 흥미롭게 만들기 위해 비슷한 지역을 색칠하고, 재미있는 이름들을 붙였다고 고백했습니다. 여기에 큰 문제는 없습니다. 그러나 문제는 인간은 특별히 시각적 정보에 민감하다는 사실입니다. 사람들은 문자로 된 정보에 비해 그림과 도표로 된 정보를 더 쉽게 받아들이고, 더 큰 권위를 부여합니다.

지난 5월 워싱턴 포스트가 발표했던 “나라별 인종차별 지수”(관련 기사) 기사는 그 좋은 예입니다.  이 기사는 객관적이고 과학적인 작업으로 일반인들에게 받아들여졌고 전세계적인 주목을 받았습니다. 몇몇 사회과학자들이 이 지도에 사용된 방법론과 자료들의 문제점을 지적했으나, 워싱턴 포스트의 기사가 80,000번 이상 SNS 상에 공유된 반면, 이에 대한 비판은 그 1% 의 사람들에게도 알려지지 못했습니다.

우리가 시각적 정보에 대해 더 신뢰성을 부여하는 데는 다양한 이유가 있을 수 있습니다. 어쩌면 학창시절부터, 자신의 결론을 도표와 그림으로 표현하도록 배움으로써 이들에게 더 큰 신뢰를 가지도록 학습되었을 수도 있습니다.

와든은 자신의 글의 마지막 부분에 데이터 과학자들의 작업에 대해 사람들이 할 수 있는 일, 곧 그들의 작업에 언제나 비판적 시선을 가져줄 것을 부탁했습니다. 나는 인포그래픽과 같은 시각화된 데이터들에도 사람들이 같은 시선을 가져줄 것을 부탁합니다. 그리고 데이터를 시각화하여 발표하는 누구나, 데이터의 출처를 표시하는 것을 넘어, 자신들의 작업이 가지는 의미와 한계를 명확하게 명시해 줄 것을 부탁합니다. (Guardian)

원문 보기

veritaholic

Recent Posts

[뉴페@스프] “응원하는 야구팀보다 강한” 지지정당 대물림… 근데 ‘대전환’ 올 수 있다고?

뉴스페퍼민트는 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 글에 관한 해설을 쓰고…

2 일 ago

[뉴페@스프] ‘이건 내 목소리?’ 나도 모를 정도로 감쪽같이 속였는데… 역설적으로 따라온 부작용

* 비상 계엄령 선포와 내란에 이은 탄핵 정국으로 인해 한동안 쉬었던 스브스프리미엄에 쓴 해설 시차발행을…

4 일 ago

살해범 옹호가 “정의 구현”? ‘피 묻은 돈’을 진정 해결하려면…

우리나라 뉴스가 반헌법적인 계엄령을 선포해 내란죄 피의자가 된 윤석열 대통령을 탄핵하는 뉴스로 도배되는 사이 미국에서…

5 일 ago

미국도 네 번뿐이었는데 우리는? 잦은 탄핵이 좋은 건 아니지만…

윤석열 대통령에 대한 탄핵 소추안 투표가 오늘 진행됩니다. 첫 번째 투표는 국민의힘 의원들이 집단으로 투표에…

1 주 ago

“부정 선거” 우기던 트럼프가 계엄령이라는 카드는 내쳤던 이유

윤석열 대통령의 계엄령 선포와 해제 이후 미국 언론도 한국에서 일어나는 정치적 사태에 큰 관심을 보이고…

2 주 ago

트럼프, 대놓고 겨냥하는데… “오히려 기회, 중국은 계획대로 움직이는 중”

트럼프 2기 행정부가 출범하면 미국과 중국의 관계가 어떻게 될지에 전 세계가 촉각을 곤두세우고 있습니다. 안보…

3 주 ago