시각화된 데이터를 그대로 믿어서는 안되는 이유
지난 주 피터와든이 자신의 블로그에 올린 데이터 과학자를 주의하라는 경고는 많은 사람들의 주목을 받았습니다. 그의 글은 매우 중요한 점을 지적하고 있지만, 저는 그가 나타낸 문제의식을 보다 명확하게 표현하고 싶습니다. 누구나 자신의 데이터를 발표할 때는 주의할 필요가 있습니다. 하지만 데이터를 시각화(visualize)하여 드러낼 때에는 더욱 특별한 주의가 필요합니다.
와든은 자신의 “미국인들의 페이스북 친구지도”에서 자신이 데이터를 흥미롭게 만들기 위해 비슷한 지역을 색칠하고, 재미있는 이름들을 붙였다고 고백했습니다. 여기에 큰 문제는 없습니다. 그러나 문제는 인간은 특별히 시각적 정보에 민감하다는 사실입니다. 사람들은 문자로 된 정보에 비해 그림과 도표로 된 정보를 더 쉽게 받아들이고, 더 큰 권위를 부여합니다.
지난 5월 워싱턴 포스트가 발표했던 “나라별 인종차별 지수”(관련 기사) 기사는 그 좋은 예입니다. 이 기사는 객관적이고 과학적인 작업으로 일반인들에게 받아들여졌고 전세계적인 주목을 받았습니다. 몇몇 사회과학자들이 이 지도에 사용된 방법론과 자료들의 문제점을 지적했으나, 워싱턴 포스트의 기사가 80,000번 이상 SNS 상에 공유된 반면, 이에 대한 비판은 그 1% 의 사람들에게도 알려지지 못했습니다.
우리가 시각적 정보에 대해 더 신뢰성을 부여하는 데는 다양한 이유가 있을 수 있습니다. 어쩌면 학창시절부터, 자신의 결론을 도표와 그림으로 표현하도록 배움으로써 이들에게 더 큰 신뢰를 가지도록 학습되었을 수도 있습니다.
와든은 자신의 글의 마지막 부분에 데이터 과학자들의 작업에 대해 사람들이 할 수 있는 일, 곧 그들의 작업에 언제나 비판적 시선을 가져줄 것을 부탁했습니다. 나는 인포그래픽과 같은 시각화된 데이터들에도 사람들이 같은 시선을 가져줄 것을 부탁합니다. 그리고 데이터를 시각화하여 발표하는 누구나, 데이터의 출처를 표시하는 것을 넘어, 자신들의 작업이 가지는 의미와 한계를 명확하게 명시해 줄 것을 부탁합니다. (Guardian)