당신을 기만하는 통계 다섯 가지 (2)
* 99% 정확하다는 주장은 사실이더라도 아무런 의미도 없는 말일지 모릅니다. (A Claim of “99 Percent Accurate” Can Be Both True and Meaningless)
여러분이 병원 진료실의 침대에 앉아 있는데 의사가 안 좋은 소식을 가져왔습니다. 검사 결과 어떤 암에 대한 양성반응이 나왔다고 합니다. “정말인가요, 의사 선생님?”하고 묻자 의사는 병원에서 사용한 특정 검사는 암이 있는 사람들이 검사를 받으면 암을 발견할 확률이 99%이고, 암이 없는 건강한 사람이 암으로 잘못 진단되는 확률은 1%라고 말합니다.
세상에! 여러분은 99%의 확률로 죽게 생겼습니다. 스카이다이빙을 하든 원숭이를 사든 죽기 전에 꼭 하고 싶었던 일을 해야겠어요.
99% 대 1%라는 숫자를 곧이곧대로 받아들이면 안 됩니다. 자초지종은 이렇습니다.
실제로 의사가 한 말이 모두 사실이라도 여러분이 암에 걸렸을 확률은 여전히 1/80에 불과합니다.
잠깐만요, 뭐라고요? 그게 도대체 무슨 소리죠? 여러분이 걸린 병은 심각한 “기저율의 오류”이기 때문입니다.
여러분이 암에 걸렸다면 그 검사가 99%의 확률로 양성 반응을 잡아낸다는 말은 사실입니다. 예를 들어, 암 환자 100명이 검사를 받으면 그중 단 한 명만이 암이 아니라는 결과가 나오는 것이죠. 문제는 그다음의 숫자입니다. 암에 걸리지 않은 사람이 암에 걸린 것으로 오진되는 확률 1% 말입니다. 그 검사는 암을 찾는 과정에서 수많은 건강한 사람들에게 암에 걸렸다는 진단을 내리기 때문에 양성반응이 거의 무의미해지는 것입니다. 암에 걸리지 않은 사람들에게 오직 1%의 확률로 양성반응을 보인다는데 어떻게 그럴 수가 있죠? 왜냐하면, 그 1%가 대단히 큰 숫자이기 때문입니다.
예를 들어, 췌장암에 걸린 사람들은 실제로 대략 8천 명 중 한 명꼴입니다. 하지만 그 검사가 1%의 확률로 양성 반응을 보인다면, 8천 명 중 80명이 양성 판정을 받았을 겁니다. 통계적으론 그중에 정말 췌장암에 걸린 사람은 단 한 명뿐일 텐데 말이죠. 결과적으로 누구에게든지 양성판정이 사실일 확률은 1/80인 셈입니다. 그러므로 더 정밀한 검사를 여러 차례 받아봐야 하는 거죠. 평소에 쌓인 게 많은 직장 상사에게 욕을 하거나 코카인 제조를 시작하기엔 아직 이릅니다.
이 문제가 왜 중요하냐고요?
수많은 첨단 기술이 이와 같은 인상적인 (99%!) 주장을 펼치겠지만, 이런 주장은 기저율을 고려하기 전까지만 인상적입니다. 예를 들면, 몇 년 전에 미국 교통안전관리청(Transportation Security Administration)에서 새로운 테러리스트 탐지기를 언급하기 시작했습니다. 정부는 이 탐지기가 99% 이상의 확률로 테러리스트를 감별해내고, 무고한 사람들에게 알카에다 딱지를 잘못 붙일 확률은 0.01%밖에 안 된다는 논리를 폈습니다.
시비를 따질 것도 없이 완벽한 숫자처럼 들리기도 하지만, 찬찬히 뜯어보면 앞서 암 진단의 경우와 마찬가지로 수많은 무고한 사람들을 테러리스트로 오인할 수 있다는 뜻이나 다름없습니다. 예를 들면, 2010년 한 해에 미국에서 비행기를 탄 승객은 연인원으로 약 7억 명이었습니다. 테러리스트 탐지기가 단지 0.01%의 확률로 오판하더라도, 7만 명이 테러 용의자로 지목돼 경찰에 끌려가 조사를 받게 된다는 뜻입니다. 그 사람 중 실제 테러리스트를 잡아낸 적은 지난 수년간 없습니다. 통계적으로 따져보면 확률이 0%인 셈입니다. ‘0.01%에 내가 포함될 리는 없겠지.’ 하고 대수롭지 않게 여기기에 십상입니다. 그랬다가 여러분이 실제로 공항에서 항문에 소형 폭탄을 장착한 유력 테러 용의자로 오인당하고 나면 그제야 0.01%가 그냥 넘길 숫자가 아니었다는 걸 절실히 깨닫게 될 겁니다. (Cracked)