[책] 주디아 펄의 “인과에 대하여(The book of Why)”
주디아 펄과 다나 매킨지의 “인과에 대하여(The book of Why)”는 펄의 기념비적인 전작 “인과율(Causality)”을 보통의 독자들이 읽을 수 있도록 만든 책입니다.
이 책은 그 목적을 어느 정도 달성하고 있습니다. 책의 대부분은 쉽게 읽히며, 오직 일부분에서만 전문적인 수학이 사용됩니다.
과학의 역사
이 책의 상당 부분은 통계학자와 과학자들이 인과관계를 적절한 과학적 주제로 다루기 거부한 시기(20세기의 대부분)를 다루고 있습니다. 그들은 상관관계를 주로 관찰했고, “상관관계는 인과관계가 아니다”라는 원칙만을 주술처럼 반복했습니다.
과학자들은 꾸준히 자신의 연구에서 인과관계를 유추할 수 있는 방법을 찾아왔지만, 통계학자들은 정확한 원인을 밝히려는 대부분의 시도를 인정하지 않았습니다.
단 한가지 예외가 바로 무작위 대조 연구(randomized controlled trials, RCT)입니다. 통계학자들은 잘 설계된 RCT에서는 상관관계가 인과관계를 의미할 수 있음을 알아냈습니다. 때문에 20세기 내내 RCT는 점점 더 중요한 연구방법이 되었습니다.
문제는 RCT를 통해 과학자들이 인과관계를 밝힐 수 있게 될수록, 다른 방법의 연구에서는 인과관계가 존재하지 않는 것처럼 말하게 된 것입니다. 물론 플로지스톤처럼 비현실적으로 존재하지 않게 되었다는 것은 아닙니다. 그보다는 행동주의자들이 내적 경험이나 의식을 금기시한 것처럼, 그리고 언어학자들이 언어의 기원에 대해 말하지 않게 된 것처럼 과학자들은 인과관계에 대해 말하는 것을 두려워하게 되었습니다. 어쩌면 마치 천국과 지옥처럼, 개념적으로는 유용하지만 과학이 이를 다루기에는 부적절 하다는 느낌을 주는, 그런 개념으로 인과관계는 존재하게 되었습니다.
하지만 과학자들은 세상을 예측하는 것을 넘어 세상에 영향을 미치고 싶어 했습니다. 때문에 그들은 때로 RCT 실험 결과가 미처 나오지 전에도 상관관계가 인과관계를 어느 정도는 의미할 수 있다는 듯 말하기도 했습니다.
흡연이 가장 좋은 예입니다. 과학자들은 흡연이 암을 일으킨다는 수많은 단서를 발견했지만 RCT 실험이 없이는 흡연과 암이 관계가 있다는 말 이상을 할 수 없었습니다.
과학자들은 이때문에 브래드포드 힐 기준(Bradford Hill Criteria)과 같은 인과관계를 말할 수 있는 정교한 기준을 만들었습니다. 하지만, 이 기준이 완벽하게 만족되는 상황에서도 사람들에게 인과관계를 설득하기는 어려웠습니다. 이런 과학자들의 인과관계에 대한 불편함은 흡연과 암에 대한 공식적인 인과관계 선언을 상당 기간 늦추었습니다.
이런 사건들은 펄로 하여금 어떻게하면 원인을 명확하게 밝힐 수 있는지, 그리고 그러한 주장의 근거와 이에 반하는 근거들을 어떻게 다루어야 하는지를 연구하게 만들었습니다.
무엇이 문제였나?
이 책은 왜 20세기 동안 과학자들이 인과관계를 금기시하게 되었는지에 대한 몇 가지 단서를 보여줍니다.
그 중 하나는 빈도주의(frequentism)를 지지했던 통계학자 R.A. 피셔입니다. 피셔는 불확실성을 정량화하는데 뛰어난 능력을 가진 열정적인 학자였습니다. 하지만 그는 인과관계를 정량화하거나 이를 언어로 표현하는 능력은 그리 뛰어나지 못했습니다. 펄은 피셔의 이런 특징이 그로 하여금 인과관계를 추론하는 것을 반대하게 만들었음을 암시합니다.
“… 경로분석은 다른 인과관계 추론처럼 과학적 사고를 필요로 한다. 그러나 통계학자들은 과학적 사고 대신 정형화된 방법을 권장했다.”
하지만 몇몇 대표적인 학자에게 원인을 돌리는 것은 빙산의 일각만을 이야기하는 것입니다. 왜 과학자들은 집단적으로 피셔의 가르침을 따랐던 것일까요?
어쩌면 그 이유는 제임스 C 스콧이 하이 모더니즘(역자주: 과학과 기술에 대한 확신을 강조하는 사조)에 대해 설명하면서 말한 것처럼 사람들이 ’이해하기 쉬운 지식’을 원했기 때문일 수 있습니다.
20세기에 걸쳐 대부분의 과학 분야에서 빈도주의가 베이지안(Bayesian)보다 우선시 되었던 것도 같은 맥락에서 설명가능합니다. 사전확률이 필요한 (보통 엄밀한 측정이 불가능한 원인을 가진) 문제는 사람들에게 쉽게 이해시키기 어려웠습니다.
인과관계에 대한 추측을 금기시 한 시기는 소비에트 식의 계획 경제와 계획 도시, 그리고 테일러식의 공장 관리가 유행한 시기와 일치합니다.
또한, 측정하기 어려운 내적 원인의 중요성을 간과했던 행동주의가 인기를 끌었던 시기와도 어느 정도 겹칩니다.
이런 패턴은 모두 인류의 발전을 단순한 모델로 만든 뒤 이를 외삽, 지속하는 방식으로 인류가 끝없이 발전할 수 있을 것이라는 과도한 확신과 연관되어 있습니다. 나는 이런 흐름이 모두 20세기 중반에 정점을 찍었다는 사실이 우연이라 생각하지 않습니다.
나는 젊은 시절, “상관관계는 인과관계를 의미하지 않는다”는 주문과 함께 하이 모더니즘의 여러 원칙들을 따랐던 기억이 있습니다. 하지만 지금와 생각해보면, 내가 그 원칙들을 따른 이유로 이를 강조하던 이들에 대한 존중 외에 다른 이유는 떠오르지 않습니다.
인과관계의 추론이 중요한 이유
이 책에는 통계적 추론과 인과적 추론의 차이를 보여주는 가상의 어떤 약에 대한 비-무작위(non-RCT) 연구의 예가 있습니다. 세 가지 변수를 다룬 아래 두 연구를 가정해 봅시다.
연구 1: 약 <- 성별 -> 심장마비
연구 2: 약 -> 혈압 -> 심장마비
위 두 연구에서 중간에 위치한 변수, 곧 성별과 혈압을 우리는 어떻게 다루어야 할까요? 위 두 연구의 데이터가 동일하다고 가정해봅시다. 통계 프로그램은 모두 상관관계를 발견할 것이고, 위에 표시한 화살표의 관계를 알지 못한다면, 같은 통계 기법을 적용할 수밖에 없을 것입니다. 만약 우리가 성별이나 혈압을 통제했을 때 약의 효과가 정반대로 나오도록 데이터가 주어졌다고 해봅시다. 기존의 통계적 방법은 이 데이터를 어떻게 처리해야하는지 말해주지 않습니다. 하지만 약간의 과학적 지식을 더함으로써 우리는 성별이 교란인자라는 사실을 알 수 있으며, 따라서 성별을 통제해야하고 이를 통해 누가 그 약을 먹어야하는지를 말해줄 수 있습니다. 또한, 혈압은 매개변수이며 이 약이 어떻게 작용하는지를 말해주는 변수로, 통제되어서는 안되는 변수라는 사실을 알려줍니다.
물론 사람들은 약이 그 사람의 혈압을 바꿀 것이라는 가설과 약이 그 사람의 성별을 바꿀 지 모른다는 가설의 차이를 잘 알고 있습니다. 우리는 어떤 약이 한 사람의 성별을 쉽게 바꾸지 못한다는 사실을, 곧 이 세상에 대한 정교한 모델을 이미 가지고 있습니다. (혹은, 만약 그런 놀라운 약이 있다면 자신이 이미 들어보았을 것이라는 사실을 알고 있다고도 말할 수 있습니다.)
하지만 오늘날의 정형화된 통계 기법은 이러한 차이를 구분할 수 있게 만들어져 있지 않으며, 이런 상식을 적용할 수 있도록 이를 바꾸기도 쉽지 않아 보입니다.
지속되는 문제
펄은 과학자들이 너무 많은 변수를 통제한다고 불평합니다. 위의 예는 적절한 인과 모델을 알지 못할때 변수를 통제하는 것이 어떻게 문제가 될 수 있는지를 보여줍니다. 나 역시 과거 더 많은 변수를 통제할수록 더 좋은 연구로 인정받는 것에 대해 어느 정도 의문을 가졌었지만, 펄은 보다 분명하게 잘못된 변수 통제와 합리적인 변수 통제를 구분해야 한다는 사실을 말해줍니다.
과학에서 교란인자를 펄이 이야기한 이상적인 모델을 통해 통제하기 위해서는 아직 많은 연구가 필요한 것으로 보입니다.
RCT를 다른 인과 추론 방법보다 우월한 것으로 보는 하이 모더니즘의 영향 또한 남아 있습니다.
충분히 잘 설계된 RCT는 적어도 겉으로는 모든 중요한 요소들이 잘 정량화된 것처럼 보이게 할 수 있습니다. 표본 오차 또한 정확하게 정량화할 수 있습니다. 연구자는 이를 이용해 체계적 편향을 눈에 보이지 않게 만든 뒤, 가설을 설정하는 것은 과학의 영역이 아니라 말하거나 심지어 가설은 중요하지 않다고 말할 수도 있습니다.
또한, 논문의 동료 심사 과정은 p 밸류와 같이 쉽게 정량화할 수 있는 양과 쉽게 확인가능한 과학적 절차를 강력하게 요구합니다. RCT 가 이루어지지 않은 연구에서는 연구자들이 인과관계를 암시하기 위해 위험요인(risk factor)과 상관관계에만 집중하고 있습니다.
AI
펄은 인공지능이 인간 수준의 지능을 가지기 위해서는 인과관계를 추론할 수 있어야 된다고 말합니다. 이 주장은 얼핏 논쟁의 여지가 없어 보이지만, 나는 확실하게 동의하기는 어렵습니다.
펄은 인공지능의 인과관계 추론 능력 부족이 “가장 큰 장애물”이 될 것이라 말하지만, 내 생각은 다릅니다. 나는 AI 가 적어도 까마귀 수준의 이 세상에 대한 모델을 가지게 되어야 비로소 일반적인 인과추론 능력이 의미를 가질 것이라 생각하며, 또 그 정도 수준에 이르렀을때에는 AI 가 인과추론능력을 쉽게 가지게 할 수 있을 것이라 생각합니다.
AI 분야에서 종종 인과관계를 포함한, 모델과 무관하게 적용가능한 데이터 마이닝 기술이 연구되는 것은 사실입니다. 어쩌면 하이 모더니즘적 태도는 과거 AI 연구에 부정적 영향을 미쳤고, 지금도 여전히 방해가 되고 있을 수 있습니다. 펄은 이 부분을 특히 강조합니다.
펄이 이야기하는 AI 가 해결하지 못하는 문제들 (예를 들어, “지구형 행성을 가질 수 있는 태양계의 조건은?”과 같은 문제)은 그저 인과적 추론 능력 외에도 다양한 종류의 데이터에서 추출한 지식을 통합하는 능력을 필요로 합니다. 이는 오늘날 AI 연구자들이 생각하는 것보다 더 광범위한 개념을 AI 가 학습할 수 있어야 함을 의미합니다.
나는 몇십년 안에 그런 다양한 개념을 다룰 수 있는 능력이 기계학습 연구의 주류가 되리라 생각합니다. 그리고 그런 기술이 나오기 전까지는, AI 의 인과추론 능력은 그저 연습문제의 수준에 그칠 것이라 생각합니다.
결론
펄은 인과관계를 명확하게 이해하고 정량화하는데 매우 뛰어난 능력을 가졌습니다. 새로운 인과 문제를 설명하는 데에도 훌륭한 솜씨를 보여줍니다. 하지만 인과 문제가 아닌 다른 영역에 대한 의견들에는 조금 의문이 있습니다.
(Less Wrong, Peter McCluskey)