건강 관련 연구들이 제대로 된 것인지 어떻게 구별하나요?
뉴스에서는 매일 새로운 건강 관련 연구들이 소개됩니다. 이 가운데 많은 연구는 우리가 무언가를 하면 – 커피를 많이 마신다든지, 어떤 약을 복용한다든지 – 건강이 더 좋아지거나 (혹은 나빠지거나) 수명에 영향을 미친다고 말합니다. 이런 뉴스를 접할 때마다 당신은 항상 이런 고민에 빠집니다. “이 뉴스를 믿어야 하나?” 이 질문에 대한 대답은 종종 “아니요”인 경우가 많지만, 제대로 진행된 연구와 그렇지 않은 연구를 구별하기란 좀처럼 쉬운 일이 아닙니다.
하지만 당신이 전문가가 아니더라도 연구 결과를 더 잘 구분하는 방법이 있습니다. 첫째, 만약 연구가 오직 동물을 대상으로 했거나 시험관에서만 이뤄진 것이라면, 우리는 그 효과가 인간에게 어떤 영향을 미칠지에 대해서 알기 어렵습니다. 둘째, 만약 임상시험을 기반으로 한 연구라면 스스로 이렇게 물어보세요. “연구자들이 어떤 방법론을 사용했지? 임상시험에 참여한 사람들과 내가 얼마나 비슷하지?”
물론 연구 결과에 대해서 우리가 물어야 할 많은 중요한 질문이 있습니다. 예를 들어 연구가 특정 식품이나 약품의 혜택뿐만 아니라 부작용도 살펴봤는지 등이 그 예가 되겠죠. 하지만 연구자들이 “인과 관계”라고 주장하는 근거를 찬찬히 살피고 임상에 참여한 사람들과 당신이 얼마나 비슷한지만 살펴봐도 연구 결과가 얼마나 믿을 만한 것인지 평가할 수 있습니다.
예를 통해서 이 방법을 적용해 봅시다. 어떤 약의 효능을 평가하는 이상적인 실험은 똑같은 사람이 두 명 있고 모든 조건을 같게 한 뒤에 한 사람은 약을 먹고 다른 한 사람은 약을 먹지 않았을 때 건강 상태를 비교하는 것입니다. 그러면 우리는 약을 복용하는 것이 건강에 어떤 영향을 미쳤는지 인과 관계를 정확히 알 수 있습니다. 물론 실제 세계에서 이렇게 하는 것은 불가능합니다. 모든 조건이 같은 두 사람은 없기 때문입니다. 그래서 널리 쓰이는 방법이 무작위 통제 실험입니다. 이 실험에서는 실험 참여자를 무작위로 실험군과 대조군으로 나눕니다. 사람이 충분히 많은 경우 무작위 통제 실험은 인과 관계에 대해서 말해줍니다.
무작위 통제 실험은 실험군과 대조군에 속한 사람들이 통계적으로 같다는 것을 보장하지만, 그 사람들이 당신과 여러 건강 상태가 같다는 뜻은 여전히 아닙니다. 만약 실험에 참여한 사람들의 나이, 소득, 주거 환경이 당신과 비슷하다면 실험 결과를 당신에게 적용하는 데 별 무리가 없을지도 모릅니다. 하지만 예를 들어 당신이 뉴욕시에 사는 65세 중산층인데, 실험 참가자는 중국 시골에 사는 가난한 30대였다면 그 실험 결과를 당신에게 바로 대입해선 안 될 것입니다.
이는 무작위 통제 실험이 가진 한계입니다. 무작위 통제 실험은 대체로 특정 조건을 만족하는 사람들만 실험에 참여시킵니다. 주로 실험으로부터 혜택을 볼 수 있는 사람들이죠. 신약의 효능을 입증하는 실험에 안전상의 이유로 노인이나 어린이는 포함되지 않습니다. 초기 임상시험은 여성을 포함하지 않은 경우도 많았죠.
임상시험이 아닌 다른 방식으로 연구를 진행할 경우는 이런 문제가 발생할 가능성이 작습니다. 실험 대신 연구자들은 메디케어나 메디케이드, 전역 군인 의료보험 혜택을 받는 사람들의 데이터나 대규모 설문 데이터를 분석해서 연구합니다. 비실험 연구는 기존에 있는 데이터를 사용하기 때문에 실험 연구보다 비용이 덜 들고 결과를 더 빨리 도출할 수 있습니다.
비실험 연구에 사용되는 데이터는 규모가 크기 때문에 당신과 비슷한 조건을 가진 사람이 포함되어 있을 가능성이 무작위 통제 실험보다는 높습니다. 따라서 당신은 연구 결과가 얼마나 타당한지, 인과 관계를 제대로 보여주는지를 물어야 합니다. 왜냐면 비실험 연구는 무작위 통제를 통한 실험이 아니어서 서로 다른 그룹 간에 비교하는 것이 훨씬 더 어렵습니다. 병원 치료를 받은 사람들은 원래 덜 건강한 사람들일 가능성이 크기 때문에 예를 들어 병원 치료를 받은 사람과 그렇지 않은 사람의 건강을 비교해서 병원 치료가 건강에 미치는 효과를 찾기란 어렵습니다. 따라서 이 경우 상관관계가 인과관계를 의미하지 않는다는 것을 명심해야 합니다.
궁극적으로, 어떠한 연구도 완벽하지 않습니다. 그것이 무작위 통제 실험이건 대규모 비실험 데이터를 기반으로 한 것이건 우리는 한 연구 결과가 완벽히 타당하거나 자신에게 완전히 적용된다고 믿어서는 안 됩니다. 가장 좋은 방법은 다양한 방법론과 서로 다른 실험군에 적용된 연구들이 비슷한 결과를 낼 때까지 기다리는 것이겠지요. (뉴욕타임스)