집단 지성이 작동하는 최적의 규모
2014년 4월 28일  |  By:   |  과학  |  4 Comments

1785년, 콩도르세 후작이라고 불렸던 프랑스의 수학자 마리 장 앙투완 니콜라스 드 카리타(Marie Jean Antoine Nicolas de Caritat)는 민주주의를 통계학의 입장에서 지지하는 한 정리를 발표했습니다.

민주주의는 다수의 집단적 선택에 의지하는 의사결정 방식입니다. 그러나 시민들이 모든 분야에 대해 박식할 수는 없으며 따라서 이들의 선택에는 오류가 있을 수 있습니다. 콩도르세가 보인 것은 각 개인들은 실수를 저지르더라도 이들이 다수가 모였을 때에는 매우 좋은 결정을 내릴 수 있다는 사실입니다.

콩도르세의 정리는 단순합니다. 그의 정리에서 집단의 구성원들이 갖추어야 할 조건은 이들이 정답을 선택할 확률이 무작위로 고른 답이 정답일 확률보다 조금이라도 높아야 한다는 것 뿐입니다. 예를 들어, 선택지가 둘이 있는 문제에서 한 사람 한 사람이 정답을 선택할 확률이 50%만 넘는다면 충분한 다수가 모여 다수결로 내린 결정이 정답일 확률은 매우 높아지며 인원이 증가할수록 그 확률은 또한 올라가게 됩니다.

콩도르세의 정리는 오늘날 “집단지성”이라 불리는 분야의 근본적인 원리입니다. 이 정리를 뒷받침하는 많은 흥미로운 이야기들이 있습니다. 약 100년 전, 프랜시스 갈튼 경은 787명의 관객들에게 황소의 체중을 예측하도록 했습니다. 그들 중 정확한 값을 맞힌 사람은 한 명도 없었지만, 그들의 예측을 평균한 값은 황소의 체중과 거의 일치했습니다. 제임스 서로위키(James Surowiecki)의 “군중의 지혜(The Wisdom of the Crowds)”에는 “백만장자 퀴즈쇼(Who Wants to Be a Millionaire?)”의 예가 등장합니다. 이 퀴즈쇼에 참가한 이는 자신이 전문가라고 생각하는 한 명에게 답을 묻거나, 관객들 전체의 의견을 듣는 찬스를 사용할 수 있습니다. 지금까지 전문가가 정답을 맞힌 확률은 65%인 반면, 관객 가운데 다수의 지지를 받은 답이 정답인 확률은 91%에 달합니다.

과학자들 역시 콩도르세의 정리와 관련된 문제들을 연구해왔으며, 실제로 다수가 개인보다 나은 결정을 내리는 다양한 예들을 인간과 동물의 행동에서 발견해 왔습니다. 예를 들어, 한 마리 한 마리의 물고기에게 짙은 바다에서 포식자를 발견하고 제때 탈출하는 것은 쉬운 일이 아니지만, 다수의 물고기떼는 자신들의 불완전한 정보를 모아 쉽게 포식자들을 피할 수 있습니다. 최근의 한 연구는 꿀벌들이 자신들의 새 벌집을 지을 위치를 결정할 때 이런 집단지성을 이용한다는 것을 보이기도 했습니다.

그러나 지난 23일 “영국왕립학회보B(Journal Proceedings of the Royal Society B)”에는 집단 지성의 근본적인 상식에 도전하는 연구가 발표되었습니다. 기존의 상식은 곧 참여자의 수가 증가할수록 결론은 더욱 정확해진다는 것으로, 프린스턴의 연구팀은 이것이 항상 참인 것은 아니며, 오히려 적당한 수의 집단이 더 나은 결과를 줄 수 있을 때도 있다는 것을 보였습니다.

이들은 자신들의 모델에 다음 두 가지 조건을 추가했습니다. 첫 번째는, 콩도르세의 정리에 필수적인 가정인 모든 의견이 독립적이어야 한다는 가정이 현실에서는 참이 아닐 수 있다는 것입니다. 예를 들어, 대통령 선거에서 모든 이들이 각자 다른 언론을 통해 정보를 취득한다면, 이들 각자가 가진 정보는 비록 부정확할지라도 서로 독립적인 의견을 낼 수 있습니다. 그러나 이들이 하나의 언론만을 접한다면, 이들의 의견은 필연적으로 서로 높은 상관관계를 가지게 됩니다. 동물들에게서도 이와 같은 현상이 발견됩니다. 한 집단에서 서로 떨어져 있는 두 물고기는 서로 다른 시야와 정보를 가지고 있으며 이들이 주위에 전달하는 정보는 독립되어 있습니다. 그러나 바로 옆에 위치한 물고기들은 높은 상관관계를 가진 정보를 가지게 됩니다.

이들이 추가한 다른 조건은 바로 정보의 출처를 다양하게 만든 것입니다. 예를 들어 물고기의 경우 이들은 실제 상황에서 시각적 정보만이 아니라 청각 및 후각 정보 역시 사용합니다. 연구진은 각각의 출처에 서로 다른 신뢰도를 부여했으며 출처들 끼리 서로 다른 상관관계를 가지도록 만들었습니다. 그리고 동물들이 출처들의 신뢰도를 학습하도록 만들었습니다.

이들은 이런 조건에서도 역시 집단은 개인보다 더 정확한 결론을 낸다는 것을 확인했습니다. 단지 이들이 발견한 놀라운 사실은 위의 조건에서는 개체의 수가 5~20 정도의 소규모 집단이 더 큰 규모의 집단보다 더 나은 결과를 냈다는 사실입니다.

“큰 집단에서는 그 집단의 부분에서 서로 상관관계를 가진 잘못된 출처들에 의해 잘못된 결론이 유도될 수 있고, 이 결과가 전체 집단으로 퍼질 수 있습니다. 이런 현상은 집단이 더 커질수록 더 심각해졌습니다.”

“이 결과가 집단지성이 틀린 개념이라는 것은 아닙니다. 단지, 집단지성이 구현되는 환경에 따라 집단의 크기가 클수록 더 정확한 결론이 나온다는 원칙은 이제 상식이 아닐 수 있습니다.”

(National Geographic)

원문 보기

  • 익명

    콩도르셰 → 콩도르세

    • http://veritaholic.wordpress.com veritaholic

      감사합니다. 수정하였습니다. ^^

  • K

    사공이 많으면 배가 산으로 간다는 말이 여기에 적절하려나요ㅎㅎ

    • http://veritaholic.wordpress.com veritaholic

      네, 그렇게 볼 수도 있겠습니다. ㅎㅎ

      제가 논문을 직접 읽지 못했기 때문에 뭐라고 확실히 말씀드릴 수는 없습니다만, 콩도르세의 정리는 매우 최소한의 가정만으로 (참여자들 각각의 승률이 random selection 보다 높을수록, 참여자들간의 상관관계가 적을수록) 아름다운 결론 (n 이 커질수록 전체의 의견을 종합한 의견의 승률은 올라간다) 을 주는 명쾌한 수학적 진실이며, 따라서 제 생각에는 연구진이 아마 어떤 특수한 상황(상관관계 구조)에서 n 이 커질 때 오히려 종합적 의견의 승률이 떨어질 수 있다는, 다르게 말하면 승률이 최대가 되는 n 이 존재할 수 있는 예외적 상황을 발견한 것으로 생각됩니다.

      물론, 예외적 상황들을 누적시키는 것이 곧 학문의 발전이므로 이 연구에도 충분한 가치가 있을 것이구요. 이상적으로는 n_max=f(correlation set) 의 analytic 한 형태를 구할 수 있다면 좋겠지만, 그런 종류의 문제는 아닐 듯 합니다. 그 전에, 어떤 종류의 상황들에서 이런 예외가 발생하는 지, 그리고 max_n 은 어떤 변수의 영향을 받는지 등을 앞으로 연구할 수 있다고 보이는 군요.