아주 적은 수의 봇도 여론에 큰 변화를 줄 수 있습니다
2016년 미국 대통령 선거 전, 트위터에서 정치적 활동을 하는 소셜미디어 봇의 3분의 2는 도널드 트럼프를 지지했습니다. 하지만 트럼프를 지지하는 봇이 힐러리 클린턴을 지지하는 적은 수의 봇보다 사람들의 의견을 바꾸는데 더 효율적이지는 않았습니다. 제 최근 연구는 매우 활동적인 적은 수의 봇이 사람들의 정치적 의견을 바꿀 수 있다는 점을 보여줍니다. 중요한 요소는 얼마나 봇이 많았는지가 아니라 – 각 봇이 얼마나 많은 트윗을 올렸는지입니다.
저는 주로 군사나 국가 안보와 소셜미디어가 어떤 관련성이 있는지를 연구합니다. 자연적으로 다가올 2018년 중간 선거에 봇이 어떤 영향을 끼칠지에 대한 염려에 흥미를 느꼈죠. 저는 2016년에 봇이 어떤 역할을 했는지를 조사하기 시작했습니다. 이에 대한 다양한 많은 말들이 존재하지만, 한 가지 기본적인 사실은: 봇을 이용한 정보전이 성공했다면, 유권자의 의견이 변화했을 것이라는 점입니다.
저는 사람의 정치적 견해를 변화시키는데 봇이 얼마나 책임이 있는지 – 혹은 없는지를 – 살피고자 했습니다. 이를 위해 소셜 미디어 봇을 구분해내고 그들의 활동을 평가하는 방법을 찾아야만 했죠. 그 후 소셜미디어 사용자의 의견을 측정했습니다. 봇이 존재하지 않았다면 사람들의 의견이 어땟을지를 추정할 방법 역시 찾아야 했죠.
트위터 사용자와 봇 구분
연구의 규모를 줄이기 위해 저와 제 학생은 선거와 관련된 한 사건, 클린턴과 트럼프의 두 번째 토론에 대한 트위터 내 담론에 집중했습니다. 우리는 토론과 관련된 키워드와 해시태그를 포함하고 있는 트윗 230만 개를 모았습니다.
그 뒤 우리는 해당 트윗을 올린 78,000명의 트위터 사용자 리스트를 만들고, 사용자 간 팔로잉 네트워크를 구성했죠. 그 중 봇을 구분해내기 위해 봇의 경우 사람들의 트윗을 자주 리트윗하지만, 그들 자신의 트윗은 자주 리트윗되지 않는다는 관찰에 기반한 알고리즘을 사용했습니다.
이 방법은 396개의 –활동적인 트위터 사용자의 1% 미만인– 봇 계정들을 발견했습니다.
그중 단지 10%의 계정들만 서로 팔로우하고 있었습니다. 기분 좋은 사실이었죠: 서로 연결되어 있지 않은 적은 수의 봇들이 사람들의 의견에 큰 영향을 만들어내는 것이 가능하지 않다고 생각했기 때문입니다.
가까이서 관찰한 결과
그 뒤 우리는 사람들의 의견을 측정하기 시작했습니다. 본 연구는 뉴럴 네트워크라는 머신 러닝 알고리즘을 이용해 각 트윗의 콘텐츠를 평가하고, 각 트윗이 얼마나 클린턴이나 트럼프를 지지하는지의 정도를 결정했죠. 개인의 의견은 그들이 올린 각 트윗의 지지 정도의 평균으로 계산되었습니다.
(봇이 아닌) 트위터 사용자가 클린턴이나 트럼프를 얼마나 강하게 지지하는지를 나타내는 점수를 부여하는 과정에서 우리는 봇이 사람들의 의견을 얼마나 많이 변화시켰는지를 측정하는 데 어려움을 겪었습니다. 사람들의 의견이 봇이 존재하지 않았다면 어땠을지를 계산해내는 것이었죠.
다행히도, 1970년대로 거슬러 올라가 소셜네트워크 내 사람들이 어떻게 연결되어 있는지를 통해 감정을 측정해내는 모델을 발견했습니다. 이 네트워크 기반 모델에서 개인의 의견은 사람들이 어떻게 연결되어 있는지와 일치합니다. 해당 모델을 트위터에 맞게 약간 수정한 뒤, 우리는 이를 통해 사람들이 트위터에서 –트윗 콘텐츠 자체가 아닌 – 누구를 팔로우하고 있는지를 분석해 그들의 의견을 계산해냈습니다. 우리는 네트워크 모델을 통해 계산해낸 사람들의 의견이 그들이 올린 트윗의 콘텐츠에서 측정된 의견과 일치한다는 것을 발견했습니다.
봇이 없었다면?
위 결과는 트위터의 팔로워 네트워크 구조가 사람들의 의견을 정확하게 예측해낼 수 있다는 것을 보여줬습니다. 이제 이런 질문을 던져보죠: 만일 네트워크가 달랐다면, 사람들의 의견은 어땠을까요? 여기서 다른 네트워크는 봇이 없는 네트워크입니다. 마지막 단계로 우리는 사람들의 의견이 봇이 존재하지 않았다면 어땠을지를 보기 위해, 봇 계정을 네트워크에서 없앤 뒤 네트워크 모델을 다시 계산했습니다. 물론 봇은 인간 사용자의 의견을 변화시켰습니다 – 그 방식은 다소 놀라웠습니다.
대다수의 뉴스 보도가 말했듯 우리는 봇이 트럼프를 도왔을 것이로 예측했습니다 – 하지만 결과는 그렇지 않았습니다. 봇이 없는 네트워크에서 평균적인 (봇이 아닌) 사용자들이 클린턴에게 우호적인 정도는 100점 중 42점이었습니다. 봇이 있는 네트워크에서 사람들이 클린턴에게 우호적인 점수는 58점으로 증가했죠. 데이터에서 봇이 차지하는 비중이 매우 적고, 서로 연결되어 있지 않았다는 점을 고려했을 때 이 차이는 기대했던 것보다 컸습니다. 네트워크 구조 자체가 봇의 영향력을 증폭시켰죠.
우리는 클린턴 봇이 트럼프 봇보다 효과적인 이유가 무엇인지에 대해 의문을 가졌습니다. 자세히 관찰한 결과 트럼프를 지지하는 260개의 봇이 113,498개의 트윗을 올렸다는 사실을 발견했죠. 봇 당 437개의 트윗이 올라온 셈입니다. 하지만 클린턴에게 우호적인 150개의 봇은 96,298개, 봇 당 708개의 트윗을 올렸죠. 이는 클린턴 봇의 영향력이 숫자가 아닌, 얼마나 자주 트윗을 올렸는지에서 온다는 점을 보여줍니다. 봇이 올린 대부분의 트윗은 후보자들이나 다른 영향력 있는 사람들의 트윗을 리트윗한 게시물이었습니다. 봇은 스스로 트윗을 올리기보다는 기존에 존재하는 다른 사람의 트윗을 공유했죠.
물론 본 연구는 전체 유권자 인구와 비교했을 때 상대적으로 적은 수의 사용자를 분석했습니다. 또한, 상대적으로 짧은 기간 동안 캠페인 중 특정 사건을 대상으로 이루어졌죠. 그러므로 본 결과가 전체 선거 결과에 주는 시사점은 없습니다. 하지만 이는 봇이 사람들의 의견에 끼칠 수 있는 잠재적인 영향을 보여줍니다.
적은 수의 매우 활동적인 봇은 실제로 사람들의 의견을 상당히 변화시킬 수 있습니다. 소셜미디어 기업의 노력에도 불구하고 유권자에게 영향력을 행사하기 위해 계속해서 트윗을 올리고 많은 수의 봇이 여전히 존재합니다.
이건 소셜미디어에서 당신이 읽는 것, 당신이 믿는 것에 주의를 기울이라는 메시지입니다. 우리는 당신이 아는, 믿는 사람들을 팔로잉하는 것을 다시 한번 확인해볼 것을 권장합니다. 또한, 당신이 가장 좋아하는 해시태그에 누가 트윗을 올리고 있는지도 주의 깊게 살펴보세요.
(더컨버세이션, Tauhid Zaman)