트위터는 식중독 발생 확률이 높은 식당을 예측 할 수 있을까
질병 관리 및 방지 센터(the Centers for Disease Control and Prevention) 자료에 따르면 2011년 한 해 동안 미국시민 여섯 명 중 한명 꼴로 음식물 관련 질환을 경험한 것으로 나타났습니다. 로체스터 대학의 한 컴퓨터 과학 연구진은 이러한 높은 발병율이 트위터상의 정보를 이용한 식중독 발병 예측 시스템을 통해 충분히 방지가능할 것이라 믿고 있습니다.
엔이메시스(nEmesis)라 불리는 이 예측시스템은 트위터 상의 게시물 중 음식물 관련 질병에 관한 지리 데이터를 선별적으로 골라내어 식중독발병이 의심되는 식당을 실시간으로 예측합니다. 이를 테면, 음식과 질병을 동시에 언급한 트윗을 우선적으로 골라내고, 그 트윗을 남긴 트위터들의 게시물을 3일간 꾸준하게 주시하면서 식중독 발병의 진위여부를 확률적으로 계산하여 식당의 지리정보와 함께 공개하는 방식이죠.
이러한 예측 방식이 위험한 식당을 얼마나 효율적으로 발견할 수 있을까요? 지난 4개월 동안, 엔이메시스는 뉴욕시에 있는 9만 4천명의 트위터들로부터 3백80만개의 트윗자료를 골라내어, 식중독 발병 위험이 높은 순서 대로 480개의 식당목록을 예측했습니다. 이 순서목록을 같은 기간 뉴욕시 공중보건 당국에서 조사한 실제 식당 검열 결과와 비교해 보았더니, 삼분의 일 가량이 일치하는 것으로 확인되었습니다.
언뜻보기에 이 비교결과는 엔이메시스 시스템의 적중률을 나타내는 지표로 생각되는 것이 사실입니다. 하지만, 엔이메시스 연구진은 이 비교결과를 시스템의 적중률과 동일시 할 수는 없다는 입장을 밝혔습니다. 실시간으로 트위터상의 모든 정보를 분석하는 엔이메시스와는 달리, 뉴욕시의 식당 검열은 한정된 시간에만 간헐적으로 이루어지고 있어 검열과 검열사이에 실제로 일어난 식중독 발병 사례를 모두 기록하는 것이 실질적으로 불가능합니다. 따라서, 뉴욕시의 식당 검열 결과를 엔이메시스 예측 시스템의 비교기준으로 삼기에는 다소 무리가 있습니다.
오히려, 엔이메시스 측 관계자는 엔이메시스와 뉴욕시 공중보건 당국의 공조체제가 필요할 것이다고 말합니다. 365일 24시간 실시간으로 제공되는 엔이메시스 자료와 뉴욕시 공중보건당국의 검열결과가 합쳐진다면 시민들에게 더욱 정확하면서도 최신의 정보를 제공할 수 있을 것이기 때문입니다. (the Atlantic Cities)