구글 스칼러 논쟁
2014년 1월 9일  |  By:   |  IT, 과학  |  No Comment

지난 몇 년간 학계에서 논문을 찾는 방법은 크게 바뀌었습니다. 많은 학자들이 펍메드(PubMed)등을 떠나 구글 스칼러(Google Scholar)를 사용하기 시작했습니다.

구글 스칼러는 구글이 운영하는 무료 논문검색 서비스입니다. 구글은 저자의 논문과 키워드만을 찾아주는 것이 아니라 자신의 논문이 인용된 논문들, 책, 학회 발표자료까지도 찾아 줍니다. 또한 구글 스칼러는, 마치 학계의 넷플릭스(Netflix)처럼, 저자가 흥미있어 할 논문들을 골라 매주 이메일로 보내주기도 합니다.

스페인의 계량서지학(bibliometric) 연구원인 니콜라스 로빈슨-가르시아는 무료 서비스인 구글 스칼러가 상업적 서비스인 톰슨 로이터의 사이언스 웹(Web of Science)이나 엘세비어의 스코푸스(Scopus) 못지 않은 자료를 제공하고 있으며 사회과학이나 인문학 분야에서는 더 나은 결과를 준다고 말합니다.

구글 스칼러의 용도는 자료 검색에 그치지 않습니다. 구글은 논문의 영향력을 평가할 수 있는, 자체적으로 개발한 인용지수(citation metrics)를 제공하고 있습니다. 그러나 이 인용지수는 피어리뷰를 통과한 논문들만이 아닌 인터넷에서의 인용 역시 포함되기 때문에 쉽게 조작될 수 있습니다.

지난 해 11월, 로빈슨-가르시아와 그의 연구팀은 이를 직접 시험해보기로 했습니다. 그들은 자신들의 논문을 인용한 6편의 가짜 논문을 만들어 인터넷에 올렸습니다. 몇 주 뒤 구글 스칼러는 이 논문들을 데이터에 포함시켰고, 이들의 인용지수는 급격히 올랐습니다. 이들의 실험은 지난 해 11월 “미국 정보과학 및 기술학회(Journal of the American Society for Information Science and Technology)”지에 발표되었습니다.

로빈슨-가르시아는 구글이 그들의 인용지수 공식을 공개해야 한다고 말합니다.

“만약 인용지수가 산출된 방식이 보여진다면, 사람들은 누군가의 인용지수가 조작된 것인지를 쉽게 파악할 수 있을겁니다. 지금의 상태로는, 구글 스칼러를 이용해 실제 인용도를 알아내는 것은 불가능합니다.”

그러나 구글 스칼러의 개발을 이끌었던 아누락 아카리아는 이들이 말하는 ‘거짓논문’은 일종의 스팸메일과 같다고 말합니다.

“실제 학계에 거짓논문의 비율은 매우 낮습니다. 거짓논문으로 자신의 인용지수를 높히는 시도는 자신의 명성을 모두 걸어야 하는 매우 큰 모험입니다. 이런 사회적 규범이 잘 작동하지 않게 된다 하더라도 우리는 스팸메일의 기준을 높이는 것과 같은 방식으로 쉽게 거짓논문을 걸러낼 수 있습니다.”

그러나 그는 자신들의 인용지수 공식에는 구글의 핵심 검색기술이 포함되어 있으며, 따라서 이를 공개할 계획은 없다고 밝혔습니다.

한편, 구글의 일인독주체제는 다시 깨어질 전망입니다. 마이크로소프트의 마이크로소프트 학계 검색(Microsoft Academic Search)은 빠르게 성장하고 있으며, 톰슨 로이터와 엘세비어 역시 자신들의 이득을 지키기 위해 노력하고 있습니다. 대부분의 대학들은 비밀엄수규정에 의해 이를 드러내고 있지 않지만, 코넬대의 경우 톰슨로이터사에 매년 약 1억 7천만원을 내고 있다고 밝혔습니다.

한편, 구글 스칼러의 경우 뚜렷한 수익을 내지 못하고 있으며, 팀이 축소될 지 모른다는 루머에 시달리고 있습니다. 그러나 아카리아는 구글 스칼러의 사용자는 전세계적으로 증가하고 있으며, 구글 스칼러 팀 역시 인원을 늘이고 있다고 반박했습니다. (Science)

원문 보기