“문학은 숫자가 아닙니다.”
2012년 소설가 스티븐 마치는 한 인터뷰에서 이렇게 말했습니다.
“셰익스피어는 말했습니다. ‘빛이 짙어지자 그 까마귀는 까막숲으로 날아갔다’. 까마귀와 까막의 차이는 뭘까요? 빛이 짙어졌다는 것은 무슨 뜻일까요? 우리는 단어의 느낌을 이해하지만, 이것을 숫자로 표현하는 것이 무슨 의미가 있을까요?”
그러나 오늘날 컴퓨터를 이용해 문학을 분석하는 것은 하나의 커다란 흐름이 되고 있습니다. 상당한 양의 문학작품들이 디지털화 되었고, 학자들은 여기에 손쉽게 접근할 수 있습니다. 한 단어의 사용빈도를 연도에 따라 보여주는 구글 N-그램은 인문학자들이 이 분야의 가치를 알아보게 해주는 첫번째 관문입니다.
” ‘검정(black)’ 은 1965년까지는 그냥 색깔의 한 종류였습니다. ‘빨강’과 비슷한 빈도로 사용되었고, ‘흰색’은 이들보다 두 배 정도 많이 사용되었습니다. 그러나 1965년에서 1970년 사이에 ‘검정’은 흑인을 뜻하는 새로운 단어가 되었고, 그 사용빈도는 갑자기 증가하여 ‘흰색’과 거의 비슷해졌습니다.”
그러나 구글 N-그램은 여러 의미를 가진 단어에 대해 그 단어가 어떤 뜻으로 쓰여졌는 지는 알 수 없다는 한계를 가지고 있습니다. 예를 들어 “본드(bond)”는 맥락에 따라 채권, 접착제, 포승줄 등으로 쓰입니다. 프린스턴의 데이비드 비엘은 “주제-분석(Topic-modelling)”이라는 방법을 도입해 이 문제를 해결했습니다. 주제-분석은 한 문헌에 사용되는 여러 단어들을 분석해 그 문헌의 주제를 파악하는 방법입니다. 스탠포드 대학의 프랭코 모레티는 이를 “원거리 독서(distant reading)”라고도 부릅니다.
주제-분석은 특정 주제에 해당하는 단어의 꾸러미를 가지고 있습니다. 예를 들어 ‘미국의 노예제도’ 꾸러미에는 ‘검둥이, 흑인, 농장, 감독관, 물라토’ 등의 단어들이 있으며 ‘기후 변화’ 꾸러미에는 ‘생물, 종, 전지구적, 기후, 이산화탄소, 물’ 등의 단어가 있습니다.
“예를 들어, 19세기 아일랜드 사람들이 미국의 노예들을 동정했다는 의견에 대해, 지금까지는 이에 관한 책 몇 권을 언급할 수 있었다면, 이제는 이와 관련된 책 250권을 알려줄 수 있습니다.”
“주제-분석은 새로운 사실을 알려주기도 합니다. 캘리포니아 어바인 대학의 샤론 블록은 ‘여성’ 과 ‘검둥이’가 19세기의 특정 잡지에서 빈번하게 언급되었다는 것을 발견했습니다. 그 잡지는 ‘펜실베니아 가제트’로서 200년 전의 월스트리트 저널이라고 볼 수 있습니다. 곧, 여성과 흑인은 사유재산으로 다루어졌습니다.”
디지털 인문학은 양 진영의 사람들을 모두 조금씩 불편하게 하는 면이 있습니다. 명확한 답을 찾는 훈련을 받아온 컴퓨터 과학자들은 인문학자들이 말하는 “수백년 동안 정확한 답이 없었던 문제”같은 개념을 불편해 합니다. 또 샤론 블록이 위의 논문을 인문학 저널에 제출했을 때 리뷰어들은 표와 그래프를 줄일것을 요구했습니다.
또 한가지 중요한 변화는, 오늘날 과학적 연구방법에서 필수적인 요소인 “반증가능성”이 인문학에도 도입될 수 있다는 것입니다. 네브라스카 대학의 매튜 조커스는 인문학에서 주장되는 가정들도 이제 검증을 거치게 될 것이라고 말하며, 자신의 책에서 이미 그 가능성을 보여주었습니다.
“나는 정치적, 종교적 주제를 많이 쓰는 작가들이 그렇지 않은 작가들에 비해 더 익명을 많이 사용할 것이라고 생각했습니다. 나는 이 가정하에서 통계적 방법을 이용해 이를 검증했고, 안타깝게도 이는 사실이 아닌 것으로 드러났습니다.”
UCLA 의 요한나 드러커는 디지털 인문학이 인문학의 일부로 자리잡을 것으로 생각합니다.
“인간은 비판적 독서에 능숙하며, 컴퓨터는 원거리 독서에 장점이 있습니다. 디지털 인문학은 기존 인문학의 관점을 확장해 줄 수 있습니다.”
그렇다면, 언젠가 컴퓨터도 셰익스피어의 “까막숲”을 이해하게 될까요? 문학의 의미는 단어에 존재하는 것일까요? 아니면 그 단어를 읽는 인간의 뇌 속에서 만들어지는 것일까요? 아이작 아시모프는 “아이 로봇(I Robot)”에서 다음과 같이 말한 바 있습니다.
“사람들은 ‘이건 네 얼굴의 코처럼 평평하구나’라고 말합니다. 그러나 자신의 코가 얼마나 평평한지는 다른 사람이 거울을 들어 보여주기 전까지는 알수 없지 않나요?”
(Nautilus)
뉴스페퍼민트는 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 글에 관한 해설을 쓰고…
* 비상 계엄령 선포와 내란에 이은 탄핵 정국으로 인해 한동안 쉬었던 스브스프리미엄에 쓴 해설 시차발행을…
우리나라 뉴스가 반헌법적인 계엄령을 선포해 내란죄 피의자가 된 윤석열 대통령을 탄핵하는 뉴스로 도배되는 사이 미국에서…
윤석열 대통령에 대한 탄핵 소추안 투표가 오늘 진행됩니다. 첫 번째 투표는 국민의힘 의원들이 집단으로 투표에…
윤석열 대통령의 계엄령 선포와 해제 이후 미국 언론도 한국에서 일어나는 정치적 사태에 큰 관심을 보이고…
트럼프 2기 행정부가 출범하면 미국과 중국의 관계가 어떻게 될지에 전 세계가 촉각을 곤두세우고 있습니다. 안보…
View Comments
하지만 결국 컴퓨터는 인격체가 아닌 단순한 도구로 남는 걸까요..
아이작 '아시모프'로 알고 있는데요ㅎㅎ
수정하였습니다. ㅎㅎ