Categories: 과학

컴퓨터가 저자의 성별을 맞출 수 있을까요?

Q: 컴퓨터가 저자의 성별을 맞출 수 있을까요?

A: 현대에 쓰인 작품의 경우, 사용된 표현을 분석해 저자의 성별을 80%까지 맞출 수 있었다고 보고된 프로그램이 있습니다.

2002년 <문학 및 언어전산학(Journal Literary and Linguistic Computing)>에 발표된 연구에서 이들은 윈노우(Winnow)라는 프로그램으로 영국 영어로 출판된 566건의 문서를 분석했습니다.

이들은 먼저 글의 저자가 남자인지 여자인지 구별하도록 프로그램을 “훈련”시켰습니다. 그 후 다수의 문서에 들어있는, 내용과 무관한 여러 표현 및 특징들의 상대적 빈도를 분석했습니다.

이들은 명사와 대명사의 사용 빈도 같은 특징과 “그리고(and)”, “그(the)”와 같이, 그 자체로는 뜻을 가지지 않지만, 문장 안에서 문법적인 관계를 지시하는 기능어의 사용 정도를 분석했으며 “식탁 위에(above the table)”와 같은 두 단어나 세 단어로 이루어진 구의 사용 패턴 역시 분석했습니다.

이들이 분석한 글 중에는 소설과 비소설이 섞여 있었으며, 같은 기법으로 소설과 비소설의 구분은 98%의 정확도로 가능했다고 연구진들은 말했습니다.

이들은 남성 작가는 소설에서 “어떤(a)”, “그(the)”, “만큼(as)” 등을 더 많이 사용하는 반면, 여성 작가는 “그녀(she)”, “위해(for)”, “함께(with)”, “아니(not)” 등을 더 많이 사용했다고 밝혔습니다. 비소설의 경우 남성은 “라는(that)”과 “하나(one)”를 더 많이 사용했고 여성은 “위해(for)”, “함께(with)”, “아니(not)”, “안(in)”을 더 많이 사용했습니다.

이들은 왜 저자의 성에 따라 이런 차이가 발생하는지, 그리고 다른 문화권과 언어에서도 이런 차이가 있을지는 더 연구해 보아야 할 문제라고 말했습니다. 물론 이 프로그램은 완벽과는 거리가 멀었습니다. A.S. 바이앳의 소설 “포제션(Possission)”을 이 프로그램은 남자가 쓴 글이라고 판단했습니다. 하지만 바이앳은 여성이지요.

(뉴욕타임스)

원문 보기

veritaholic

Recent Posts

[뉴페@스프] 바이러스에는 국경이 없는데…끝나지 않은 팬데믹의 경고

뉴스페퍼민트가 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 함께 쓴 해설을 스프와…

4 일 ago

[뉴페@스프] 격노한 트럼프 ‘금요일 밤의 학살’… “자비 없는 복수”의 전말

뉴스페퍼민트가 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 함께 쓴 해설을 스프와…

6 일 ago

[뉴페@스프] “이렇게 뒤집을 줄은…” 전쟁 단박에 끝내겠다던 트럼프의 선택지가 이것?

뉴스페퍼민트가 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 함께 쓴 해설을 스프와…

2 주 ago

[뉴페@스프] “답장 없으면 사직 간주” 백악관 명의 메일… 수백만 명에 겨눈 칼끝, 결말은?

뉴스페퍼민트가 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 함께 쓴 해설을 스프와…

2 주 ago

[뉴페@스프] “전쟁 반대” 외치지만… 반대해야 할 가장 큰 이유를 놓치지 않았나요?

뉴스페퍼민트가 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 함께 쓴 해설을 스프와…

3 주 ago

[뉴페@스프] “선 넘는 대통령, 저항은 미미”… 트럼프 ‘독재 야망’ 꺾으려면

뉴스페퍼민트가 SBS의 콘텐츠 플랫폼 스브스프리미엄(스프)에 뉴욕타임스 칼럼을 한 편씩 선정해 번역하고, 함께 쓴 해설을 스프와…

3 주 ago