자동화 저널리즘이 보여주는 지식 경제의 미래
로봇이 제조 경제의 전체 흐름을 바꾼 것처럼 인공지능과 자동화 기술은 그동안 사람이 수행했던 인지 노동을 컴퓨터에 맡기며 정보 처리 작업에 변화를 가져오고 있습니다. 언론 분야를 예로 들자면, 데이터 마이닝 시스템은 기자들에게 잠재적인 기삿거리를 알려주고, 뉴스봇 역시 독자들이 정보를 탐색하는 새로운 방식을 제공합니다. 자동화 기사 작성 시스템이 금융, 스포츠, 선거 관련 기사를 작성하기도 하죠.
인공지능 기술이 다양한 산업으로 흘러들어오며 가장 흔하게 제기되는 질문은 인공지능이 일과 노동에 어떠한 영향을 주는지에 대한 것입니다. 인공지능이 향상하고 자동화한 세계에서는 누가 –무엇이– 언론의 역할을 어떻게 수행할까요?
제가 저술한 책 “뉴스의 자동화: 알고리듬이 다시 쓰는 미디어”에서 보여주듯이 인공지능 기술의 도입에도 불구하고 미래의 언론은 여전히 사람을 필요로 합니다. 하지만 사람들의 일, 역할, 작업은 진화하고 변하죠. 인공지능의 역량을 따라가고, 한계를 수용하기 위해 사람의 노동은 알고리듬과 혼합된 형태를 보일 것입니다.
대체가 아닌 증가.
현재 단계의 인공지능 기술은 오직 기자 업무의 15%와 편집장 업무 9%만을 대체할 수 있다는 분석 결과가 존재합니다. 사람은 복잡한 커뮤니케이션, 전문가적 사고, 적응성, 창의성 등 언론에 필수적인 몇 가지 분야에서 여전히 인공지능을 앞서고 있습니다. 보도, 청취, 응답, 반박, 출처와의 협상 과정에서 필요한 창의력을 인공지능은 가지고 있지 않습니다. 하지만 인공지능은 사람들의 업무 속도나 품질 향상을 돕거나 심층적인 뉴스 보도와 맞춤형 뉴스 제공 등의 새로운 기회를 만들어내기도 하죠.
언론사는 사진, 전화, 컴퓨터, 심지어 복사기 등의 새로운 기술에 언제나 적응해왔습니다. 기자들의 작업 역시 인공지능에 맞게 적응할 것입니다. 인공지능은 기자의 업무를 대체하기보다는 보완하며 이미 언론 보도에 변화를 가져오고 있습니다.
새로운 작업.
저는 인공지능 기술이 언론 분야에 새로운 종류의 일을 만들어내고 있다는 사실을 발견했습니다.
2017년, 수천 장에 달하는 뉴스 사진을 식별하기 위해 컴퓨터 비전 인공지능 기술을 도입한 AP통신의 예를 들어보죠. 해당 기술은 무엇이 또는 누가 사진에 나왔는지, 촬영 방식, 선정적 장면 포함 여부와 관련된 정보를 사진에 태그(tag)로 붙입니다.
이 시스템은 사진 담당 편집자에게 무엇을 보도해야 하는지를 생각할 더 많은 시간을 줍니다. 또한, 사진 식별에 소모되는 많은 시간을 줄여주죠. 하지만 해당 시스템 개발은 편집과 기술 모두에서 많은 양의 작업을 필요로 했습니다: 편집장은 어떤 태그를 달아야 하는지를 파악하며 알고리듬이 이 작업을 수행할 수 있는지를 확인했습니다. 또한, 알고리듬의 업무 수행을 평가할 새로운 테스트 데이터 세트를 만들어냈죠. 그 뒤, 각 사진에 제안된 태그를 수동으로 승인하며 정확성을 높이기 위해 시스템을 감독했습니다.
프로젝트 감독자인 AP의 스튜어트 마일스는 시스템 개발이 36 맨먼스 규모의 작업으로 몇 년 동안 이어지며, 12명 이상의 편집, 기술, 행정 관련 직원이 투입되었다고 말했습니다. 위 작업의 3분의 1은 자동화하기 어려운 기자의 전문성과 판단이 요구됐습니다. 그는 미래에 사람들이 시스템을 감독할 필요성은 줄어들 수 있지만, 시스템이 더 진화되고 확장될수록 사람들의 편집 작업은 여전히 중요할 것이라고 덧붙였습니다.
반자동화된 콘텐츠 생산.
영국의 RADAR 프로젝트는 달마다 8천 개의 지역 관련 뉴스 기사를 쏟아냅니다. 이 시스템은 지역으로 구분된 정부 데이터에서 흥미롭고 뉴스 보도의 가치가 있는 관점을 찾아내고 이를 데이터 기반 템플릿으로 만드는 6명의 기자의 작업에 의존하고 있죠. 시스템은 지역에 맞게 템플릿의 텍스트를 자동으로 바꿉니다. 예를 들어 영국 전반의 노령화 인구에 대한 기사는 루턴의 독자에게는 —브리스틀 지역과는 다른 통계를 보여주며— 어떻게 루턴의 노인 인구가 변하고 있는지에 관해 이야기하죠. 작성된 기사는 통신사를 통해 이를 보도하기를 원하는 지역 미디어로 보내집니다.
이 접근법은 기자의 업무와 자동화 기술을 효율적이고 생산적으로 결합합니다. 기자는 전문성과 커뮤니케이션 기술을 사용해 데이터가 적용될 수 있는 스토리라인을 구성합니다. 또한, 기자는 출처를 통해 국가 전반의 상황에 대한 정보를 얻고 템플릿을 작성합니다. 자동화 기술은 그 뒤 텍스트를 지역에 맞게 수정하며 제작 보조의 역할을 하죠.
RADAR 프로젝트 기자는 아리아 스튜디오라고 불리는 프로그램을 사용합니다. 이는 단지 복잡한 단어 처리 인터페이스입니다. 저자는 데이터에 기반해 If (조건)-Then (결과)-Else (다른 결과)의 규칙을 따르는 문구를 작성합니다. 예를 들면 지진 관련 보도에서 기자는 진도 8의 지진을 이야기할 때와 진도 3의 지진을 보도할 때 다른 형용사를 사용하고 싶을 수 있죠. 이에 따라 진도가 7보다 크다면 “강한 지진”으로, 진도 4보다 작은 지진은 “약한 지진”으로 표시하게끔 설정할 수 있습니다. 아리아와 같은 도구는 데이터에 따라 변해야 하는 문구를 쉽게 작업할 수 있도록 동사를 더 활용하거나 명사를 줄이는 등의 기능을 포함하고 있습니다.
아리아와 같은 인터페이스에서 기사를 작성하며 기자는 자신이 잘하는 것에 더욱 집중할 수 있죠: 기자는 논리적으로 주목할 수 있는 스토리라인을 만들고, 반복을 피하며, 창의적인 글을 쓰는데 시간을 더 할애할 수 있습니다. 하지만 위 과정은 글쓰기에 대한 새로운 방식의 사고 역시 요구하죠. 예를 들면 템플릿을 작성하는 기자는 이용 가능한 데이터가 무엇을 말할 수 있는지를 이해하며 글을 작성해야 합니다. 이 과정을 통해 기자는 어떻게 데이터가 다른 관점과 이야기를 만들어낼 수 있는지를 상상하고 변형을 가능하게 하는 논리를 만들어냅니다.
자동화된 콘텐츠 시스템에 대한 감시, 관리, “편집” 또한 더 중요해질 것입니다. 정확한 양질의 기사를 쓰는 것은 언론에 가장 중요한 관심사이죠.
RADAR는 세 단계의 품질 보증 과정을 거칩니다. 먼저, 기자들은 자동화 과정을 통해 작성된 모든 기사의 샘플을 읽습니다. 그 뒤, 다른 기자들은 본래 데이터 출처로 돌아가 기사의 주장을 다시 확인하죠. 세 번째 단계에서 편집장은 템플릿의 논리를 확인하고 기사에 생략이나 실수가 없는지를 살핍니다. 위 과정은 스크립트의 결함을 찾기 위해 소프트웨어 기술자들이 팀을 이뤄 일하는 방식과 비슷합니다. 이는 자동화 기술이 정확하게 업무를 수행했는지를 보장하기 위해 사람이 반드시 해야 하는 일입니다.
인적 자원 개발.
연합통신과 RADAR에서 실시되는 프로젝트와 비슷한 계획들은 인공지능과 자동화 기술이 언론 분야의 직업을 파괴하지 않을 것이라는 점을 보여줍니다. 오히려 위 기술은 기존 직업의 역할을 바꾸고, 새로운 일을 만들어내고 있습니다. 앞으로 기자들은 이러한 시스템을 설계, 보완, 수정, 확인, 감독, 유지하는 작업을 할 수 있도록 훈련되어야 합니다. 데이터를 작업하거나, 데이터에 맞춘 논리적인 사고를 할 수 있는 능력을 많은 기자가 필요로 할 것입니다. 기본적인 컴퓨터 프로그래밍에 능숙한 것 역시 도움이 되겠죠.
이러한 새로운 직업이 사람을 단순히 거대한 기계의 작업의 톱니로 만들지 않는다는 확신 역시 필요합니다. 사람과 기술이 혼합된 이러한 직업을 관리하고 설계하는 사람들은 자동화, 효율성, 유용성에 대한 다른 이들의 걱정을 고려해야만 합니다. 하지만 저는 여전히 이러한 경험이 기자들을 성장하게 하고, 사회는 인공지능과 자동화 기술이 가져다주는 속도, 보도 범위, 양질의 기사에서 오는 보상을 가질 수 있을 것이라는 낙관적인 생각을 하고 있습니다.
(더컨버세이션, Nicholas Diakopoulos)