DOI QR코드

DOI QR Code

A Research on Developing a Card News System based on News Generation Algorithm

알고리즘 기반의 개인화된 카드뉴스 생성 시스템 연구

  • Kim, Dongwhan (Design Intelligence, Graduate School of Communication and Arts, Yonsei University) ;
  • Lee, Sanghyuk (hci+d lab., Department of Communication, Seoul National University) ;
  • Oh, Jonghwan (hci+d lab., Department of Communication, Seoul National University) ;
  • Kim, Junsuk (hci+d lab., Department of Communication, Seoul National University) ;
  • Park, Sungmin (hci+d lab., Department of Communication, Seoul National University) ;
  • Choi, Woobin (hci+d lab., Department of Communication, Seoul National University) ;
  • Lee, Joonhwan (hci+d lab., Department of Communication, Seoul National University)
  • Received : 2020.01.08
  • Accepted : 2020.02.11
  • Published : 2020.02.29

Abstract

Algorithm journalism refers to the practices of automated news generation using algorithms that generate human sounding narratives. Algorithm journalism is known to have strengths in automating repetitive tasks through rapid and accurate analysis of data, and has been actively used in news domains such as sports and finance. In this paper, we propose an interactive card news system that generates personalized local election articles in 2018. The system consists of modules that collects and analyzes election data, generates texts and images, and allows users to specify their interests in the local elections. When a user selects interested regions, election types, candidate names, and political parties, the system generates card news according to their interest. In the study, we examined how personalized card news are evaluated in comparison with text and card news articles by human journalists, and derived implications on the potential use of algorithm in reporting political events.

Keywords

1. 서론

데이터를 기반으로 읽기에 자연스러운 글을 생성하는 자연어 생성 알고리즘(natural language generation algorithm)의 발전과 함께 다양한 미디어 영역에서 알고리즘을 활용한 콘텐츠 생성이 이루어지고 있다[1,2]. 특히, 알고리즘이 인간이 작성한 글과 구분할 수 없을 정도로 양질의 문장을 생성할 수 있게 되며[3-6], 텍스트를 자동으로 생성하는 알고리즘 기술이 저널리즘 산업에 경쟁적으로 도입되기 시작했다.

2014년 최초로 사람의 손을 거치지 않고 미국 로스앤젤레스시 근교에서 벌어진 지진 소식을 담은 기사를 발행한 LA 타임스를 시작으로 AP통신, 블룸버그(Bloomberg), 포브스(Forbes), 프로퍼블리카(ProPublica), 워싱턴 포스트(the Washington Post) 등 수많은 언론사가 자체적인 기술 개발 혹은 기술 스타트업 회사와의 협업을 통해 기사 생산을 자동화하고 있다[7]. 온라인에서 생성되는 데이터가 폭발적으로 증가하는 추세에 따라 많아진 데이터를 사람의 손을 거치지 않고 자동으로 모으고 저장하고 분류하는 등 알고리즘은 그 역할을 점차 넓혀가고 있다[5,8-13].

이와 같이 텍스트 기반의 뉴스 기사를 생성하고 발행하는 알고리즘을 개발하고 이에 따른 효과를 측정하는 연구를 알고리즘 저널리즘, 혹은 로봇 저널리즘 연구라 부른다[3,14]. 알고리즘 저널리즘 기술은 미리 정해진 규칙에 따라 데이터를 분석해 상황에 적합한 문장을 만드는 방식으로 동작하는 특성으로 인해, 구조적인 형태를 갖추고 규칙적으로 발생하는 데이터를 다루는 분야를 우선으로 적용됐다. 특히, 빠르고 정확하게 데이터를 분석하고 반복적으로 발생하는 사건을 다루는데 효율적으로 동작하며 프로야구, 프로축구와 같은 스포츠 분야와 증시 시황, 기업 실적보고와 같은 경제 분야의 기사를 생성하는데 주로 사용되고 있다. 하지만, 상황과 맥락에 적합한 이야깃거리를 찾아내어 공정하고 객관적으로 사실을 전달하는 정치, 사회 분야와 같은 뉴스 영역에는 아직 알고리즘을 활용한 기사 생성이 활성화되지 못하고 있다.

이에 본 연구에서는 기존에 스포츠와 경제 기사에 머물러 있던 알고리즘 저널리즘 기술을 확장해 실시간으로 선거 데이터를 분석해 카드 뉴스를 생성하는 인터랙티브 뉴스 플랫폼을 개발했다. 연구진이 개발한 카드뉴스봇은 제7회 전국동시지방선거에서 치러진 다양한 유형의 선거를 대상으로 사용자가 관심 지역과 후보, 정당 등을 직접 선택하면 시스템이 이를 조합해 자동으로 관련 뉴스를 요약한 카드를 생성해 제공하는 방식으로 만들어졌다. 본 연구에서는 카드뉴스봇 시스템의 개발을 위해 사용자가 조작할 수 있는 개인화 변인의 유형과 사용자 관점에서의 뉴스가치 평가에 관한 기존 문헌을 검토한 후 실험을 통해 정치 뉴스를 다루는 알고리즘 저널리즘 시스템의 의의와 이 시스템을 통해 생성된 카드 뉴스가 갖는 뉴스 가치를 살펴보고자 한다.

2. 이론적 논의

2.1 알고리즘 저널리즘 연구

알고리즘이 자동으로 읽기에 자연스러운 글을 생성한 첫 번째 연구 사례로 알려진 스탯츠몽키(Stats Monkey) 프로젝트와 국내 프로야구 기사를 생성한 프로야구 뉴스로봇1)은 경기에서 발생된 다양한 기록들을 통계적으로 분석해 뉴스가 될만한 사건을 자동으로 찾을 수 있도록 만들어졌다[15]. 또한, 알고리즘을 활용해 뉴스 보도가 이루어지는 모든 과정을 자동화한 최초의 사례로 알려진 LA타임스의 퀘이크 봇(Quakebot)과 호미사이드 리포트(The Homicide Report)는 각각 미국 지질 조사국과 로스앤젤레스 카운티 검시관이 발행한 리포트를 분석해 미리 설정된 규칙과 조건에 따라 문장을 생성하는 방식으로 만들어졌다[16]. 이후 AP통신이 발행한 애플의 실적보고 기사, 2016 리오 올림픽 소식을 실시간으로 작성한 워싱턴 포스트의 헬리오그래프(Heliograph), 2018년부터 프로야구 퓨처스리그 경기 결과를 뉴스로 알리는 케이봇(KBOT)에 이르기까지 알고리즘을 활용한 뉴스 보도는 점차 늘어나는 추세다.

알고리즘은 대량의 데이터를 처리하는 과정에서도 선택적으로 데이터를 분석할 수 있어 개개인의 관심과 성향에 맞는 문장을 생성하는 개인화된 뉴스를 제공하는 방향으로 활용될 가능성을 지니고 있다[6,17-19]. 미국의 탐사보도 언론인 프로퍼블리카는‘Opportunity Gap’이라는 프로젝트를 통해 미국의 52,000여개의 고등학교를 대상으로 어떤 학교가 저소득 학생에게 대학과정에서 필요한 과목을 제공하지 않고 있는지를 보도했다. 이 과정에서 프로퍼블리카는 독자들이 자신이 관심을 가진 고등학교를 검색 하는 기능을 지원했고, 알고리즘을 활용해 선택된 고등학교가 주변 고등학교와 비교해 어떤 상황에 있는 지를 비교하는 문장을 자동으로 생성했다. 5만 개가 넘는 고등학교에 대한 설명 및 주변 학교와의 비교는 인간의 손으로 하기엔 버거운 작업이지만, 프로퍼블리카는 알고리즘을 통해 기사를 읽는 개인에게 맞춤형 기사를 만들어 제공하며 개인화된 뉴스 보도의 새로운 가능성을 보여주었다.

개인화된 뉴스 알고리즘에 관한 연구로 Kim & Lee[14]는 사용자가 직접 인터페이스를 조작해 개인화된 기사를 만들 수 있는 시스템을 개발하고, 이 시스템을 통해 생성된 기사가 가진 뉴스 가치를 평가한 연구를 소개하였다. 이 연구에서 발견된 개인화된 기사의 특징은 재미있고 읽기에 즐거우며 풍부한 정보량을 지닌 기사이지만, 개인이 가진 선호와 관심사가 반영된 기사의 내용으로 인해 일반적인 기사에 비해 더 낮은 신뢰성을 보인다는 점이다. 이에 본 연구에서는 스포츠와 증시 기사가 아닌 정치, 선거 보도와 같이 기사에 대한 신뢰성이 중요하게 작용하는 뉴스 분야에서 개인화된 기사를 만드는 알고리즘 저널리즘 기술이 접목된 뉴스 기사의 생성 방식과 그 효과에 대해 살펴보고자 한다.

2.2 개인화된 뉴스의 효과

개인화된 뉴스와 관련된 연구들은 현재까지 대부분 기존에 제작된 뉴스를 개인의 취향과 성향에 맞게 찾고 필터링할 것인지에 주목하고 있다[20,21]. 먼저 MIT에서 신입생들을 위해 제공하던 ‘Fishwrap’의 경우 대학이 있는 지역이나 사용자가 원하는 정보 위주로 뉴스를 필터링하여 제공하던 시스템이다[22]. 간단한 사용자 평가를 통해 특히 외국이나 다른 지역에서 온 사용자가 좋은 평가를 내렸던 것을 확인할 수 있었다. Thurman[23]은 주요 뉴스 편집자들을 인터뷰하여 개인화된 뉴스 제공의 효과를 확인했는데, 특히 신뢰성의 경우에는 상대적으로 전문적인 편집자들의 편집이 없으므로 개인화된 뉴스에 대한 신뢰성이 낮아질 것으로 예상했다. 반면 개인화된 사용자가 그렇지 않은 사용자에 비해 더 다양한 소스와 종류의 뉴스를 이용함으로써 사용자로 하여금 더욱 풍부한 정보를 획득하도록 도와준다는 연구결과도 확인할 수 있다[24]. 개인화된 뉴스 제공 서비스는 아니지만 이와 유사한 기능을 하게 되는 SNS를 통한 뉴스 획득 효과에 관한 연구에서는 사용자들이 원하는 뉴스를 지속적으로 접할 수 있고, 더 다양한 뉴스와 정보를 획득할 수 있다는 장점이 나타나기도 했다[25]. 반면에, 개인화된 뉴스는 원하는 정보만 획득하기 때문에 사용자의 편향성이 증가하고, 소비하는 뉴스의 다양성이 감소할 수 있다는 지적도 있다[26,27].

한편, 야구 경기 결과를 사용자가 응원하는 팀의 관점에 맞춰 자동으로 생산하고 뉴스 가치를 평가한 연구에서는 개인화된 뉴스는 그렇지 않은 뉴스에 비해 상대적으로 정보적(informative), 재미(interesting), 읽는 기쁨(pleasant to read), 중요도(important)의 측면에서 더 높은 평가를 받았지만, 신뢰성 항목은 개인화된 뉴스가 더 낮게 나타난 바 있다[14]. 이는 뉴스는 기본적으로 객관적이어야 하며, 따라서 특정 집단의 관점에서 작성된 기사는 신뢰하기 어렵다는 시각이 반영된 결과로 보이며, 개인화된 뉴스로 인한 편향성을 우려하는 기존 연구결과와도 어느 정도 일치한다. 반면에 정보적이고, 흥미롭고, 사용자가 뉴스를 중요하다고 여기는 항목에서는 객관적으로 서술된 기사보다 유의미하게 높게 평가되었으며, 이는 사용자들이 자신이 가진 관심사에 맞춘 기사를 더 재미있고 의미 있다고 평가하는 것을 확인할 수 있었다. 이런 결과를 볼 때, 기사 내용 자체는 편향적이지 않고, 기사의 주제나 소재는 사용자가 원하는 방식의 개인화된 뉴스를 제작하는 방향이 적합하다고 보인다.

본 연구에서는 개인화된 지방선거 뉴스 생성을 위한 개인화 변수로 지역, 선호 정당, 선거 종류, 후보네 가지로 선정하였다. 각 요소는 모두 기존의 정치 영역에서 선거에 큰 영향을 미친다고 평가되었으며, 이에 따라 사용자들 역시 정치 뉴스를 접함에 있어 해당 요소들을 고려하여 개인화된 뉴스를 생성할 것으로 보았다.

우선 지역에 의한 정치적 인식의 경우, 지역 연고주의라는 심리적으로 범주적인 판단을 내리는 인간의 기본 인식 때문에 발생하게 되며 내집단 편애나타 집단에 대한 편견과 고정관념 등에 의해 영향을 받는다[28]. 한국에서는 영호남을 중심으로 한 지역주의가 강하며, 선거의 주요 요소로 설명되고 있다[29,30]. 지역주의가 해당 지역에 연고를 두고 있는 정당에 대한 정당일체감으로 이어지며, 연고 정당에 대한 지지를 통해 발현된다.

정당 선호도의 경우 정당일체감이라고 표현되기도 하며, 이는 현대 선거 민주주의 이해의 핵심축이자 정당 시스템의 안정성을 보증하는 현대 정치의 중요한 요인이다[30]. 정당일체감은 다른 집단에 대한 동일시와 비슷한 감정으로서, 스스로가 선호하는 정당에 대한 심리적인 동일시 현상이다[31]. 국내에서도 정당일체감, 즉 정당 선호도가 개별 선거에서 유권자의 선택에 어떻게 영향을 미치는지에 대한 연구가 활발히 이루어지고 있다[32,33].

선거 종류는 개별 선거가 이루어지는 대통령 선거나 국회의원선거에서는 큰 의미가 없을 수 있지만, 국회의원 재보궐 선거부터 구청장 선거까지 이루어지는 지방선거에서는 그 의의가 있다고 판단된다. 특히 선거 종류에 따라 당선에 영향을 미치는 요인들이 상이할 수 있으며[34], 선거 유형에 따라 투표 참여와 같은 선거에 대한 관심도가 다르게 나타날 수 있기에[35], 본 연구에서는 선거 종류 역시 중요한 개인화 요소 중 하나로 포함하였다.

마지막 요소는 후보로, 한국 유권자들이 지지 후보를 결정하는데 가장 중시하는 변수가 바로 후보로 정당이나 선거 당시의 이슈보다 우선시하는 경우가 있다[36]. 다만 조사 결과마다 후보자 효과가 다르게 나타나는 경향은 있다[37]. 본 연구에서는 다양한 레이어에서의 선거가 발생하고 후보자의 수가 천 명이 넘어가는 지방선거를 다루고 있기에 중요한 요소로 보고 개인화 변수로 포함하였다.

연구진은 위에서 언급한 지역, 선호 정당, 선거 종류, 후보를 포함한 개인화 변수를 사용자가 조작해 기사를 생성할 수 있는 카드뉴스봇 시스템을 개발해 선거 결과를 개인 맞춤형 카드 뉴스의 형태로 전달하는 시스템과 이를 통해 생성된 기사의 뉴스 가치를 Sundar[38]가 제시한 19가지의 기준을 사용해 평가해 보고자 한다.

3. 카드뉴스봇

카드뉴스봇은 사용자들이 웹 브라우저로 접속하여 PC 및 모바일 기기로 사용할 수 있는 웹 애플리케이션으로 제작되었다. 시스템은 사용자들의 개인화 변수를 입력받아 카드 뉴스를 서비스하는 웹 앱 서버, 개인화 변수 및 실시간 데이터를 바탕으로 카드 뉴스 내용을 생성하는 카드 뉴스 엔진, 선거 및 사용자 데이터를 저장하는 데이터베이스로 구성되었다. 사용자의 기기에서 웹 브라우저를 통해 개인화 변수를 설정하여 웹 애플리케이션 서버로 전송하면 서버에서 카드 뉴스 엔진을 이용하여 실시간 데이터를 기반으로 생성한 카드 뉴스를 사용자에게 제공하는 방식으로 구성되었다. 사용자의 개인화 변수에 따라 실시간 데이터를 활용한 정확한 선거 정보를 맞춤형 카드 뉴스 형태로 제공하는 것을 시스템의 목표로 삼았다.

3.1 사용자 인터페이스

카드뉴스봇 웹 페이지는 초기 화면, 개인화 변수 설정 페이지, 생성된 뉴스 리스트 페이지, 카드 뉴스 페이지 등으로 구성되어 있다. Fig. 1의 초기 화면에는 좌상단에 가장 최근에 생성한 카드 뉴스의 표지, 우상단에 개인화 뉴스 설정 버튼, 그리고 하단에는 도움말 역할을 하는 소개 영상을 배치하였다. 모바일이나 데스크톱 형태에 맞게 반응형 웹 페이지의 형태로 구성되어 접속 기기 종류에 상관없이 이용할 수 있도록 인터페이스를 구성하였다.

 MTMDCW_2020_v23n2_301_f0001.png 이미지

Fig. 1. Main interface of CardNewsBot system.

카드뉴스봇 시스템의 가장 큰 특징은 모든 사용자에게 같은 뉴스를 제공하는 것이 아니라 개인화 변수에 따라 서로 다른 내용과 형태의 뉴스를 이용할 수 있다는 것이다. 처음 접속하여 개인화 변수를 설정하지 않은 시점에서는, 웹 브라우저에서 제공하는 사용자의 위치를 기반으로 삼아 기본 기사를 서비스한다. 사용자 설정 화면에서 사용자 본인이 관심 있는 개인화 변수들을 설정하면 해당 시간의 실시간 데이터를 기반으로 하여 카드 뉴스를 제공한다. 여러 장의 카드들을 하나씩 넘기며 뉴스를 읽은 후에는 다시 메인화면으로 돌아와 다른 변수들을 설정한 카드 뉴스를 만들 수 있다.

3.2 개인화 변수 설정

시스템의 사용자는 Fig. 2와 같은 초기 화면에서 오른쪽 위에 있는 개인화 뉴스 설정 버튼을 클릭하여, 관심 지역, 관심 선거의 유형, 관심 후보, 관심 정당을 설정할 수 있다. 관심 지역은 드롭다운 메뉴를 사용하여 시/도, 군/구 지역 순서로 선택할 수 있도록 하였으며, 관심 선거 유형은 국회의원, 시/도지사, 구/시군 의장, 교육감 선거 가운데 체크박스를 통해 선택하도록 하였다. 관심 정당은 원내 정당을 체크박스로 선택하며, 관심 후보는 후보의 이름을 검색 하여 선택하도록 하였다. 모든 개인화 변수는 복수 선택할 수 있도록 하였으며, 개인화 변수의 선택은 종류 구분 없이 1개 이상, 8개 이하로 제한하였다. 설정 완료 버튼을 누르면, 실시간으로 개인화 변수에 맞는 카드 뉴스가 생성되며 초기 화면으로 복귀한다. 모든 선거가 종료된 다음 날부터는 시간대를 직접 설정하여 이전 시간대의 실시간 뉴스도 살펴볼 수 있도록 서비스하였다.

MTMDCW_2020_v23n2_301_f0002.png 이미지

Fig. 2. Personalization setting interface.

3.3 카드뉴스 뷰(view)

개인화 변수를 설정하고 나면, Fig. 3과 같이 생성된 뉴스의 제목이 자동으로 변경된다. 이때 뉴스의 제목은 개인화 변수 중의 하나가 반영되며 “당신이 선택한 OOO 선거의 투표율 현황” 등으로 표시된다. 제목 아래에는 카드 뉴스 생성에 반영된 개인화 키워드가 해시태그 형태로 나타나며, 개인화 변수 외에도 선거 일정 중의 뉴스 생성 시간에 따라 투표 중, 투표 종료 이후, 개표 중, 개표 종료 이후로 구분되어 생성 되는 뉴스의 종류가 달라지도록 하였다. 예를 들어 개표가 시작되기 전에는 개인화 변수로 지정된 지역의 투표율 등을 볼 수 있으며, 개표가 진행되는 동안에는 선택한 후보의 득표율로 뉴스의 내용이 구성된다. 선택한 개인화 변수와 관련된 뉴스를 생성하지 못하는 시점에는 해당 항목에 대한 뉴스는 나타나지 않으며, 관련된 데이터가 업데이트된 이후에는 개인 화된 맞춤 뉴스가 생성된다.

MTMDCW_2020_v23n2_301_f0003.png 이미지

Fig. 3. Personalized card news is generated after the settings are submitted.

3.4 생성된 뉴스 리스트

새롭게 개인화 변수를 설정하면 사용자가 이전에 생성한 모든 카드 뉴스는 Fig. 4에서와 같이 ‘내가 만든 뉴스’ 리스트에 추가되며, 사용자는 변수의 종류를 바꾸어가며 반복하여 뉴스를 생성할 수 있다. 각 뉴스에는 업데이트 버튼을 두어 이전에 설정한 개인화 변수를 이용하여 현재 시점을 기준으로 다시 생성할 수 있다. 뉴스 생성 시점에 따라 실시간으로 업데이트되는 정보에 의해 뉴스의 내용이 변화하기 때문에, 업데이트된 뉴스는 기존에 같은 개인화 변수를 이용한 뉴스와 다른 내용을 담고 있을 수 있다. 예컨대, 개표 시작 이전에 생성한 뉴스는 지역별 투표율에 관한 정보를 담고 있지만, 개표가 모두 끝난 시점에서 이 뉴스를 업데이트하면 설정한 후보의 득표율을 반영하여 당선 여부나 최종 득표 숫자 등의 정보를 담고 있을 수 있다.

MTMDCW_2020_v23n2_301_f0004.png 이미지

Fig. 4. The page contains all user generated card news.

3.5 카드뉴스 구성 요소

카드 뉴스는 텍스트로 구성된 정보 외에 시각적 요소를 활용할 수 있는 특성을 반영하여, 일반적으로 카드 뉴스에 널리 사용되는 시각화 요소를 삽입하였다(Fig. 5). 활용된 요소는 관련 이미지 활용, 전국/지역 매핑 시각화, 바 그래프 시각화 등을 포함한다. 지역별 수치를 비교하는 카드에서는 지도 위에 색상의 명도를 이용하여 시각화한 그래프를 자동으로 생성하여 표시하였고, 정당 간 혹은 지역 간 비교에는 바 그래프를 자동으로 생성하여 수량적 정보를 빠르게 비교할 수 있도록 시각화하였다. 그래프의 장식적 요소와 주요 정보를 강조하기 위해 각 정당의 대표 색상을 사용하였으며, 시각화 요소가 별도로 존재하지 않는 카드에는 관련 이미지를 배경에 사용하였다.

MTMDCW_2020_v23n2_301_f0005.png 이미지

Fig. 5. Sample card news pages.

4. 연구방법

4.1 실험설계

본 연구에서는 카드뉴스봇 시스템이 생성한 지방 선거 기사에 대한 사용자들의 평가를 기자가 작성한 기사에 대한 평가와 비교 측정하기 위해 두 가지 실험을 수행하였다. 첫 번째 실험은 일반적으로 선거 기사에서 많이 볼 수 있는 일반 신문 기사 형태의 기사와의 비교 평가 실험이다. 두 번째 실험은 뉴스 형식의 차이에 따른 효과를 배제하기 위해 기자가 작성한 카드 뉴스와 카드뉴스봇이 자동 생성한 카드 뉴스와의 비교 실험으로 진행하였다.

4.1.1 실험 처치물

실험 처치물을 위해 언론에서 현업으로 일하고 있는 전문가 2명을 섭외하여 지방선거에 관련된 기사작성을 요청하였다. 전문가들은 카드뉴스봇 시스템이 사용하고 있는 것과 동일한 데이터를 활용하여 각각 13일 오후 1시, 오후 8시, 그리고 14일 오전 2시대의 선거 기사를 작성하였다. 구체적으로 이 데이터에는 지방선거 당일(13일)과 다음날(14일)의 시간대별 투표율, 개표율, 득표율이 담겨있다. 전문가들은 두 가지 형식의 기사를 작성하였는데 하나는 실험 1에 사용된 줄글 기사 형식이며 다른 하나는 실험 2에 사용된 카드 뉴스 형식이었으며 두 기사의 내용은 동일하다. 카드 뉴스 형식의 경우, 전문가들이 카드에 들어갈 텍스트와 그래프의 내용을 작성하면 카드뉴스봇 시스템과 동일한 형식으로 제작하여 활용 하였다. 또한, 참여자들은 카드뉴스봇 시스템을 활용 하여 개인이 관심이 있는 조건을 설정한 후 지방선거 관련 카드 뉴스를 생성할 수 있도록 하였다.

4.1.2 실험절차

대학 웹 게시판을 이용해 실험 참여자들 총 66명을 모집하였으며 다음의 두 가지 조건을 가진 그룹에 무작위적으로 배정되었다:1) 기자가 작성한 기사 중‘신문 기사’ 형태의 기사를 읽고 평가하는 그룹, 2) 기자가 작성한 기사 중 ‘카드 뉴스’ 형태의 기사를 읽고 평가하는 그룹이 있다. 양 그룹의 참여자 모두에게 기사를 읽을 시간으로 15분이 주어졌으며, 기사를 읽은 후 첨부된 설문지 항목에 따라 설문에 응답하도록 하였다.

실험 1에서는 전문가가 쓴 텍스트 기사와 카드뉴스봇 시스템이 생성한 개인화된 카드 뉴스 형식에 따라 사용자들이 기사에 대한 평가가 달라지는지를 비교하도록 설계되었다. 참여자들은 우선 전문가의 줄글 기사를 읽은 후 뉴스 기사에 대해 평가하는 설문에 응하였다. 그 후 카드뉴스봇 시스템을 사용하여 직접 관심 있는 개인화 변수를 설정한 후에 자동으로 생성된 카드 뉴스를 읽도록 하였다. 카드 뉴스를 읽은 후에는 마찬가지로 뉴스 기사에 대해 평가하는 설문을 작성하였다. 참여자들이 각 기사에 대한 설문을 모두 마친 이후에는, 카드뉴스봇 시스템 전반에 대해 평가하는 인터뷰를 진행하였다. 인터뷰를 통해 카드뉴스봇 시스템에 대한 참여자의 의견과 평가를 수집하고자 하였고, 시스템 사용 소감과 카드 뉴스의 질, 개인화된 기사의 유용함과 시스템의 적합성, 향후 시스템의 활용에 관한 전망과 개선점을 중점으로 응답을 수집하였다. 각 인터뷰에서 내용을 녹음하였고, 이후 내용을 문서로 만든 뒤 음성 자료는 삭제하였다.

실험 2는 기사 형식의 차이를 배제하고 기사 작성 주체만 달라질 때 사용자들의 기사에 대한 평가를 비교하고자 하였다. 실험 1의 기사를 작성한 전문가에게 실험 1에 쓰인 기사를 기반으로 카드 뉴스에 들어갈 기사와 함께 카드에 들어갈 그래프의 형태와 내용을 작성하게 하였다. 이를 이용해 카드뉴스봇 시스템에서 사용한 양식에 맞춰 카드 뉴스를 제작하여 실험을 진행하였다. 참여자들이 각 기사에 대한 설문을 모두 마친 이후에는, 실험 1에서처럼 카드뉴스봇 시스템 전반에 대해 평가하는 인터뷰를 진행하였다. 실험은 참여자당 약 30분 정도 소요되었다.

4.2 변인측정

종속 변인인 뉴스 기사 가치 평가를 측정하기 위해 Sundar[38]와 Clerwall[4]의 연구에서 사용한 항목들을 재구성하여 19가지 속성으로 구성된 설문지를 작성하였다. 설문 항목은 사용자로서 각각 기자가 작성한 기사와 카드 뉴스 시스템이 만든 기사의 가치를 평가하는 항목으로 구성되었다(Table 1).

Table 1. Evaluation criteria on news values

MTMDCW_2020_v23n2_301_t0001.png 이미지

5. 연구결과

5.1 뉴스 가치 평가 비교 분석

기자가 텍스트로 작성한 기사와 알고리즘이 작성한 카드 뉴스를 비교한 실험 1에서는 대응표본 T 검정 분석 결과, 전반적으로 모든 항목에 걸쳐 알고리즘이 작성한 카드 뉴스가 더 긍정적인 평가를 얻었다. 신뢰성(credibility)의 경우 알고리즘 작성 기사가 6점 이상의 높은 점수로 기자 작성 기사보다 높게 나타났고, 그 외에도 선호성(liking), 우수성(quality), 대표성(representativeness)의 항목에서 모두 Table 2와 같이 알고리즘 작성 기사가 높은 것으로 나타났다.

Table 2. The comparison between Human- and CardNewsBot-generated news article

MTMDCW_2020_v23n2_301_t0002.png 이미지

텍스트와 카드라는 양식 차이에 의한 효과를 배제하기 위해 기자와 시스템이 모두 카드 형식으로 작성한 기사를 비교한 실험 2에서는 신뢰성은 여전히 알고리즘 작성 기사가 더 높은 것으로 나타났지만 선호 성과 대표성의 경우 이전의 분석과 반대로 기자 작성 기사가 더 높게 나타났으며, 우수성은 상호 유의미한 차이가 나타나지 않았다. 이런 결과를 볼 때 선호성와 우수성, 대표성의 평가에 있어서 기사의 양식이 유의미한 영향을 미치고 있다고 볼 수 있다.

다시 말해, 이전의 분석에서 알고리즘 작성 기사가 기자 작성 기사보다 선호성, 우수성, 대표성의 영역에서 높게 나타난 것은 기자 작성 기사가 텍스트로 이루어졌기 때문이라는 것이다. 기사의 선호성의 경우 카드 뉴스라는 정보 제공 양식이 영향을 미칠 수 있지만, 기사의 우수성이나 대표성에까지 영향을 미친다는 점은 흥미로운 결과라고 볼 수 있다. 다만 이전의 분석에서도 두 항목에서의 두 기사 형식의 차이는 유의미하지만 상대적으로 미미했던 편으로, 응답자 수가 증가할 경우 근사한 범위 내에서 다시 변화할 가능성도 있다.

정리하자면, 알고리즘이 작성한 기사의 경우 뉴스 가치에 있어 가장 중요한 신뢰성이 일관되게 높게 나타났다는 점에서 의의가 있다. 특히 기존의 스포츠와 증권 뉴스에 한정되어 시행되고 있던 알고리즘 작성 기사가 신뢰성과 정확성이 중요한 정치 뉴스, 특히 선거 뉴스에서도 사람이 작성한 기사에 비해 알고리즘이 작성한 기사가 더 높은 신뢰성을 보였다는 것은 알고리즘 작성 기사가 기존의 스포츠와 증권 영역을 넘어 일반 뉴스 영역으로도 확장될 가능성을 보여주고 있는 것이라 볼 수 있다.

선호성의 경우 기사 양식의 효과가 강하게 나타날 것으로 예상한 영역으로, 상대적으로 텍스트만으로 구성된 기사는 사용자에게 재미를 전달하기 어렵기 때문이다. 실제로도 기사 양식에 따른 효과가 상당한 수준으로 나타난 것을 확인할 수 있었다. 흥미로운 점은 알고리즘 작성 기사가 제공하는 개인화된 기사가 사용자에게 재미있다고 인식되지 않았다는 것이다. 개인화된 뉴스는 결국 뉴스 콘텐츠의 구성에 대한 문제로, 뉴스를 습득하는 데 있어 재미란 실제 뉴스의 내용과 무관하게 그 형식에 의존적이라는 추측을 가능케 한다.

다만 개인화된 뉴스의 대표성 효과는 명확하게 나타나지는 않았는데, 우선 개인화된 뉴스가 사용자에게 영향을 미칠 것으로 보였던 대표성 영역에서 기사 양식에 따라 일관되지 않은 결과가 나타나 실제 개인화된 뉴스의 효과인지 확인하기 어렵다. 개인화된 뉴스의 경우 상대적으로 사용자 개인에게 적합한 형태의 뉴스로 제공되며, 따라서 대표성 항목이 측정하는 중요하고, 적절하고, 관련성이 높다는 측면에서 더 높은 평가를 받을 것으로 예상하였다. 그럼에도 불구하고 분석 결과가 일정하게 나타나지 않았다는 것은 실제 기사 양식의 차이에 의해 발생한 것일 수도 있지만, 뉴스 가치의 대표성이라는 개념이 실제 사용자들이 인식하는 것과 차이가 있기 때문일 가능성이 있다. 이는 우수성 요소도 마찬가지로, 사용자에게 개인화된 뉴스가 질적으로 더 가치가 있다고 했을 때 질적으로 가치가 있다는 개념이 서로 다르게 적용되었을 수 있다. 예를 들어, 개인화된 뉴스가 사용자 개인이 직접 선택하고 이를 바탕으로 그들에게 중요하고 적절하고 관련성이 높은 정보를 전달하는 것은 맞지만, 정작 사용자는 이를 평가하면서 선거 전체에서 중요한 정보를 기준으로 대표성을 평가했을 가능성이 있다. 이에 대한 구체적인 논의는 인터뷰 분석에서 다룰 것이다.

5.2 인터뷰를 통해 살펴본 카드뉴스봇의 함의

5.2.1 간결하고 빠르게 개인의 관심사를 반영해 만드는 뉴스의 유용성을 확인

실험 참가자 인터뷰를 통해 확인한 카드뉴스봇의 특장점은 빠르고 간결하게 개인이 관심을 가진 정보를 바탕으로 뉴스를 만들어 볼 수 있다는 점이었다. 특히, “내용이 간결하고 가독성이 좋아 바쁠 때 빠르게 주요 정보를 획득하는 데 유용할 것 같습니다(P21).”라는 의견과 같이 빠르고 정확한 기사를 생성할 수 있는 알고리즘 저널리즘의 알려진 장점에 더해 카드뉴스봇은 사용자가 직접 자신의 관심사를 반영해 기사를 생성한다는 장점이 더해진다. 기존의 지방선거와 관련한 뉴스 보도는 다양한 지역구에서 동시다발적으로 벌어지는 후보들의 각축전을 일일이 담아내지 못하고 사람들의 관심이 몰린 특정 지역구와 관련된 기사가 대부분이었다.

“사람이 작성한 기사는 대상을 특정할 수 없어서 상대적으로 큰 지역들에 대해서만 광범위하게 작성된 느낌입니다.” (P2)

“언론에서는 주목받는 정당이나 1등만 보도하는 경향이 있으므로 개인화 뉴스가 언론이 커버하지 못하는 영역을 커버해 줄 수 있을 것 같습니다.” (P24)

“시간 측면에서 많이 유용했습니다. TV를 한참 보면서 우리 지역 뉴스가 나올 때까지 기다리든가 인터넷 기사를 살펴서 관심 지역을 볼 수 있었는데(간혹 나오지 않기도 했고), 자료를 검색하는 불필요한 시간을 줄여주어 주었습니다.” (P42)

하지만, 카드뉴스봇은 지방선거에 있어 사용자가 가진 관심 지역, 정당, 후보와 선거 유형을 한정해 맞춤형 기사를 만들어주는 “자신이 원하는 정보를 가진 뉴스를 보는 효율적(P10)”이고 “비슷비슷한 제목의 기사를 선택하는 소모적인 방식이 아닌 선택의 고민을 줄여주는 유용한(P61)” 방식으로 여겨진다는 반응을 확인해볼 수 있었다. 특히, 기존 뉴스를 특정 조건에 맞추어 필터링 해주는 방식이 아니라 사용자에게 필요한 글을 실시간으로 생성한다는 점에서 향후 널리 사용될 것이라는 의견이 많았다.

“단순히 원하는 키워드 필터링을 넘어 원하는 취지의 정보를 접할 수 있다는 점이 매력적입니다.” (P8)

“앞으로 정보가 더 많아지면 개인이 모든 기사를 다 읽기 힘들 것으로 생각되는데, 이처럼 개인이 원하는 정보의 기사가 높은 가독성을 가지고 만들어진다면 사람들에게 큰 인기를 가지게 될 것으로 생각됩니다.” (P3)

5.2.2 정확한 숫자와 폭넓은 데이터의 활용에 따라 높은 신뢰를 받음

“기자가 작성하는 것보다 더 객관적인 느낌을 받을 수 있었고, 역대 선거 자료와 비교하여 수치를 비교해주는 것이 좋았습니다(P3).”라는 인터뷰 내용과 같이 선거관리위원회의 데이터를 직접 활용해 기사를 만들고 역대 선거 데이터를 활용해 비교한 방식이 높은 평가를 받았다. “객관적인 사실을 날 것으로 보여주어 왜곡이나 편향성에 대한 의심을 줄일 수 있었습니다(P10)”라는 의견과 “(기자의) 가치 판단이나 뉘앙스가 들어가지 않은 점이 좋았습니다(P36)"라는 의견과 같이 언론에 대해 가지고 있는 불신으로 인해 알고리즘 기반의 시스템에 대해 공정하고 객관적으로 뉴스를 전달할 것이라는 강한 믿음을 가진 모습을 확인할 수 있었다. 뉴스 가치 평가 결과에서 카드뉴스봇이 기자가 작성한 기사들과 비교해 월등히 높은 신뢰성 점수를 획득할 수 있었던 배경에는 이처럼 기자가 작성한 기사에 대한 불신에 비례해 상대적으로 높았던 알고리즘에 대한 기대가 자리하고 있었다.

“기자의 기사가 편향적, 편파적이라는 불만의 목소리가 높은데 이러한 사람들의 욕구를 (카드뉴스봇이) 충족시켜줍니다.” (P6)

“기자가 쓴 기사에는 그래프들도 나와 있었으나 딱히 비교되지 않는 그래프가 많았고 읽기에 다소 부적절하다고 생각하는 단어들도 등장하여 인상을 찌푸리기도 했습니다. 예를 들면, 특정 지역이 ‘투표율 꼴찌’라는 말이 있었습니다.” (P27)

카드뉴스봇에 있어 숫자 데이터의 적극적인 활용과 표현은 신뢰성을 높이는 요소이지만 반대로 작은 오류나 해석의 차이에 민감하게 반응하는 모습 또한 발견할 수 있었다. 특히, 데이터의 표현에 있어 오류가 발생하거나 동의하지 않는 방식으로 데이터가 해석되어 문장이 생성된 경우에 대한 지적이 인터뷰에서 다수 언급되었다.

“대체로 잘 작성되었으나 투표율과 득표수에서 소수점이 다 깎여나가 미묘한 차이가 나타나지 않은 것이 아쉬웠습니다.” (P62)

“표현이 어색한 부분이 있었습니다(예, ‘17개의 투표구 중 0곳에서 앞선다’라는 표현). 소수 정당은 관련 통계를 봐도 의미 있는 결과가 없으니 결과를 보여주는 것 외에 어떤 정당인지 먼저 소개하는 말도 있었으면 좋겠습니다.” (P13)

“원하는 정보를 정확하게 제공하지만, 중간에 오류가 있어 신뢰성을 해쳤습니다(한 카드에서 개표율의 합산이 100%가 아닌 170%로 표시됨). 통계적인 오류를 개선해서 더욱 정확한 기사가 나오면 좋겠습니다.” (P40)

Dietvorst, Simmons, & Massey[39]의 연구에서 알고리즘이 실수한 경우 사람보다 더 큰 폭으로 시스템에 대한 신뢰가 떨어지고, 사람과는 달리 시간이 지나도 신뢰가 회복되지 않는 모습이 발견되었다. 카드뉴스봇 실험에서도 개표율 합산 오류가 발견된 경우 낮은 신뢰성 점수를 받았고, 인터뷰에서도 낮은 신뢰성에 대한 이유로 언급되는 모습을 볼 수 있었다. 데이터의 적극적인 사용과 알고리즘을 전면에 내세운 뉴스 전달자가 가진 강점은 데이터를 정확하게 표시하고 해석하는 과정에서도 사람들의 기대치에 맞아야 한다는 함의를 찾을 수 있었다.

5.2.3 객관적이지만 읽는 재미가 부족하고 대표성이 떨어지는 뉴스라고 평가됨

기자가 작성한 카드 뉴스는 이번 선거에서 관심을 모았던 선거구에 관한 내용을 포함했지만, 카드뉴스 봇은 사용자가 선택한 지역구에 관한 내용만을 포함해 객관적이지만 경쟁적인 요소가 없어서 아쉽다는평가를 받았다. 특히, 기자가 작성한 기사는 더 구체적이고 포괄적으로 선거를 다루었지만, 카드뉴스봇은 “대략적이어서 정보가 더 적게 담겨있다는 느낌(P57)”이라는 의견과 카드뉴스봇을 통해 “관심 지역에 대한 정보를 집중적으로 볼 수 있는 것은 좋았지만 다른 지역에 대해 알면 좋을 정보가 나오지 않아 아쉬웠습니다(P58)’라는 의견과 같이 개인화 방식에 대해 느끼는 아쉬움이 인터뷰를 통해 발견되었다.

“기자가 만든 카드 뉴스는 훨씬 더 중요한 내용을 더 집중적으로 다루고 사람들이 관심 있어 하는 부분을 보여주지만, 알고리즘이 만든 카드 뉴스는 대략적인 정보를 주네요. 시스템이 나은 점은 덜 편향적이고 공평해 보인다는 점입니다.” (P43)

“관심 지역과 관련된 내용만 되어 있어서 격전을 벌였던 경남/경북 지역과 같이 사전에 관심 지역으로 설정되지 않은 뉴스가 포함되어 있지 않아서 아쉬웠습니다.” (P58)

주목할 만한 의견은 개인화된 뉴스를 만드는 카드 뉴스봇이 편향적인 정보 습득을 하게 만들 수 있다는 우려도 함께 제기되었다는 점이다. 실제로 한 참여자는 인터뷰에서 개인화된 시스템이 사용자에게 편향된 정보를 제공할 것으로 생각한다는 우려와 함께“사용자의 관심사에 맞게 설정된 정보를 보여주되, 너무 편향되지 않은 정보도 함께 전달될 수 있다면 더 좋을 것 같습니다(P16)”라는 의견을 남겼다. 이는 지방선거와 같이 내 지역의 소식뿐만 아니라 대표적으로 민심의 향방을 읽을 수 있는 지역구에 대한 소식이 빠진다면, 기사가 선거 전체의 맥락을 담지 못하고 개인의 편협한 관심사에만 집중하게 만들어 뉴스로서 가져야 할 대표성을 잃을 수 있다는 것을 시사한다. 이를 종합하면 개인화된 기사를 만들 때 고려할 점은 관심사를 기반으로 궁금한 정보를 간결하고 빠르게 만드는 방식 이외에도 사건 전체의 분위기를 알 수 있도록 중요한 정보를 선별적으로 알려줄 수 있어야 한다는 점이다.

6. 논의 및 결론

본 연구에서는 빠르고 정확하게 뉴스 기사를 생성하는 알고리즘 저널리즘의 강점을 살려 개인 맞춤형 기사를 읽기 쉬운 카드 뉴스의 형태로 제공하는 시스템을 개발해 기사의 뉴스 가치와 사용자의 반응을 실험과 인터뷰를 통해 살펴보았다. 이 결과 카드뉴스 봇은 객관적이고 공정하게 선거 결과를 담아내고 있다는 점에서 기자보다 신뢰성에 있어 월등히 높은 평가를 받았지만, 재미를 느낄 수 있는 표현이나 선거 전체에 대한 포괄적인 분석이 부족해 선호성과 대표성에서는 사람이 만든 기사와 비슷하거나 못 미치는 평가를 받기도 하였다.

본 연구에서는 실험을 통해 향후 알고리즘 저널리즘이 스포츠와 증시 기사와 같은 뉴스 분야 이외에도 정치와 사회 뉴스와 같이 더 객관적이고 공정한 분석이 필요한 영역으로 발전해 나갈 수 있다는 가능성을 확인해볼 수 있었다. 하지만 카드뉴스봇이 향후 확장된 뉴스 분야에서 사용자를 만족시키는 뉴스 서비스로 자리매김하기 위해서는 세 가지 고려해야 할 점이 발견되었다.

첫 번째는 실시간으로 벌어지는 이벤트를 처리하는 새로운 알고리즘 저널리즘 구조의 확립이다. 현재 카드뉴스봇을 비롯해 언론에서 사용되고 있는 알고리즘 저널리즘 기술은 주로 숫자 기반의 정형화된 데이터를 사용해 미리 정해놓은 규칙에 따라 문장으로 생성하는 방식이다[3]. 미리 규칙을 정하지 않거나 문장의 구조를 미리 설정하지 않는 방식으로 문장을 생성하는 신경망 기반의 자연어 생성 알고리즘이 지속적으로 연구되고 있지만, 뉴스 기사에 요구되는 높은 품질의 문장을 이와 같은 방식으로 생성하기에는 아직 알고리즘의 성능이 따라오지 못하고 있다. 따라서, 현재 알고리즘 저널리즘 기술을 통해 효율적으로 기사를 생성하는 방식을 채택하는 미디어 업체들에서는 데이터를 처리하는 규칙을 미리 만들어두고 실시간으로 벌어지는 이벤트에 대응하고 있다.

본 연구에서 카드뉴스봇은 다양한 지역구에서 동시다발적으로 벌어지는 여러 선거 유형에 효과적으로 대응하기 위해 미리 카드 뉴스의 순서와 데이터를 처리하는 조건을 미리 설정해두고 개인화 변수에 따른 카드의 조합을 생성하는 구조를 만들어두었다. 이로 인해 지역구 별로 쟁점이 된 사안들과 후보자 간 각축의 양상이 다르지만 일관된 조건으로 데이터를 처리하게 설계되었고, 기자에 비해 무미건조하고 제한적인 표현을 할 수밖에 없었던 점에서 가치 평가 점수와 인터뷰에서 지적받게 되었다. 또한, 오랫동안 시스템을 사용하는 경우에 카드의 순서와 구성이 비슷해 쉽게 지루해질 수 있다는 점과 설정된 변수에 포함되지 않은 정보를 담아내기에 어려웠던 점도 한계로 지적할 수 있다.

두 번째는 에버그린(evergreen) 뉴스 서비스로 활용될 수 있는 방안을 고려해야 한다는 점이다. 에버그린 뉴스는 시간에 민감하지 않은 뉴스 콘텐츠를 말한다. 카드뉴스봇을 통해 생성된 기사를 단발적인 기사로 생각하면 에버그린 콘텐츠라는 표현이 어울리지 않지만, 카드뉴스봇 시스템이 지속적으로 해당 이벤트에 관한 기사를 생성해낼 수 있고 정기적으로 벌어지는 이벤트를 다룰 수 있는 플랫폼에 가깝다는 점을 고려하면 에버그린 뉴스에 대한 충분한 고려가 시스템 설계 단계에서부터 필요하다고 볼 수 있다. 실제로 한 참가자의 인터뷰에서 “투표 결과 기사에서 개표율이 100%인 것은 굳이 필요한 정보가 아닌것 같습니다(P54)”라는 의견이 있었다. 카드뉴스봇이 실제로 오픈한 지방선거 당일에는 개표율이 후보자 간 경쟁의 결과를 알리는 중요한 지표였다면 실험이 진행된 선거 3개월 후의 시점에서는 크게 중요한 정보가 아니었다.

마찬O경쟁으로 기사의 방향을 정하기에 상황이 모호해질 수 있다. 한 번의 선거를 위해 개발된 카드 뉴스 시스템이 다음 선거에서도 신뢰할 수 있고 재미와 대표성까지 갖춘 뉴스 제공자의 역할을 수행하기 위해서는 이처럼 선거가 진행 중이거나 한참의 시간이 흐른 후와 같은 시간의 흐름과 선거의 쟁점과 관전 포인트가 달라지는 조건의 변화에 민감하게 시스템을 설계할 수 있어야 한다. 따라서 뉴스 서비스의 기획 단계에서부터 알고리즘이 같은 데이터를 기반으로도 시간의 흐름에 따라 달라지는 관심사와 이슈의 흐름을 반영해 문장을 생성할 수 있도록 데이터 분석 조건과 표현의 다양성을 확보할 필요가 있다.

세 번째는 개인화 변수의 설정을 통한 기사 생성이 가진 장단점을 사용자 경험 관점에서 이해하는 일이다. 카드뉴스봇의 장점은 개인적인 관심사에 따라 맞춤형 기사를 제공할 수 있다는 점에 있지만, 중요한 선거구나 화젯거리가 기사에 포함되지 않았다는 점에서는 아쉽다는 의견이 있었다. 더 나아가 “기사를 생성할 때 구체적으로 어떻게 생성해야겠다는 생각이 없었습니다(P66)”라는 의견이나 “사람들이 개별적으로 정보를 입력하는 걸 귀찮아 하는 경향이 있다고 생각합니다(P32)”라는 의견과 같이 모든 개인화 변인을 조작해서 기사를 만들어야 하는 지금의 구조가 모두에게 유용한 시스템이라고 평가받는 건 아니라는 사실도 발견할 수 있었다. 특히 이 문제는 저널리즘의 관점에서 개인화된 뉴스 콘텐츠와 현재의 주요 이슈 위주의 콘텐츠 간의 비교라는 점에서 의의를 찾을 수 있다. 사용자들은 자신과 관여도가 높은 주제 위주로 개인화된 콘텐츠에 관심을 보이면서도 동시에 사회 전체적으로 중요도가 높은 지역의 선거 결과 역시 보기를 원하는 경향을 나타냈다. 이는 정치라는 사회의 주요 영역의 뉴스에 대해 사용자들이 개인적 관점과 동시에 사회 전체적인 관점에서 정보를 전달받기를 원한다는 양가적 특성을 보인다고 할 수 있으며, 따라서 앞으로의 뉴스 생산에 있어서 이런 모순적인 욕구를 어떻게 만족시켜줄 수 있을지가 주요한 문제가 될 것이다.

컴퓨터 시스템의 사용성(usability)과 사용자 경험(user experience)을 다루는 휴먼-컴퓨터 인터랙션(Human-Computer Interaction) 연구에서는 일반적으로 인터페이스를 디자인할 때 사용자에게 모든 결정을 넘기게 만들지 않는다. 인터페이스가 가진 옵션의 수나 복잡함 정도에 따라 사용자가 느끼는 불편함이 증가하기 때문이다[40,41]. Thaler & Sunstein[41]은 사용자에게 모든 결정을 넘기는 것보다 시스템이 기본적인 설정을 미리 정해두고 사용자에게 이를 변경하거나 조작할 수 있는 선택권을 주는 것이 더욱 만족스러운 서비스 사용 경험으로 이어진다고 주장했다. 연구진이 설계한 카드뉴스봇은 인간의 주관이 들어가지 않은 객관적이고 공정한 뉴스 서비스를 지향하며 사전에 개인화 변인을 설정해두지 않았다. 결과적으로 이와 같은 시스템의 사용 경험이 더욱 신뢰할만한 뉴스라는 평가로 이어졌지만, 다른 한편으로는 기자와 비교하면 사건 전체를 짚어주는 맥락과 관심 지역에 대한 커버가 이루어지지 않은 뉴스 생성 방식이라는 의견 또한 받아볼 수 있었다.

본 연구에서 제안한 인터랙티브 카드 뉴스 생성 시스템을 활용한 선거 뉴스 생성은 빠르게 속보를 전달하는 기존 알고리즘 저널리즘 기술의 적용에서 한 단계 더 나아가 뉴스 사용자가 가진 관심과 선호를 바탕으로 개인화된 기사를 제공하는 시스템을 개발해 그 효과를 측정했다는 점에서 의의가 있다. 특히, 지방선거는 전국의 각 지역에서 여러 정당과 후보들이 시도지사, 시군구청장, 국회의원, 교육감을 두고 각축을 벌이는 복잡한 이벤트로 논쟁거리가 될만한 후보자나 지역이 아닌 경우에는 선거 결과를 접하기 힘들 수 있다. 하지만 카드뉴스봇은 손쉽게 관심 지역과 선거 유형, 후보와 정당을 선택해 요약정리된 기사를 접할 수 있게 돕는다는 점에서 알고리즘 저널리즘 기술이 스포츠와 증시 분야를 넘어 다양한 분야에 적용될 가능성을 보여주었다. 카드뉴스봇이 생성한 기사의 가치를 평가한 실험에서도 신뢰성이 높고 선호성와 우수성, 대표성에서도 인간이 작성한 기사보다 높은 평가를 받거나 인간만큼 우수한 기사를 만들 수 있었다는 측면에서 향후 카드뉴스봇을 활용해 뉴스 개인화의 방식과 효과를 측정하는 다양한 연구들을 수행할 수 있을 것으로 기대한다.

References

  1. A.V. Dalen, "The Algorithms Behind the Headlines: How Machine-written News Redefines the Core Skills of Human Journalists," Journalism Practice, Vol. 6, No. 5-6, pp. 648-658, 2012. https://doi.org/10.1080/17512786.2012.667268
  2. D. Caswell and K. Dorr, "Automated Journalism 2.0: Event-driven Narratives: From Simple Descriptions to Real Stories," Journalism Practice, Vol. 12, No. 4, pp. 477-496, 2018. https://doi.org/10.1080/17512786.2017.1320773
  3. D.W. Kim and J.H. Lee, "Robot Journalism : Algorithmic Approach to Automated News Article Generation," Korean Journal of Journalism and Communication Studies, Vol. 59, No. 5, pp. 64-95, 2015.
  4. C. Clerwall, "Enter the Robot Journalist: Users' Perceptions of Automated Content," Journalism Practice, Vol. 8, No. 5, pp. 519-531, 2014. https://doi.org/10.1080/17512786.2014.883116
  5. N. Diakopoulos, "Algorithmic Accountability: Journalistic Investigation of Computational Power Structures," Digital Journalism, Vol. 3, No. 3, pp. 398-415, 2015. https://doi.org/10.1080/21670811.2014.976411
  6. K. Dorr, "Mapping the Field of Algorithmic Journalism," Digital Journalism, Vol. 4, No. 6, pp. 700-722, 2016. https://doi.org/10.1080/21670811.2015.1096748
  7. The Rise of the Robot Reporter, http://www.nytimes.com/2019/02/05/business/media/artificial-intelligence-journalism-robots.html (accessed February 11, 2019).
  8. C.W. Anderson, "Towards a Sociology of Computational and Algorithmic Journalism," New Media and Society, Vol. 15, No. 7, pp. 1005-1021, 2013. https://doi.org/10.1177/1461444812465137
  9. J.V. Pavlik, "Innovation and the Future of Journalism," Digital Journalism, Vol. 1, No. 2, pp. 181-193, 2013. https://doi.org/10.1080/21670811.2012.756666
  10. M. Karlsson and C. Clerwall, "Negotiating Professional News Judgment and Clicks," Nordicom Review, Vol. 34, No. 2, pp. 65-76, 2013. https://doi.org/10.2478/nor-2013-0054
  11. P.M. Napoli, "Automated Media: An Institutional Theory Perspective on Algorithmic Media Production and Consumption," Communication Theory, Vol. 24, No. 3, pp. 340-360, 2014. https://doi.org/10.1111/comt.12039
  12. M. Broussard, "Artificial Intelligence for Investigative Reporting: Using an Expert System to Enhance Journalists' Ability to Discover Original Public Affairs Stories," Digital Journalism, Vol. 3, No. 6, pp. 814-831, 2015. https://doi.org/10.1080/21670811.2014.985497
  13. M. Carlson, "The Robotic Reporter: Automated Journalism and the Redefinition of Labor, Compositional Forms, and Journalistic Authority," Digital Journalism, Vol. 3, No. 3, pp. 416-431, 2015. https://doi.org/10.1080/21670811.2014.976412
  14. D. Kim, D, and J. Lee, "Designing an Algorithm-Driven Text Generation System for Personalized and Interactive News Reading," International Journal of Human-Computer Interaction, Vol. 35, No. 2, pp. 109-122, 2019. https://doi.org/10.1080/10447318.2018.1437864
  15. N.D. Allen, J.R. Templon, P.S. McNally, L. Birnbaum, and K. Hammond, "Statsmonkey: A Data-driven Sports Narrative Writer," Proceeding of 2010 Association for the Advancement of Artificial Intelligence Fall Symposium Series, 2010. pp. 2-3
  16. M.L. Young and A. Hermida, "From Mr. and Mrs. Outlier to Central Tendencies: Computational Journalism and Crime Reporting at the Los Angeles Times," Digital Journalism, Vol. 3, No. 3, pp. 381-397, 2015. https://doi.org/10.1080/21670811.2014.976409
  17. M.A. Beam, "Automating the News: How Personalized News Recommender System Design Choices Impact News Reception," Communication Research, Vol. 41, No. 8, pp. 1019-1041, 2014. https://doi.org/10.1177/0093650213497979
  18. T. Gao, J.R. Hullman, E. Adar, B. Hecht, and N. Diakopoulos, "News Views: An Automated Pipeline for Creating Custom Geovisualizations for News," Proceedings of the Special Interest Group for Computer-Human Interaction Conference on Human Factors in Computing Systems, pp. 3005-3014, 2014.
  19. T. Lokot and N. Diakopoulos, "News Bots: Automating News and Information Dissemination on Twitter," Digital Journalism, Vol. 4, No. 6, pp. 682-699, 2016. https://doi.org/10.1080/21670811.2015.1081822
  20. S. Kalyanaraman and S.S. Sundar, "The Psychological Appeal of Personalized Content in Web Portals: Does Customization Affect Attitudes and Behavior?," Journal of Communication, Vol. 56, No. 1, pp. 110-132, 2006. https://doi.org/10.1111/j.1460-2466.2006.00006.x
  21. R.F. Kizilcec, "How Much Information?: Effects of Transparency on Trust in an Algorithmic Interface," Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems, pp. 2390-2395, 2016.
  22. P.R. Chesnais, M.J. Mucklo, and J.A. Sheena, "The Fishwrap Personalized News System," Proceedings of the Second International Workshop on Community Networking 'Integrated Multimedia Services to the Home', pp. 275-282, 1995.
  23. N. Thurman, "Making 'The Daily Me': Technology, Economics and Habit in the Mainstream Assimilation of Personalized News," Journalism, Vol. 12, No. 4, pp. 395-415, 2011. https://doi.org/10.1177/1464884910388228
  24. M.A. Beam and G.M. Kosicki, "Personalized News Portals: Filtering Systems and Increased News Exposure," Journalism and Mass Communication Quarterly, Vol. 91, No. 1, pp. 59-77, 2014. https://doi.org/10.1177/1077699013514411
  25. A. Hermida, F. Fletcher, D. Korell, and D. Logan, "Share, Like, Recommend: Decoding the Social Media News Consumer," Journalism Studies, Vol. 13, No. 5-6, pp. 815-824, 2012. https://doi.org/10.1080/1461670X.2012.664430
  26. E. Pariser, The Filter Bubble: What the Internet is Hiding from You, Penguin, UK, 2011.
  27. J.Y. Jung, S.Y. Hwang, and Y.M. Yoon, "A Verification about the Formation Process of Filter Bubble with Personalization Algorithm," Korea Multimedia Society, Vol. 21, No. 3, pp. 369-381, 2018.
  28. H.S. Kim, "The Truth about Regional Stereotypes and Prejudice," The Korean Psychological Association, Vol. 1988, No. 1, pp. 37-62, 1988.
  29. T.W. Kim "An Analysis on the 'Yeong Nam and Ho Nam' Regional Voting Pattern of the Korean Election-focused on the National Election since 1990s," The Journal of Localitology, No. 7, pp. 57-104, 2012.
  30. G.I. Yoon "Regionalism and 19th Korean National Assembly Election," Korean Journal of Political Science, Vol. 20, No. 2, pp. 113-138, 2012.
  31. W.H. Park and J.M. Song, "Do Parties Still Matter?: Independent Voters in Korean Electionss," Journal of Korean Politics, Vol. 21, No. 2, pp. 115-143, 2012.
  32. C.H. Lee, "The Political Participation and Patterns of Behaviors of the Non-committed People in Korea," Journal of Global Politics, Vol. 2, No. 2, pp. 37-62, 2009.
  33. J.H. Han, "Party Identification in Korea: Policy, Party Leaders, and Party Activists," Korea and World Politics, Vol. 28, No. 3, pp. 93-128, 2012. https://doi.org/10.17331/kwp.2012.28.3.004
  34. A.R. Hwang, "Changes and Persistence of Local Elections in the 2000s," Korean Journal of Political Science, Vol. 47, No. 5, pp. 277-295, 2000. https://doi.org/10.18854/kpsr.2013.47.5.013
  35. W. Kim, "Election Types and Voting Participation: With Focus on Local Elections," Journal of Korean Politics, Vol. 15, No. 1, pp. 99-121, 2006.
  36. K.Y. Lee and H.W. Lee, "Candidate Effects on the Congressional Elections : The Cases of the 14th-16th Congressional Elections in Korea," Journal of Political Science, Vol. 34, No. 2, pp. 149-170, 2000.
  37. K.S. Yi and K.S. Song, "Voter's Choice in Local Election, Party or Candidate?: Cases of 6.2 Local Election and the Seoul Mayoral Election," Korean Association for Policy Science, Vol. 15, No. 4, pp. 339-360, 2011.
  38. S.S. Sundar, "Exploring Receivers' Criteria for Perception of Print and Online News," Journalism and Mass Communication Quarterly, Vol. 76, No. 2, pp. 373-386, 1999. https://doi.org/10.1177/107769909907600213
  39. B.J. Dietvorst, J.P. Simmons, and C. Massey, "Algorithm Aversion: People Erroneously Avoid Algorithms after Seeing Them Err," Journal of Experimental Psychology: General, Vol. 144, No. 1, pp. 114-126, 2015. https://doi.org/10.1037/xge0000033
  40. S. Krug, Don't Make Me Think!: A Common Sense Approach to Web Usability, New Riders Publishing, Indianapolis, IN, 2000.
  41. R.H. Thaler and C.R. Sunstein, Nudge: Improving Decisions About Health. Wealth, and Happiness, Penguin Books, UK, 2008.