DOI QR코드

DOI QR Code

News Big Data Analysis of 'Tap Water Larvae' Using Topic Modeling Analysis

토픽 모델링을 활용한 '수돗물 유충' 뉴스 빅데이터 분석

  • 이수연 (한국환경교육연구소 객원연구원) ;
  • 김태종 (한국청소년정책연구원 청소년정책분석평가센터 부연구위원)
  • Received : 2020.09.21
  • Accepted : 2020.11.04
  • Published : 2020.11.28

Abstract

This study was conducted to propose measures to improve crisis response to environmental issues by analyzing the news big data on the 'tap water larvae' situation and identifying related major keywords and topics. To accomplish this, 1,975 cases of 'tap water larvae' reported between July 13 to August 31, 2020 were divided into three periods and analyzed using topical modeling techniques. The analysis output 15 topics for each period. According to the result, the 'tap water larvae' incident, as reported in the media, is divided into the occurrence, diffusion, and rectification stages. The government's response and civilian risk consciousness and reaction could also be seen. Based on the result, the following measures to respond to environment risk is proposed. First, it is necessary to explore the various intertwined context with the 'tap water larvae' incident at its core and develop responsiveness to environmental problems through education which forms integrated views. Second, a role to monitor the environment must be implemented and civilian-participated environmental information must be shared through the application of internet communities. Third, the cultivation and deployment of environmental communicators who provide and communicate fast and accurate environment information is required. This study, as the first in Korea to use the topic modeling analysis method based on big data related to 'tap water larvae', has academic significance in that it has empirically and systematically analyzed environmental issues which appear as unstructured data. It also political significance as it suggests ways to improve environmental education and communication.

본 연구는 '수돗물 유충' 사태의 뉴스 빅데이터를 분석함으로써, '수돗물 유충'과 관련된 주요 키워드와 토픽을 파악하여, 환경문제에 대한 위기 대응력 제고방안을 제안하기 위해 수행되었다. 2020년 7월 13일부터 8월 31일까지 보도된 1,975건의 '수돗물 유충' 뉴스를 토픽 모델링 기법으로 분석하였다. 그 결과 언론에서 나타난 '수돗물 유충' 사태가 발생기, 확산기, 수습기로 구분되며, 각 5개의 토픽을 선정하여, 환경문제의 발생과 추진 과정을 확인할 수 있었다. 분석 결과를 바탕으로 환경문제에 대한 위기 대응 방안을 다음과 같이 제언하였다. 첫째, '수돗물 유충' 사건을 중심으로 얽혀있는 다양한 맥락을 탐구하고 통합적인 안목을 형성하는 교육으로 환경문제에 대한 대응력을 기를 수 있도록 해야 한다. 둘째, 인터넷 커뮤니티를 활용한 시민참여의 환경정보 공유와 환경감시 역할 부여가 필요하다. 셋째, 신속하고 정확한 환경정보 제공과 소통을 담당하는 환경 커뮤니케이터의 양성 및 배치가 필요하다. 본 연구는 '수돗물 유충' 관련 뉴스 빅데이터를 기반으로 국내에서 처음으로 토픽 모델링 분석기법을 활용하여 분석한 연구로서, 비정형 데이터로 나타나는 환경 관련 이슈를 실증적이고 체계적으로 분석했다는 학술적 의의와 환경교육 및 커뮤니케이션 개선 방안을 제시했다는 정책적 의의를 지닌다.

Keywords

I. 연구목적 및 필요성

본 연구의 목적은 토픽 모델링 분석기법을 활용하여 ‘수돗물 유충’ 관련 국내 뉴스 빅데이터를 분석함으로써, 뉴스 빅데이터에 나타난 ‘수돗물 유충’ 관련 주요 키워드를 도출하고, 이를 바탕으로 사회적으로 이슈화되고 있는 수돗물 유충 관련 의제를 파악하는 것이다.

2020년 7월 13일 인천 서구 일대에서 수돗물에 유충이 나왔다는 민원이 최초 보도된 이후[1], 16일이 경과한 7월 29일까지 전국에서 접수된 ‘수돗물 유충’ 관련 민원 신고는 2,318건이며, 인천 외에도 서울, 부산, 경기도 등 전국에서 민원신고가 접수됐다[2].

인천 지역 수돗물에서 발견된 유충은 파리목의 깔따구과(Chironomidae sp.)로서, 1~2mm 정도의 철사 모양 지렁이 또는 붉은 색을 띤 실지렁이와 유사한 형태이며, 저수지, 강, 바닷물 등에서 서식하고, 염소 (Chlorine)에 대한 저항성이 강해 잔류염소 50mg/L에서 48시간 처리 후에도 생존하는 것으로 알려져 있다 [3]. 아직 깔따구 유충의 경우 유해성에 대한 국내 임상 결과는 나타나지 않았다[4].

‘수돗물 유충’ 민원이 급증함에 따라, 환경부는 7월 17일 전국 정수장배수지 등에 대한 위생상태 긴급점검을 요청하고, 전국 지방자치단체는 전수 조사에 착수했다[3]. 7월 20일 환경부장관은 ‘수돗물 유충’ 사태에 대해 “국민께 불편을 드리고 우려를 낳게 해 주무장관으로서 막중한 책임감을 느낀다”고 공식 사과했다[5].

이러한 정부와 지방자치단체의 조치에도 불구하고, 건강과 직결되는 수질개선에 대한 공감대가 빠르게 확산되었다. 그리고 충분하지 않은 환경정보 제공으로 인한 불안으로, 수돗물 유충’에 대한 민원과 청원이 전국적으로 증가함은 물론, 생수 및 정수기샤워기 필터 판매량도 급증한 상황이다[6].

정치권에서도 “수돗물은 국민생활에 가장 필수적인 공공재로, 국민들이 믿고 마시며 사용할 수 있는 수돗물 공급과 관리는 정부의 기본 책무”라며, “국민들이 불편과 불안을 겪지 않도록 최선을 다하겠다”면서 정부의 신속한 대책을 촉구했다[7].

이처럼 환경 관련 뉴스는 사회적으로 이슈화되고 있는 환경문제와 관련된 다양한 기관과 사람들의 목소리를 보도하면서, 사회문제를 제기하고 각자의 입장을 제시하며 논쟁의 과정을 거쳐 해결책을 마련하는 일종의 공론장(公論場) 역할을 수행한다.

특히, 뉴스는 ‘수돗물 유충’과 같이 국민의 건강과 밀접한 관련이 있는 사안을 중요한 의제로 설정함으로써, 문제를 부각시키고 국민의 어려움과 의견을 대변하며 전문가의 원인분석과 해결방안을 제시하여 정책에 반영시키는 기능을 한다.

따라서, 국내 최초로 발생한 ‘수돗물 유충’과 관련된 사안을 해결하기 위해서는 먼저, 국민, 정치인, 전문가, 정부 관계자 등의 목소리가 총체적으로 담겨있는 뉴스를 통해 사회적으로 구성된 의제가 무엇인지 파악하는 것이 필요하다. 이를 파악하는 데에는 대량의 뉴스 빅데이터를 대상으로, 텍스트 내에 잠재되어 있는 의제 (토픽)를 파악하는 토픽 모델링 분석방법이 유용하게 활용될 수 있다.

현재까지 수돗물과 관련된 뉴스를 분석한 국내 연구 (KCI 등재지 기준)로는 김성태이창호(2007)의 ‘공적 이슈에 대한 미디어 보도 분석(수돗물 관련 기사를 중심으로)’[8]과 홍영식이덕로(2019)의 ‘인천 상수도 사태의 이슈 특성과 향후 정책 변동 가능성 연구(매스미디어 분석을 중심으로)’[9] 외에는 발견되지 않았으며, 토픽 모델링 분석방법을 활용한 연구는 아직 진행되지 않았다.

수돗물 관련 연구동향을 분석한 연구에 따르면, 기존 선행연구 805건의 주요 연구주제로, 상수도 수질, 불소 농도 조정사업, 잔류물 영향, 미생물 관리, 시스템 구축, 정수처리 방법, 영향평가, 시민들의 인식, 인체에 미치는 영향 등이 다루어졌으나[10]. 수돗물에서 발생한 ‘유충’을 주제로 한 연구는 존재하지 않았다.

따라서, 본 연구에서는 국내에서 최초로 발생한 ‘수돗물 유충’을 주제로, 관련 뉴스 빅데이터를 토픽 모델링 기법을 활용하여 사회적으로 구성된 의제를 분석하기 위해 다음과 같이 연구문제를 설정하였다.

<연구문제1> ‘수돗물 유충’ 뉴스 빅데이터에 나타난 시기별 주요 키워드는 무엇인가?

<연구문제2> ‘수돗물 유충’ 뉴스 빅데이터에 나타난 시기별 주요 토픽은 무엇인가?

Ⅱ. 선행연구 검토

1. 수돗물 관련 환경문제 선행연구 고찰

우리나라 상수 이용은 1950년대부터 시작하여 전국 평균 상수도 보급률이 ʹ18년 기준 97%에 이르며[11], 물 사용의 편리성과 생활수준의 향상에 기여하고 있다. 그러나 1990년 금강광역상수도의 트리할로메탄(THM) 수질 기준 초과 사건을 시작으로, 1991년 낙동강 페놀 유출 사건 등 수질 안전성에 대한 경각심이 촉발되었다. 이로 인해 건설부가 담당하던 상하수도 업무와 보건사회부가 담당하던 음용수관리 업무를 환경처로 이관하였으며, 물관리 기능을 강화하고 일원화한다는 취지에서 1994년 환경처는 환경부로 격상되었다.

또한 국민의 환경에 대한 사회적 관심이 급속하게 확대되고 환경문제를 해결하기 위한 보다 체계적이고 근본적인 대책이 요구되자, 정부는 제6차 교육과정(1992년)에 환경을 독립과목으로 포함하였다. 이러한 영향으로 국내에 수돗물 관리(상수도 수질, 불소농도 조정사업, 정수처리 방법, 영향평가, 미생물 관리, 시스템 구축 등) 연구들이 다양한 주제로 활발히 진행되었다[10]. 최근 류재나 외(2018)는 ‘물환경 서비스와 물 인프라의 지속가능성 평가 연구’[12]에서 수질 서비스 품질의 형평성 확립이 필요함을 지적하고, 물 인프라(경제, 사회, 환경부문)의 지속가능성 평가 의무화를 통한 개선 및 이행체계 적립의 필요성을 제시하였다.

수돗물 환경 사건의 쟁점을 다룬 서이종(2001), 성하영(2007) 연구에서는 1997년부터 2002년까지 수돗물 바이러스 오염 여부에 대한 과학계와 정부[13], 환경시민단체 등 각 입장에 따른 논쟁 형성과정[14]을 다루었으나, 환경 위기 대응 논의는 다뤄지지 않았다.

수돗물과 관련된 뉴스를 분석한 연구로는 김성태·이창호(2007)의 ‘공적 이슈에 대한 미디어 보도 분석(수돗물 관련 기사를 중심으로)’[8]과 홍영식이덕로(2019) 의 ‘인천 상수도 사태의 이슈 특성과 향후 정책 변동 가능성 연구(매스미디어 분석을 중심으로)’[9] 등이 진행 되었으나, 그 밖의 수돗물 관련 뉴스 분석 연구는 발견 되지 않았으며, 분석방법에서도 내용분석과 의미연결망 분석이 활용되었으며, 토픽 모델링 분석방법을 활용한 연구는 발견되지 않았다.

2. 사회적 이슈 연구방법 고찰

사회적 이슈를 분석하는 데에는 연구목적에 따라 다양한 연구방법을 활용할 수 있다. 최근 사회적 이슈를 분석하는 데에 활용된 연구방법을 파악하기 위해, 2020 년에 발행된 KCI 등재지를 대상으로 ‘이슈 분석’ 관련 논문을 검색한 결과, 총 32편의 논문이 수집되었다.

사회적 이슈를 분석하는 데에 활용된 연구방법으로는 [표 1]과 같이 토픽모델링, 의미연결망, 문헌연구, 내용분석, 질적연구, 설문조사 등이 활용되었다. 특히, 토픽모델링과 의미연결망 분석은 뉴스, 보도자료, SNS, 인터넷 게시판 등 대량의 텍스트로 구성된 빅데이터를 분석하는 데에 유용하여 최근 이슈 분석에 많이 활용되고 있다.

표 1. 최근 주요 사회적 이슈별 연구방법

CCTHCV_2020_v20n11_28_t0001.png 이미지

본 연구에서는, ‘수돗물 유충’과 관련된 뉴스에서 나타난 시기별 의제(토픽)를 파악하는 것이 연구목적이므로 토픽 모델링 분석방법을 활용하였다. 특히, 토픽모델링 분석방법은 전통적인 뉴스 내용분석 방법의 한계인 코더 간 및 코더 내 신뢰도 문제, 대용량 데이터 분석 제한을 극복하는 데에 유용하다[15].

따라서, 본 연구에서는 뉴스에 잠재되어 있는 의제(토픽)를 도출하는 연구에 많이 사용되고 있는 토픽 모델링 기법인 LDA (Latent Dirichlet Allocation, 잠재 디리클레 할당) 기법을 적용하였다[16]. LDA기법은 텍스트 내 키워드들을 출현비율에 따라 토픽에 할당하는 분석기법이다[17][18].

Ⅲ. 연구 방법

1. 자료 수집

분석 대상 언론매체는 한국언론진흥재단에 기사를 제공하는 총 54개 매체이며, 세부 현황은 [표 2]와 같다.

표 2. 분석 대상 언론매체 현황

CCTHCV_2020_v20n11_28_t0002.png 이미지

* 자료 출처: 빅카인즈 홈페이지(www.bigkinds.or.kr)에서 재구성

분석기간은 ‘수돗물 유충’ 민원이 최초 보도된 2020년 7월 13일부터 관련 보도빈도가 크게 하락한 8월 31일까지 총 29일이다. 보도빈도가 [그림 1]과 같이 3개 시점을 기준으로 변화함에 따라 3개 시기로 구분하여 분석했다. 제1기는 7월 13일부터 18일까지, 제2기는 7월 19일부터 26일까지, 제3기는 7월 27일부터 8월 31일까지다.

그림 1. 일자별 ‘수돗물 유충’ 관련 보도 추이

* 자료 출처: 빅카인즈 홈페이지(www.bigkinds.or.kr)에서 재구성

뉴스 빅데이터 수집을 위한 검색어는 ‘수돗물 유충’으로 설정하였다. 수집 방법은 뉴스 빅데이터 분석 서비스를 제공하고 있는 빅카인즈(BIGKinds)를 활용하였다.

분석 대상 뉴스 건수는 [표 3]과 같이 총 1,975건으로, 최초 수집된 2,326건에서 중복, 일정안내, 인물동정 등의 뉴스 351건을 제외하였다. 본 연구에서는 빅카인즈를 통해 비정형 데이터의 전처리와 형태소 추출이 완료된 데이터를 활용하여 분석을 수행했다.

표 3. 분석 대상 뉴스 건수(건)

CCTHCV_2020_v20n11_28_t0003.png 이미지

2. 분석 방법

본 연구에서 활용한 분석프로그램은 NetMiner 4이며, 뉴스 텍스트에서 추출된 키워드를 행렬 매트릭스로 구성하여 LDA분석(α=0.1, β=0.01)을 실시하였다[19].

토픽의 개수를 정하는 데에는 연구자가 사전에 정하는 방법과 데이터를 기반으로 정하는 방법이 있다[13]. 본 연구에서는 먼서 연구자가 사전에 토픽의 개수를 2개에서 30개로 정한 후, 샘플링 반복횟수를 1,000회로 설정하여 토픽 개수별로 중복되는 키워드의 수를 비교하였다. 이 데이터를 기반으로, 중복되는 키워드 수가 가장 적고 범주별로 해석이 용이하게 분류된 토픽의 개수를 판단한 결과, 적정한 토픽의 개수는 5개로 나타났다.

이를 바탕으로 토픽 모델링을 실시하여 토픽별로 출현비율이 높은 순으로 키워드를 도출한 후 다음과 같은 절차를 수행하였다. 첫째, 도출된 키워드와 뉴스 원문을 비교하여 어떤 맥락에서 키워드가 사용되었는지 파악 했다. 둘째, 토픽별로 도출된 키워드들을 종합적으로 분석하여 연구자가 토픽명을 부여했다. 셋째, 토픽명의 적합성에 대해 환경 분야 전문가(교수 1인, 박사 3인, 현장전문가 3인)의 1차 검토를 받은 후, 수정한 토픽명에 대한 타당도를 리커트 5점 척도(매우 타당함 5점, 매우 타당하지 않음 1점)로 조사했다. 전문가 평가 결과, 전토픽명의 타당도가 4점 이상으로 나타나 이를 반영하여 토픽명을 최종 확정하여 연구를 진행하였다.

Ⅳ. 연구 결과

1. 제1기 ‘사태 발생기’ 단계 분석 결과

제1기 2020년 7월 13일부터 18일까지 보도된 수돗물 유충 관련 뉴스 341건을 분석한 결과, 주요 키워드 간의 네트워크는 [그림 2], 토픽은 [표 4]와 같이 나타났다.

CCTHCV_2020_v20n11_28_f0002.png 이미지

그림 2. 제1기 주요 키워드 네트워크

표 4. 제1기 토픽 및 주요 키워드

CCTHCV_2020_v20n11_28_t0004.png 이미지

1기에서는 정수장-깔따구-벌레-발생-불안-신고 등의 키워드가 공동으로 출현하면서, 수질 환경문제 발생과 국민들의 인식 촉발, 시민 공론화 과정이 이슈로 부각되어 ‘사태 발생기’로 명명하였다.

[토픽1]은 ‘점검’, ‘긴급’, ‘정수장’, ‘대응’, ‘민원’ 등의 키워드가 도출됨에 따라, 기관이 정수장을 긴급 점검하는 보도 내용을 고려하여, 토픽명을 ‘수돗물 유충 문제 감지’ 로 부여했으며, 관련 뉴스건수는 66건(19.3%)이다.

[토픽2]는 ‘서구’, ‘사태’, ‘벌레’, ‘급식’, ‘중단’ 등의 키워드가 도출됨에 따라, 수돗물 유충 발생으로 학교 급식 중단, 인천 3만 가구 수돗물 사용 중단 등의 보도내용을 고려하여, 토픽명을 ‘인천 수돗물 유충 논란’으로 부여했으며, 관련 뉴스건수는 66건(19.3%)이다.

[토픽3]은 ‘정수장’, ‘깔따구’, ‘원인’, ‘발생’, ‘확인’ 등의 키워드가 도출됨에 따라, 수돗물 유충이 발생한 원인을 파악하는 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 정체 확인’으로 부여했으며, 관련 뉴스건수는 61건 (17.9%)이다.

[토픽4]는 ‘신고’, ‘불안’, ‘서구’, ‘벌레’, ‘확산’ 등의 키워 드가 도출됨에 따라, 수돗물에서 유충을 발견한 시민들의 신고와 불안감이 확산되는 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 불안 확산’으로 부여했으며, 관련 뉴스건수는 92건(27.1%)이다.

[토픽5]는 ‘청원’, ‘임신’, ‘아내’, ‘깔따구’, ‘유입’ 등의 키워드가 도출됨에 따라, 수돗물 유충 관련 민원이 발생하는 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 청원 발생’으로 부여했으며, 관련 뉴스건수는 56건(16.4%)이다.

2. 제2기 ‘사태 확산기’ 단계 분석 결과

제2기 2020년 7월 19일부터 26일까지 보도된 수돗물 유충 관련 뉴스 1,109건을 분석한 결과, 주요 키워드 간의 네트워크는 [그림 3], 토픽은 [표 5]와 같이 나타났다.

2기에서는 정수장-발견-신고-전국-확산-긴급 등의 키워드가 공동 출현하면서, 환경부를 중심으로 정수장 실태점검 노력과 국민들의 인식된 위험의 확산과 대응이 이슈로 부각되어, ‘사태 확산기’로 명명하였다.

[토픽1]은 ‘점검’, ‘긴급’, ‘정수장’, ‘시설’, ‘현장’ 등의 키워드가 도출됨에 따라, 전국 지자체가 관내 정수장을 긴급 점검하는 보도내용을 고려하여, 토픽명을 ‘지자체 정수장 실태 점검’으로 부여했으며, 관련 뉴스건수는 196건(17.7%)이다.

[토픽2]는 ‘신고’, ‘발견’, ‘인천’, ‘부산’, ‘아파트’ 등의 키워드가 도출됨에 따라, 전국에서 수돗물 유충 발견 신고가 접수되는 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 신고 전국 확산’으로 부여했으며, 관련 뉴스건수는 316건(28.5%)이다.

[토픽3]은 ‘인천’, ‘필터’, ‘민원’, ‘보상’, ‘가정’ 등의 키워드가 도출됨에 따라, 수돗물에서 유충이 확인된 가구만 피해를 보상한다는 인천시 지침과 논란에 대한 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 피해 보상 논란’으로 부여했으며, 관련 뉴스건수는 156건(14.1%)이다.

[토픽4]는 ‘정수장’, ‘인천’, ‘발견’, ‘전국’, ‘국무총리’ 등의 키워드가 도출됨에 따라, 국무총리 지시로 환경부가 전국 정수장을 점검하는 보도내용을 고려하여, 토픽명을 ‘전국 정수장 전수조사 진행’으로 부여했으며, 관련 뉴스건수는 283건(25.5%)이다.

[토픽5]는 ‘필터’, ‘불안’, ‘확산’, ‘생수’, ‘샤워기’ 등의 키워드가 도출됨에 따라, 시민들의 불안이 확산되고 생수나 샤워기 필터를 구매하는 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 불안 확산 및 주민 대응’으로 부여 했으며, 관련 뉴스건수는 158건(14.2%)이다.

CCTHCV_2020_v20n11_28_f0003.png 이미지

그림 3. 제2기 주요 키워드 네트워크

표 5. 제2기 토픽 및 주요 키워드

CCTHCV_2020_v20n11_28_t0005.png 이미지

3. 제3기 ‘사태 수습기’ 단계 분석 결과

제3기 2020년 7월 27일부터 8월 31일까지 보도된 수돗물 유충 관련 뉴스 525건을 분석한 결과, 주요 키워드 간의 네트워크는 [그림 4], 토픽은 [표 6]과 같이 나타났다.

3기에서는 상수도-시설-점검-결과-관리-부실 등의 키워드가 공동 출현하면서, 수돗물 유충 원인규명과 환 경부 전국 정수장 전수조사 결과가 이상 없음에도 유충이 추가 발견되고, 국민들의 알 권리를 위한 환경정보 제공 및 교육과 수돗물에 대한 신뢰 회복이 필요함을 보여주는 이슈가 부각되어 ‘사태 수습기’로 명명하였다.

[토픽1]은 ‘발견’, ‘외부’, ‘조사’, ‘전국’, ‘신고’ 등의 키워드가 도출됨에 따라, 환경부가 전국 정수장을 대상으로 조사한 결과를 발표한 보도내용을 고려하여, 토픽명을 ‘전국 정수장 전수조사 결과 발표’로 부여했으며, 관련 뉴스건수는 121건(23.0%)이다.

[토픽2]는 ‘인천’, ‘사태’, ‘관리’, ‘활성탄’, ‘부실’ 등의 키워드가 도출됨에 따라, 인천시 수돗물 유충 사태의 원인을 규명한 결과 정수장 관리 부실로 나타났다는 보도내용을 고려하여, 토픽명을 ‘인천 물 관리 부실’로 부여했으며, 관련 뉴스건수는 92건(17.5%)이다.

[토픽3]은 ‘점검’, ‘긴급’, ‘안전’, ‘상수도’, ‘현장’ 등의 키워드가 도출됨에 따라, 각 지자체의 긴급 점검 보도 내용을 고려하여, 토픽명을 ‘지자체별 상수도 안전 발표’로 부여했으며, 관련 뉴스건수는 141건(26.9%)이다.

[토픽4]는 ‘정수기’, ‘낙동강’, ‘생수’, ‘필터’, ‘수질’ 등의 키워드가 도출됨에 따라, 수돗물 유충 사태로 인한 정수기‧필터‧생수 판매량 증가, 낙동강 수질 개선 요구 등의 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 부대 효과’ 로 부여했으며, 관련 뉴스건수는 77건(14.7%)이다.

[토픽5]는 ‘인천’, ‘발견’, ‘추가’, ‘시민’, ‘확인’ 등의 키워드가 도출됨에 따라, 인천 등 각 지역에서 수돗물 유충이 지속적으로 발견된다는 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 추가 발견’으로 부여했으며, 관련 뉴스건수는 94건(17.9%)이다.

CCTHCV_2020_v20n11_28_f0004.png 이미지

그림 4. 제3기 주요 키워드 네트워크

표 6. 제3기 토픽 및 주요 키워드

CCTHCV_2020_v20n11_28_t0006.png 이미지

Ⅴ. 요약 및 제언

본 연구는 ‘수돗물 유충’ 사태의 뉴스 빅데이터를 분석함으로써, ‘수돗물 유충’과 관련된 주요 키워드와 토픽을 파악하여, 환경 문제에 대한 위기 대응력 제고방안을 제안하기 위해 수행되었다. 이를 위해 2020년 7월 13일부터 8월 31일까지 보도된 1,975건의 뉴스를 3개 시기로 구분하여 토픽 모델링 기법으로 분석하였으며, 시기별로 다음과 같은 토픽이 나타났다.

제1기(사태 발생기)에는 ①수돗물 유충 문제 감지 ② 인천 수돗물 유충 논란 ③수돗물 유충 정체 확인 ④수 돗물 유충 불안 확산 ⑤수돗물 유충 청원 발생, 제2기 (사태 확산기)에는 ①지자체 정수장 실태 점검 ②수돗물 유충 신고 전국 확산 ③수돗물 유충 피해 보상 논란④전국 정수장 전수조사 진행 ⑤수돗물 유충 불안 확산 및 주민 대응, 제3기(사태 수습기)에는 ①전국 정수장 전수조사 결과 발표 ②인천 물 관리 부실 ③지자체별 상수도 안전 발표 ④수돗물 유충 부대 효과 ⑤수돗물 유충 추가 발견 토픽이 도출되었다.

이상과 같이 국내 최초로 발생한 ‘수돗물 유충’ 사태 토픽들을 통해 다음과 같은 시사점을 발견할 수 있다.

첫째, 수돗물 유충 사건을 중심으로 얽혀있는 다양한 맥락을 탐구하고 통합적인 안목을 형성하는 교육으로 환경문제에 대한 대응력을 기를 수 있도록 해야 한다. 수돗물 유충 사태의 전 시기에서 나타난 토픽들은 수질 환경 문제를 둘러싼 정부, 지자체, 국민들의 위기 상황을 경험하는 과정으로 나타난다. 수돗물 유충사태는 우리나라 수자원 관리의 축적된 지식에서 벗어난 전례없는 사건이다. 국민들은 일상생활 속에서 경험하거나, 건강과 직결되는 내용에 대한 관심과 앎의 욕구가 높다. 따라서 환경교육으로 지속가능한 삶의 토대를 만드는 수자원 이용에 대한 ‘알 권리’가 충족되어야 하고, 환경 적인 실천을 수반해야 한다. 제1기의 ‘논란’, ‘불안’과 관련된 키워드와 뉴스를 통해 볼 수 있듯이, 시민들은 과거 발생한 인천 붉은 물, 낙동강 페놀 유출사건 등으로 수질 안정성에 대한 불신감이 누적되어 있다. 제한된 정보로 인한 대중의 공포를 줄이기 위해 생활 환경교육 내용으로 정수장으로부터 집으로 공급되는 물의 정수 과정, 정수장의 운영과 정수처리 방법 등을 다룰 수 있다. 제2기와 제3기의 ‘실태점검’, ‘관리 부실’ 등의 토픽은 우리나라 수질 관리의 시스템의 보완 필요성을 나타 내며, 중앙과 지자체의 체계적인 관리와 기후위기 등변화하는 환경에서 지속가능한 수자원 관리를 위한 예방 차원의 역할에 대한 반성적 성찰이 필요하다. 이를 종합하여 환경에 대한 통합적 안목과 문제해결력을 기르기 위해 이재영(2016)이 제안한 ‘사건 중심 환경 탐구’를 환경교육 방법으로 활용할 수 있다. ‘사건 중심 환경 탐구’는 사건을 사유의 단위로, 사건에 얽혀있는 다양한 관계를 조망하여 환경문제에 대한 통합적인 탐구를 제안한다[20]. 수돗물 유충의 발생과 확산, 정부와 시민들의 대응 과정에 대한 심층 탐구로 통합적인 안목을 형성하여 향후 환경문제로 야기된 위기에 대응력을 기를 수 있다.

둘째, 인터넷 커뮤니티를 활용한 시민참여의 환경정보 공유와 환경감시 역할 부여가 필요하다. 수돗물 유충 사태의 ‘청원 발생’, ‘주민 대응’ 등의 토픽에서 볼 수있듯이, 시민들은 환경 이슈를 직접적으로 경험하면서 국가를 상대로 문제를 제기하고, 지역 커뮤니티에서 의견을 공유하며, 주체적으로 문제에 대응하는 모습을 보 였다. 특히 수돗물 유충 발생 후 일부 지자체와 관계자 들의 늑장 대응으로 인터넷 맘카페 등 지역 커뮤니티를 활용해 유충 발생 관련 현황을 알리는 글이 빠르게 확산되었다. 언론에서도 인터넷 맘카페 정보를 활용한 기사가 총 120건으로 전체 뉴스의 약 6% 비중을 차지하 였으며, 유튜브에는 수돗물 유충과 관련하여 시민들이 제작한 콘텐츠가 132개 등록되었다. 주로 수질 측정, 정수기능 실험, 정수장 현장, 샤워기 필터 제작 또는 제품 비교 등 시민들의 수돗물 유충 관련 유의미한 정보 생산과 공유, 대응 노력 등을 확인 할 수 있었다. 그러므로 환경문제가 발생했을 때 더 적극적으로 시민 환경 감시 역할을 부여할 수 있다. 이를 위해 수돗물 유충 발견, 신고 등의 구체적인 가이드를 제공하여 신속한 현황을 진단하고 대책을 수립할 수 있으며, 오인 신고를 줄이는데 기여할 수 있다.

셋째, 환경문제 발생 초기에 신속하고 정확한 정보 제공과 소통을 담당하는 환경 커뮤니케이이터의 양성및 배치가 필요하다. 수돗물 유충 사태의 ‘논란’, ‘불안 확산’ 등의 토픽에서 볼 수 있듯이, 환경문제 발생시 신속하고 정확한 정보 제공과 국민과의 긴밀한 소통은 논란과 불안을 최소화하고 위험을 정확하게 인식시켜 효과적인 대응을 할 수 있다. 즉, 수돗물 유충 제1기인 사태 발생기를 살펴보면, 유충 발견 신고 후 2~3일만에 청와대 국민청원이 접수되고, 1만 1천명 이상이 동의하며 국민들의 불안과 분노에 대한 내용이 초기에 집중적으로 나타난다. 이는 수돗물 유충(깔따구)의 객관적인 유해성이 밝혀지지 않은 상황과 비교하여 국민들에게 ‘인식된 위험’의 영향에 주목할 필요가 있다. 뉴스 미디어에서 얻어지는 정보의 신뢰도가 타 정보원보다 높은 점[21]을 고려할 때, 국민들이 언론에서 제공하는 타당한 정보를 바탕으로 위험에 대한 객관적인 인식을 형성 하는 것이 중요함을 알 수 있다. 따라서, 사태 발생 초기부터 환경 정보를 쉽게 전달하고, 진행상황에 대한 투명한 공유를 담당하는 환경 커뮤니케이션 관련 전문 그룹의 양성 및 배치로, 심리적 공포감을 낮추고 사태를 직면하여 적절한 대응방안을 모색하는데 기여할 수있다.

본 연구는 ‘수돗물 유충’ 관련 뉴스 빅데이터를 기반으로 국내에서 처음으로 토픽 모델링 분석기법을 활용 하여 분석한 연구로써, 비정형 데이터로 나타나는 환경 관련 이슈를 실증적이고 체계적으로 분석했다는 학술적 의의가 있다. 또한, 사건을 중심으로 한 환경교육, 온라인 커뮤니티를 활용한 시민 감시 역할, 전문적인 환경 커뮤니케이터의 양성 및 배치의 필요성을 제시했다는 정책적 의의를 지닌다.

본 연구의 제한 및 제언사항은 다음과 같다.

첫째, 언론에서 보도하는 뉴스만을 분석 대상으로 삼아, 정부-미디어-시민으로 이어지는 환경 커뮤니케이션의 전체적인 순환 과정을 담아내는 데에는 제한이 있었 다. 추후 정부의 보도자료, 시민들의 SNS 콘텐츠에 담겨 있는 환경 관련 비정형 데이터를 포함하여 분석을 수행한다면 더욱 의미있는 함의를 도출할 수 있을 것이다.

둘째, 본 연구는 수돗물 유충이 최초 신고된 2020년 7월 13일부터 합동정밀조사단의 조사결과 발표 후 보도빈도가 감소한 8월 31일까지를 분석기간으로 삼았다. 그러나 2020년 10월 23일 현재까지도 제주도에서 수돗물 유충 사태가 발생해 국정감사에서 논의되는 등아직도 수돗물 유충사태가 진행 중임을 고려할 때, 분석기간을 더욱 확대하여 분석한다면 수돗물 유충 사태 에서 나타난 의제를 더욱 단계적이고 심층적으로 분석하여 정책적 함의를 제시할 수 있을 것이다.

셋째, 본 연구에서는 토픽 모델링 분석 방법을 통해 토픽을 구성하는 주요 키워드를 출현비율에 따라 군집 화하여 의제를 파악했으나, 토픽별 주요 키워드 간에 연결된 의미관계를 파악하는 데에는 한계가 존재한다. 추후 연구에서는 주요 키워드 간의 네트워크를 파악하는 의미연결망 분석을 병행하여 활용한다면 토픽별 의미를 더욱 정교하게 도출할 것으로 예상된다.

넷째, 본 연구에서는 토픽의 수를 정할 때 토픽이 얼마나 정확하게 분류되는 지를 파악하는 복잡도(perplexity) 등의 지수를 활용하지 않고, 연구자가 복수의 토픽 수를 기준으로 도출된 결과를 바탕으로 해석가능성과 토픽 분류의 적합성을 고려하여 토픽의 수를 정하였다. 추후 연구에서는 복잡도 지수를 적용하여 분석을 수행 한다면 좀 더 실증적인 토픽 분석 결과가 나타날 것이다.

References

  1. 김주영, "'붉은 수돗물' 터진 인천, 이번엔 '유충 보인다'," 세계일보, 2020.7.13.
  2. 환경부, "인천 외 지역 유충 발생 민원 312건은 외부유입사례," 환경부 보도자료, 2020.7.30.
  3. 환경부, "전국 정수장‧배수지 청결 등 위생상태 긴급점검," 환경부 보도자료, 2020.7.17.
  4. 백순영, "'수돗물 유충' 사태 전국으로… 원인과 유해성은-," YTN, 2020.7.21.
  5. 천권필, "환경부 장관 '수돗물 유충, 국민 눈높이에서 수질기준 초과' 사과," 중앙일보, 2020.7.22.
  6. 배재성, "'수돗물 유충' 불안 전국 확산, 물 관리 혁신으로 신뢰 높여야," KBS, 2020.7.22.
  7. 김미경, "김종인 '수돗물 유충, 솔직히 창피스러운 일', 이해찬 '수돗물 정상화 시급'," 디지털타임스, 2020.7.22.
  8. 김성태, 이창호, "공적 이슈에 대한 미디어 보도 분석 (수돗물 관련 기사를 중심으로)," 한국언론정보학보, 제39호, pp.40-69, 2007.
  9. 홍영식, 이덕로, "인천 상수도 사태의 이슈 특성과 향후정책 변동 가능성 연구(매스미디어 분석을 중심으로)," 한국지방공기업학회보, 제15권, 제2호, pp.23-48, 2019.
  10. 김지윤, 도윤호, 주기재, 김은희, 박은영, 이상협, 백명수, "수돗물 이용에 대한 국내 연구동향과 사회적 인식," 생태와 환경, 제49권, 제3호, pp.208-214, 2016.
  11. 환경부, 상수도 통계, 2018.
  12. 류재나, 황상일, 김호정, 이병국, 이영경, 정아영, 물 환경 서비스와 물 인프라의 지속가능성 평가(V), 환경정책평가연구원, 2018.
  13. 성하영, "수돗물 바이러스 논쟁(바이러스의 실재와 위험 인식의 구성)," 과학기술연구, 제7권, 제2호, pp.125-154, 2007.
  14. 서이종, "환경 문제의 '과학기술과 사회'적 형성과정 (수돗물 바이러스 논쟁을 중심으로)," 환경사회학연구 ECO, 통권, 제1호, pp.64-91. 2001.
  15. 황용석, 이준웅, 손동영, 김상민, 유경한, 최세정, 김익현, 김대원, 박령주, 백영민, 이상엽, 성윤택, 데이터시대의 언론학 연구, 커뮤니케이션북스, 2017.
  16. 김태종, "뉴스 빅데이터를 활용한 코로나19 언론보도 분석," 한국콘텐츠학회논문지, 제20권, 제5호, pp.457-466, 2020. https://doi.org/10.5392/JKCA.2020.20.05.457
  17. 정원준, 김대욱, 윤호영, 이형민, 박진우, 김동성, 손영곤, 전홍식, 천용석, 정유미, 박종구, 빅데이터의 분석방법과 활용, 학지사, 2020.
  18. D. M. Blei and J. D. Lafferty, "Topic Models," Text Mining: Classification, clustering, and application, Vol.10, No.71, pp.1-34, 2009. https://doi.org/10.1201/9781420059458.ch1
  19. W. Zhao, J. Chen, and W. Zen, "Best Practices in Building Topic Models with LDA for Mining Regulatory Textual Documents," CDER 9Th November, 2015.
  20. 이재영, 사건 중심 환경 탐구, 공주대학교 출판부, 2016.
  21. 양성관, 양성운, "뉴스 미디어 신뢰도가 뉴스 수용자의 위기지각에 미치는 영향(위기에 관한 수용자의 관여도 조절효과를 중심으로)," 한국언론학보, 제47권, 제6호, pp.279-305, 2003.