1. 서론
1.1 연구배경 및 목적
한 사회에서 정책적 이슈가 실제 정책으로 추진되기까지는 몇 가지 단계가 필요하다. 일상적인 문제가 많은 사람으로부터 관심을 받고 정책적인 쟁점이 되기 위해서는 이와 관련한 중요한 사건들이 일어나야 하고[2], 사람들의 관심이 커지고 여론화되며, 정책의 필요성이 제기되는 과정을 거쳐야 한다. 인터넷의 등장 이후에는 웹·모바일의 온라인 공간에서 다양한 소통이 이뤄지면서 여론이 형성되고 정책이 제안되는 과정이 나타나기도 한다[3].
ICT(Information and Communication Technologies) 정책의 형성과정도 마찬가지다. 1990년대 초반 본격화된 ICT 정책은 초기에는 초고속정보통신 인프라 구축 및 고도화, 성장동력 발굴, 전략 수립 등 정부 주도적 정책이 주를 이뤘다[4,5]. 그러나 ICT에 대한 사람들의 관심이 증가하고 인터넷이 등장하면서 소셜미디어를 통한 소통 활동이 늘어나는 과정을 거치며 ICT 정책에 관한 이슈도 온라인을 통해 논의되기 시작했다. 엘리트 집단과 정책결정자만의 의제로 여겨져 온 ICT 정책 이슈가 온라인 공론의 장의 논제로 거론되어 정책으로 형성되는 환경이 마련된 것이다.
본 연구는 ICT 정책 이슈가 형성되는 양상을 분석하는 데 있어 온라인 공간에서 축적되는 소셜 빅데이터(Social Big Data)를 활용하는 방법을 제안한다. 구체적으로 정책 형성의 가능성과 요인들을 설명한 격발 메커니즘(Triggering Mechanism)의 개념을 활용하여, 온라인에서 정책 이슈가 실제 정책으로 정착하는 데 영향을 미친 변인들을 수치화하는 방식과 분석 결과의 제시를 위한 필수적인 요소들을 제안하는 것이다.
ICT 정책의 경우, 1) 명확한 키워드(기술이나 서비스 명칭)가 포함된 경우가 많고, 2) 엘리트 집단이 먼저 제기한 이슈가 공중의제로 확산하는 경우가 일반적이며, 3) 사회적 관심을 얻게 되면 그 확산이 빠르게 이루어진다. 따라서 소셜 빅데이터를 활용하기에 적합한 정책적 이슈로 판단했기 때문에, 더욱 유용한 방법적 틀을 제시할 수 있을 것으로 보았다.
1.2 연구방법 및 내용
본 연구의 목적은 다소 관념적인 개념이라고 할 수 있는 ICT 정책 격발 메커니즘에 대해 계량화된 분석 방법과 분석결과의 표준화된 제시방식을 제안하는 데 있다.
이를 위해 ICT 정책의 특성과 형성 방식의 변화를 먼저 살펴보았으며, 기존 연구들을 통해 정책 격발메커니즘을 다룬 연구들의 방법론을 살펴보았다. 또한, 빅데이터의 등장과 소셜 빅데이터의 분화 과정을 살펴보고 분석적인 차원에서 소셜 빅데이터의 차별점을 도출해보고자 했다.
아울러, 기존 연구들에서 발견된 정책 격발 메커니즘의 개념과 조작적 정의를 기반으로 ICT 정책의 격발 메커니즘 분석을 위한 측정 변인과 분석 절차를 제안했다. 제안된 측정 변인과 분석절차는 현시점에서 정책연구에 적용할 수 있는 소셜 빅데이터의 수준을 고려하여, 분석할 수 있는 데이터와 가능한 분석 결과 제시방식을 중심으로 설명했다.
마지막으로 결론과 본 연구의 제한점을 제시했다. 본 연구는 기존에 제시된 정책 격발 메커니즘의 개념을 소셜 빅데이터 수치로 치환하고 이를 통해 새로운 방법적 틀을 제시한다. 따라서 소셜 빅데이터를 활용하는 방식으로 수행하는 정책연구의 가능성과 그 한계점을 중심으로 결론의 내용을 기술했다.
2. ICT 정책 형성 방식의 변화와 정책 격발 메커니즘
2.1 ICT 정책 형성 방식의 변화
정책적 이슈가 실제 정책으로 결정되는 과정은 정책의제(Policy Agenda)의 형성과정을 통해 설명할 수 있다. 정책 이슈가 의제 모집단(Agenda Uni- verse)에 모이게 되면 이 중 공공영역에서 관심을 얻는 공공의제(Public Agenda)가 만들어지고 정책의 검토단계에 이르는 정부 의제(Government Agenda) 단계를 거쳐 결정 의제(Decision Agenda)로 정책이 형성된다는 것이다[6]. 인터넷 네트워크를 통한 소통이 늘어나면서는 ‘의제 모집단→공공의제→정부 의제→결정 의제’의 각 단계로 발전하는데 온라인 공간에서의 이슈 확산이 큰 영향을 미쳤다[1]. 인터넷이 매개된 미디어 환경으로 인해 정책적 의제가 최종적인 정책으로 결정되는 과정에서 개인의 의견이 모인 공중의제가 더욱 영향을 미치게 된 것이다[7, 8, 3].
ICT 정책이 형성되는 양상도 변화하고 있다. 1994 년 정보통신부 설립과 동시에 본격화된 ICT 정책의 형성모델은 엘리트 집단이 정책의제를 주도하는 하향식(Top-Down) 모델[9]이 주를 이뤘다. 최첨단 기술과 관련 정보를 토대로 형성되는 정책의 특성상 전문가에 의해 이슈가 제기되고 매스미디어(Mass Media)에서 이를 부각하여 정부의 최종 결정이 이뤄지는 형태였다. 하지만, 인터넷이 등장하고 소셜미디어 형태의 서비스가 등장하면서는 ICT 정책도 온라인 공중의제의 단계를 거친다. 엘리트 집단에 의해 제기된 이슈들이 정부에 의해 정책 이슈로 선점되고 법률안 마련, 정책사업 계획수립 등의 단계를 거치면서 공중의제로 검증되어 정책으로 최종 결정되는 과정이 정착되었다[1]. 엘리트 집단의 전유물로만 여겨졌던 ICT 정책 이슈가 온라인 공중의 참여로 더욱 심층적으로 논의되고 검토되는 과정을 거치게 된 것이다.
2.2 정책 격발 메커니즘 관련 연구
정책 분야에서 격발 메커니즘(Triggering Me- chanism)은 정책 형성에 영향을 미치는 요소들을 통해 정책 형성의 과정을 설명한 개념이라고 할 수 있다. 사회적으로 논의되는 이슈가 정책으로 변모하는 과정에서 다양한 변인들이 영향을 미친다는 가정하에 이러한 변인들을 통해 정책이 형성되는 양상을 설명하는 개념이다. 예를 들어, 공중의 의견이 정책으로 정착하는 이른바 격발의 단계에 이르려면 이슈의 확산 범위(Scope), 시간(Time), 강도(Intensity), 자원(Resource) 등이 영향을 미칠 수 있다는 것이다[2]. 정책의 창(Policy Window)의 개념에서는 정책이 추진되는 창이 열리는 상태에서 격발 메커니즘이 작동된다고 설명한다[10]. 정책이 추진되는 동력이 마련되는 시점에 정책의 창이 열릴 수 있는데, 정책의 창이 열려있는 시기를 놓치게 되면 정책이 격발되는 메커니즘도 작동을 멈추게 된다.
이처럼 특정한 사건이 정책적 이슈로 변모하는 과정에서 촉매제(Catalyst)적 요소들을 살펴볼 경우, 커뮤니케이션 형태에 따른 정책 형성의 양상을 조망할 수 있고 다양한 미디어 발전 양상에 따른 정책형성의 변화를 예측할 수 있다. 이를 통해 정책 격발의 메커니즘 형태도 세분화가 가능하다.
그러나 학술연구 분야에서 정책 격발 메커니즘의 개념을 활용한 연구는 정책이 격발된 사건에 초점을 맞춘 연구가 사례연구(Case Study)가 주를 이룬다[11,12]. 정량적 데이터를 통해 정책 격발 메커니즘의 요소들을 도출하고 이를 통해 함의를 발견하는 연구는 부재하다. 격발 메커니즘의 요소들을 수량화하고메커니즘의 유형을 이론화하는 연구도 찾아보기 어렵다. 오늘날 웹과 모바일을 통해 다양한 이슈 확산 방식이 생겨나고 있음에도, 특정한 정책적 이슈가 어떠한 커뮤니케이션·미디어적 특성을 통해 확대 재생산되고 정책으로 결정되는지 정량적 분석 틀을 제시하고 이를 활용해 연구한 사례는 발견되지 않는 것이다.
3. 소셜 빅데이터의 분석적 특징
3.1 빅데이터 등장과 소셜 빅데이터 분화
빅데이터(Big Data)는 1990년대 후반 인터넷의 등장과 함께 맥을 같이 하는 개념이다. 인터넷 네트워크를 통해 디지털화된 정보의 생산이 증가하고 연산력(Computing Power)을 통한 정보처리 속도가 점점 빨라지면서 기존 데이터 개념은 ‘빅’데이터로 재개념화되기 시작했다.
빅데이터는 데이터에 대한 수집·분석·활용의 차원에서 기존의 데이터와 비교할 수 없을 정도로 대규모의 집합체이다. 따라서 빅데이터는 거대한 ‘규모(Volume)’를 바탕으로 다종의 데이터 종류를 포함하는 ‘다양성(Variety)’, 연산력이 접목되어 가속화되는 생산‧분석의 ‘속도(Velocity)’, 데이터 포맷이나 처리단계에서의 ‘복잡성(Complexity)’이 주요한 특성으로 설명된다[13]. 이처럼 빅데이터의 개념이 등장하면서 인터넷 공간에서 생산되는 커뮤니케이션 메시지, 소셜 네트워크, 뉴스 리포팅 등에 대한 빅데이터[14]가 분석적 가치를 띄게 되었다.
이어 2000년대 초반 스마트기기의 확산과 함께 성장한 소셜미디어는 빅데이터와 차별화된 개념으로 ‘소셜 빅데이터’가 생겨나는 계기를 만든다. 소셜미디어를 통해 텍스트‧동영상‧이미지의 콘텐츠 데이터와 이를 조회·저장·추천·공유하는 이용 데이터가 폭발적으로 증가하면서, 빅데이터로부터 소셜 빅데이터의 개념이 분화되기 시작한 것이다[15,16].
3.2 분석 차원에서 소셜 빅데이터 차별점
3.2.1 인게이지먼트
인게이지먼트(Engagement)는 관련성, 관여도, 상호작용, 행동 유도 등의 개념을 포함하며[17], 미디어 분야에서 인게이지먼트는 미디어를 활용한 적극적인 참여를 의미한다[18]. 콘텐츠에 대한 이해, 관여, 관심, 선호, 신뢰, 만족 등 소비자 마음의 다양한 측면을 측정하는 다차원적 개념인 것이다[19].
소셜미디어에서는 이용자들이 다양한 포맷의 콘텐츠에 대한 반응하며 그 흔적을 남길 수 있다. 게시글·댓글을 작성하는 행위부터 콘텐츠를 조회하고 공유하며 ‘좋아요’를 남길 수 있는데, 소셜미디어에서 이러한 행위는 인게이지먼트의 한 형태라고 할 수 있다. 그리고 이러한 인게이지먼트 데이터는 소셜미디어 이용 과정에서 대규모의 소셜 빅데이터로 축적된다. 즉, 소셜 빅데이터는 미디어 이용자의 적극적인 참여가 축적된 데이터로, 인게이지먼트를 수량화된 데이터로 분석할 수 있다는 측면에서 차별점이 있다.
3.2.2 비정형‧반정형 데이터
소셜 빅데이터에는 비정형 데이터(Unstructured Data)와 반정형 데이터(Semi-Structured Data) 가포함되어 있는데[20], 이러한 비정형·반정형 데이터를 정형화된 데이터로 수치화하여 분석할 수 있다는 차원에서도 의미가 있다고 볼 수 있다.
소셜미디어에서 다양한 커뮤니케이션 내용은 텍스트 데이터로 생산되는데, 이러한 비정형·반정형 형태의 텍스트 데이터는 자연어 처리기술을 통해 정형화되고[21] 정형화된 데이터는 형태소 단위로 분리하여 구체적인 의미분석을 시도할 수 있다. 형태소는 텍스트에 대한 수량화된 분석을 시도할 수 있는 최소단위의 개체로, 이러한 형태소의 수량, 유형, 관계, 군집 등을 분석하여 다양한 소셜미디어의 내용을 추론할 수 있다.
3.2.3 맥락적 내용
소셜 빅데이터는 웹·모바일 네트워크에서 확산하는 이슈에 대해 맥락적 내용(Contextual Content)을제공해주기도 한다.
오늘날 대부분의 웹·모바일 서비스는 소셜미디어 소통 방식의 서비스 메뉴를 제공하고 있다. 소셜미디어 이용자가 특정한 콘텐츠에 대해 제시하는 의견을 다양한 방식으로 표출할 수 있도록 돕고 있다. 따라서 소셜미디어의 범주에는 정보교환의 형태에 따라 포털사이트, 뉴스, 블로그, 커뮤니티, SNS(Social Network Service), 동영상 제공 서비스까지 포함된다[22].
소셜미디어의 범주가 확장됨에 따라 소셜 빅데이터가 수집되는 공간과 소셜 빅데이터의 형태도 다양해진다. 그래서 소셜 빅데이터의 수집공간과 형태의 다양화는 정책 이슈의 내용분석 과정에서 맥락적 분석에 필요한 조건을 만든다. 하나의 정책적 이슈가 확산하는 과정에서 확산 공간, 확산 형태, 확산 내용 등을 종합적으로 분석할 수 있도록 모든 데이터가 수집되기 때문이다.
4. ICT 정책 격발 메커니즘 측정 변인 및 분석 결과 제시방식 제안
ICT 정책에 있어 격발 메커니즘은 소셜 빅데이터의 분석적 특징을 활용하여 더욱 계량화된 분석을 시도할 수 있는 유용한 개념이다. 실제 분석을 위해서는 격발 메커니즘의 측정 변인을 수치로 개념화하고 분석결과 제시를 위해 필요한 요소들을 제안하는 등의 시도가 필요하다.
4.1 변인의 개념설정 및 조작적 정의 제안
본 연구에서 제안하는 정책 격발 메커니즘 변인은 Gerston[2]이 언급한 ‘정책적 사안들이 공적 반응을 일으키는데 필요한 요소’의 개념과 이에 대해 최홍규[1,23]가 시도한 조작적 정의를 기반으로 설정하였다. 현시점에서 정책연구에 적용할 수 있는 소셜 빅데이터 수준을 고려하면서, 상대적으로 정책 키워드가 명확히 도출되는 ICT 정책 격발 메커니즘의 변인들을 제시하고 이를 수치화해보고자 했다.
4.1.1 범위
하나의 정책적 이슈가 정책으로 결정되고 본격적으로 추진되기 위해서는 많은 사람의 관심을 얻어야 한다. 소셜미디어에 정책적 이슈가 확산한다면 더 많은 채널에 확산하여야 그 정책적 이슈가 정책으로 결정될 가능성이 더 커진다.
정책 격발 메커니즘에서 범위(Scope)는 정책적 이슈가 확산하는 공간의 크기로 개념화할 수 있다. 정책에 의해 영향을 받을 수 있는 정책대상의 규모로도 볼 수도 있다[2]. 따라서, 소셜미디어의 얼마나 많은 채널에서 얼마나 많은 이슈가 확산하고 있는지를 측정하여 범위의 정도를 도출할 수 있다.
범위를 측정하기 위한 소셜미디어 채널은 SNS, 블로그, 커뮤니티, 뉴스, 동영상 제공 서비스 등으로 설정할 수 있다. 채널은 상위 단계에서 하위 단계까지 채널 설정이 가능하다. 가령 SNS의 경우 페이스북(Facebook), 인스타그램(Instagram), 트위터(Twitter) 와 같은 서비스 단위가 상위 채널이라면 해당 서비스에서 활동하는 이용자(인플루언서, Influencer)는 하위 채널이라고 할 수 있다. 분석수준별 소셜미디어 채널 사례들은 각 소셜미디어 서비스에 따라 구분할 수 있다(Table 1).
Table 1. Classification of Social Media Channels by Analysis Level.
범위를 측정하기 위한 공식은 소셜미디어에서의정책 이슈 ‘채널 확산력(Channel Diffusion, CD)’을통해 설정할 수 있다. 채널 확산력은 정책 이슈가 언급된 채널들을 합산하여 계산한다. 또한, 소셜미디어 채널이 정책 이슈를 담고 있는가에 대한 여부는 하나 이상의 문장을 포함한 메시지(Message)나 문서(Document)가 포함되었는지로 확인한다. 해당 메시지나 문서 안에 정책 이슈를 담은 키워드(Key-word)가 포함되어 있다면 정책 이슈를 포함하는 것으로 간주한다.
\(C D=c d_{1}+c d_{2}+c d_{3}+\cdots+c d_{n}\) (1)
cd: Channel diffusion power of social media channels where policy issues have spread
정책 이슈를 포함한 정도에 따라 소셜미디어 채널별로 확산력이 차별화될 수 있다. 따라서 각 소셜미디어 채널의 확산력 정도는 정책 이슈가 포함된 메시지나 문서의 빈도, 키워드가 도출되는 빈도를 합산하여 그 수준을 정할 수 있다.
\(\alpha d=\sum_{i=1}^{n} m_{i}+\sum_{i=1}^{n} k_{i}\) (2)
m: Frequency of messages(documents) mentioning keywords related to policy issues
k: Frequency of keywords related to policy issues
4.1.2 지속성
지속성(Duration)은 시간이 흐를수록 정책 이슈가 얼마나 지속하여 확산하는지를 보여주는 개념이다. 미디어가 특정한 사회적 이슈에 대해 과잉보도(Media Hype)하면 관련 정책에 영향을 미칠 수 있는데[24], 보도되는 시간이 투입되는 만큼 여론 형성이 용이하기 때문이다. 소셜미디어 공간에서도 정책 이슈가 끊임없이 논의되고 관련 키워드가 노출된다면 여론과 정책 형성의 기폭제로 작용할 수 있다.
정책 이슈의 확산과정에서 지속성은 시간의 흐름에 따라 이슈 확산의 일관성이 발견되어야 효과가 있다고 판단할 수 있다. 따라서 자기상관 계수(Au- tocorrelation Coefficient, AC)의 공식을 활용하여 수치화하는 방법을 제안할 수 있다[1]. 분석 시점을 특정하여, 해당 시점의 전후로 정책 이슈와 관련한 키워드의 빈도를 산출하여 자기상관성을 측정한다.
\(A C_{x_{t} x_{\mathrm{t}-1}}=\frac{\sum_{t=2}^{n}\left(x_{t}-\overline{x_{t}}\right)\left(x_{t-1}-\overline{x_{t-1}}\right)}{s_{x_{t}} s_{x_{t-1}}}\) (3)
xt: Frequency of keywords (x) related to policy issues at a specific point in time (t)
xt-1: Frequency of keywords (x) related to policy issues prior to a specific point in time (t-1)
\(\overline{x_{t}}, \overline{x_{t-1}} \text { : Mean of } x_{t}, \text { Mean of } x_{t-1}\)
\(\begin{aligned} s_{x_{t}}, s_{x_{t-1}}: & \text { Standard deviation of } x_{t}, \text { Standard de } \\ & \text { viation of } x_{t-1} \end{aligned}\)
자기상관계수를 통해 정책 관련 키워드 빈도와 시차 변수와의 상관성을 입증할 수 있다. 각 정책 이슈 관련 키워드들이 신뢰구간 내에서 발견되는 자기 상관계수를 측정하면, 해당 시점 이후에도 정책 관련 이슈가 지속하여 확산할지 판단할 수 있다.
4.1.3 상호작용성
소셜미디어라는 개방된 공간에서는 다수 이용자의 참여를 통해 정보공유가 이뤄진다. 따라서 다양한 상호작용을 통해 폭넓은 정보를 습득하거나 특정 사안에 대한 깊은 이해가 가능하다[25]. 소셜미디어 채널에서 다양한 이용자들이 상호작용을 한다면, 정책형성에 긍정적 영향을 미칠 수 있다.
상호작용성(Interactivity)은 정책 이슈가 확산하면서 소셜미디어 채널 간 상호작용을 나타내는 개념으로 제안할 수 있다. 하나의 정책 이슈가 소셜미디어 채널을 확장해가며 확산하는 정도를 나타낸 것이다.
상호작용성을 수치화하기 위해 상관관계 계수(Correlation Coefficient)를 활용할 수 있다[1]. 소셜미디어 채널 내에서 확산한 정책 이슈 관련 키워드(yi)가 타 채널에서 동일한 키워드(xi)로 얼마나 등장하는지 분석하고 이를 통해 채널 간 상관성(cxy)이나타나는지 측정하는 것이다.
\(C_{x y}=\frac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{(n-1) s_{x} s_{y}}\) (4)
xi: Frequency of keywords related to policy issues on social media channels (x) at a specific point in time (i)
yi: Frequency of keywords related to policy issues on social media channels (y) at a specific point in time (i)
\(\bar{x}, \bar{y}: \text { Mean of } x, \text { Mean of } y\)
sx, sy: Standard deviation of x, Standard deviation of y
4.1.4 다양성
디지털화된 공간에서의 의견 다양성은 관용을 증가시키고 반대주장에 대한 이해력을 높인다[26,27]. 정책 이슈 분석을 위해 다양성(Diversity)은 소셜미디어 공간에서 하나의 정책 관련 이슈가 얼마나 많은 주제의 정책 이슈들을 포괄하는지를 보여주는 개념으로 제안할 수 있다. 정책 이슈가 포괄하는 내용이 다양하면 정책적 사안에 대한 관점도 다각화될 수 있다. 따라서 다양성의 수치가 높은 정책적 이슈는 그만큼 실제 정책으로 추진될 수 있다고 판단한 것이다.
소셜미디어에서 다양성은 텍스트의 내용을 주제별로 묶어 분석하는 토픽모델링 개념을 활용할 수 있다. 그중에서도 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 모형[28]을 통해 하나의 정책 이슈에 대한 토픽의 개수(T)를 구하여 주제의 다양성을 살펴볼 수 있다.
토픽의 숫자를 산출한 후에도 몇 가지 수치를 통해 다양성 정도의 추가적인 해석을 시도할 수 있다. LDA 모형에서는 토픽 내에서 키워드가 도출될 확률을 베타(β)로 표기하는데, 만일 한 주제에 속한 키워드들의 베타(β) 값 평균이 높고 표준편차가 낮으면 토픽을 구성하는 내용의 다양성 정도가 클 것으로 추정한다. 또한, 토픽 간 매개 키워드의 숫자가 적을경우, 토픽 간 연결성이 낮아 해당 정책 이슈의 다양성 정도가 높은 것으로 해석할 수 있다.
\(T=t_{1}+t_{2}+t_{3}+\cdots+t_{n}\) (5)
t: Topics derived through policy keywords
4.1.5 주목도
본 연구에서 제안하는 주목도(Attention)의 개념은 미디어 영역에서 논의된 바 있는 ‘지각적 선택(Perceptual Selection)’의 정도를 수치화한 개념이라고 할 수 있다[1]. 특정한 시점과 시점 사이에 얼마나 많은 사람이 정책 이슈를 검색하거나 생산해내는가를 가늠하는 지표다.
주목도를 측정하는 방법은 텍스트 데이터를 추출하는 방식 중 하나인 크롤링(Crawling) 기법에서 착안할 수 있다. 크롤링을 위한 소프트웨어인 크롤러(Crawler)를 특정한 시간 간격으로 동작시키면 텍스트 데이터를 수집한 시간 간격을 계산할 수 있다. 따라서, 주목도는 크롤러가 동작하여 키워드를 수집한 시점의 평균값\((\overline{C R})\)을 측정하여 산출할 수 있다. 평균값이 높을수록 주목도가 낮은 키워드인 것으로 해석할 수 있다.
\(\overline{C R}=\frac{\sum_{i=1}^{n} C R_{i}}{n}\) (6)
CRi: Value at the time (i) the keyword was crawled
\(\overline{C R}\): Mean of values at the time (i) the keyword was crawled
이처럼 특정 정책 이슈에 대한 주목도는 정책 이슈를 구성하는 키워드들의 크롤링 시점을 평균화 (\(\overline{C R}\))하여 비교할 수 있다. 크롤링 시점을 표준화한 수치의 평균값이 낮고 동시에 표준편차도 낮은 경우에 주목도가 상대적으로 높은 정책적 이슈로 판단할 수 있다. 단, 크롤러가 동작하는 시점에 특정한 이슈 생산이 폭증하는 경우 해당 데이터는 제외 후 측정한다.
4.1.6 선호도
선호도(Preference)는 특정한 정책 이슈를 선호하는 정도를 나타내는 개념이다. 특정한 정책 이슈에 대한 인지와 채택의 차원을 넘어 호감의 정도를 가늠할 수 있는 개념을 선호도로 명명할 수 있다.
온라인 커뮤니케이션의 내용을 분석하는 것 이외에 이를 읽고 해독하는 이용자의 선호도에 대한 측정이 가능해진 데에는 이용자 참여를 기반으로 하는 소셜미디어 등장의 영향이 컸다. 소셜미디어에서는 이용자가 콘텐츠를 조회·저장·추천·공유하는 과정에서 적극적인 참여가 일어나며 선호도가 표출되기 때문이다. 즉, 이용자 인게이지먼트를 통해 표출된 선호도를 소셜 빅데이터로 분석할 수 있는 환경이 만들어졌다.
선호도(P)를 도출하기 위해서는 이용자 참여를 통해 생산된 데이터를 수집할 수 있어야 한다. 이렇게 수집된 인게이지먼트 데이터 중에서 이용자가 콘텐츠에 대해 ‘좋아요’를 누르거나(l), 콘텐츠를 누군가에게 공유하는(s) 빈도를 통해 선호도를 도출한다.
\(P=l+s\) (7)
l: Frequency of ‘Likes’ on policy issues
s: Frequency of policy issues shared
선호도를 측정할 때, 정책 이슈에 대한 최소 단위는 정책 관련 키워드가 포함된 메시지나 문서이다. 해당 메시지나 문서에 ‘좋아요’가 눌렸거나, 메시지나 문서가 공유된 숫자를 계산하여 선호도를 측정하는 것이다.
4.1.7 변형성
소셜미디어 공간에서 확산하는 정책 이슈의 유형은 텍스트(Text) 형태로만 국한되지 않는다. 커뮤니케이션 형태가 사진과 그림 등의 이미지(Image), 동영상(Video) 등의 콘텐츠로 변형되어 이슈가 확산하는 경우도 발생하기 때문이다.
본 연구에서 제안하는 변형성(Transmutability) 은 정책 이슈가 어떠한 형태로 확산할 수 있는지 그 가능성을 나타내는 개념이다. 이는 단순히 텍스트, 이미지, 동영상 각각의 형태로 콘텐츠가 확산하는 정도를 양적으로 설명한 개념이 아니다. 만일 하나의 정책 이슈가 텍스트(혹은 이미지나 동영상) 형태의 콘텐츠로 확산할 경우, 해당 콘텐츠가 다른 형태의 콘텐츠로 변형될 가능성을 보여주는 개념이다.
변형성(TR)을 도출하기 위해서는 텍스트, 사진, 그림 등 유형별 콘텐츠에 딸린 제목과 설명글 데이터를 활용한다. 하나의 콘텐츠가 하나의 정책 이슈와 하나의 키워드만을 담고 있다고 전제하고 측정한다. 이 전제를 바탕으로 정책 이슈를 포함한 콘텐츠의 한 유형에서 평균적으로 몇 건의 콘텐츠가 생산되는지 이를 통해 변형성 수치를 도출한다.
\(T R=\frac{\sum_{i=1}^{n} p c_{i}}{c t}\) (8)
pt: Content including policy issues
ct: Number of content types including policy issues
4.2 분석결과 제시방식 제안
소셜 빅데이터는 워낙 그 범위와 내용이 방대하므로 이를 활용한 정책연구의 과정에서는 명확한 기준을 통해 분석결과가 제시되어야 한다. ICT 정책의 격발 메커니즘을 연구하는 과정에서도 ICT 정책연구의 특수성을 고려해 분석결과 제시방식을 제안할 수 있다.
4.2.1 데이터 수준에 따른 결과 해석
소셜 빅데이터를 통해 정책을 분석할 경우 데이터 수준을 사전에 결정하면 보다 구체적인 정책의 확산내용을 해석할 수 있다. 데이터 수준은 ‘정책 아이템(Policy Item)’, ‘정책 이슈(Policy Issue)’, ‘정책 키워드(Policy Keyword)’로 구분이 가능하다(Fig. 1). 정책 아이템은 정책 관련 내용 전체를 포괄하는 데이터이며 정책 이슈들의 집합이다. 그 하위 수준에서는 정책 이슈가 다양한 정책 키워드를 포함한다. ICT 정책은 기술·서비스 개발, 인프라 구축, 산업환경 조성 등의 이슈와 맞물리는 경우가 있다. 따라서, 하나의 정책 키워드가 정책 이슈나 정책 아이템과 같은 형태의 텍스트로 형성되는 경우도 가능하다.
Fig. 1. Level of policy-related data analyzed through social big data.
4.2.2 수집‧분석 시점 및 시점 간 차이 제시
소셜 빅데이터 분석과정에서 데이터가 수집된 시점과 분석을 시도하는 시점 간에 데이터의 수치와 내용이 크게 변경되는 경우가 발생한다. ICT 정책의 경우에도 정책의 방향성이 달라지거나, 특정한 이슈의 사실확인 절차가 진행된다면 데이터 내용이 바뀔 수 있다. 따라서 연구를 위해 데이터를 분석하는 시점과 데이터가 수집된 시점을 제시하고 해당 시점 간에 변경된 데이터의 내용을 제시할 필요가 있다. 시간의 흐름에 따라 소셜 빅데이터가 수집된 시점의 데이터 집합(Dc)과 분석을 시도한 시점의 데이터 집합(Da)을 명명하고(Fig. 2), 실제 분석결과를 제시하는 시점에서 해당 데이터 집합의 특징을 수치로 제시하는 방법을 제안할 수 있다.
Fig. 2. Data set at the time of data collection and presentation of analysis.
4.2.3 가비지 수준 설정
방대한 양의 소셜 빅데이터 속에는 언제나 쓸모없는 가비지(Garbage) 데이터가 존재할 가능성이 있다. 특히, ICT 정책 이슈 안에는 단순히 기술과 서비스의 내용이 설명되거나 상품 판매 및 구매 과정에서 다수의 상품명만 소개되는 내용이 포함되어 의미 없는 키워드가 수집되는 경우를 피하기 힘들다. 데이터의 전처리 과정(Preprocessing)을 거쳤다고 해도 가비지에 대한 가능성을 완전히 배제할 수는 없다. 이에, 가비지 수준을 제시하여 소셜 빅데이터 전반의 신뢰도를 가늠할 수 있도록 하는 방식을 제안할 수 있다. 전체 수집된 데이터 중에서 데이터 열을 무작위 추출(Random Sampling)하여 전체 데이터 대비가 비지 데이터 규모(Garbage Data Scale)를 비율로 제시토록 하는 것이다(Fig. 3).
Fig. 3 Garbage data scale measurement through random sampling.
5. 결론 및 제언
인터넷 등장 이후 소셜미디어를 통한 소통이 늘어났음에도 정책 이슈가 확산하는 과정을 설명한 연구들은 정책 이슈에 관한 사례연구에 치중되었던 것이 사실이다. 소셜미디어 공간에서 소셜 빅데이터가 축적되고 있음에도 소셜 빅데이터를 활용하여 기존에 정립된 정책확산의 개념들을 계량적으로 연구하려는 시도가 부족했다.
특히, 정책확산에 관한 연구가 주로 수행되는 인문‧사회과학 분야에서는 빅데이터의 등장과 소셜 빅데이터의 분화를 새로운 데이터 현상으로 바라보고 기존의 이론적 개념들을 계량화하여 분석하는 시도가 필요했지만, 관련 연구는 부재했다. 정책이 우리 삶에 미치는 영향력이 상당하고 최근 소셜미디어 공간에서 정책 제안이 이뤄지는 경우가 많지만, 이러한 현상을 양적 지표로 치환하고 분석방법을 객관화하며 분석과정 상 필수적인 요소들을 도출하려는 시도가 부족했다고 할 수 있다.
본 연구는 소셜미디어 공간에서 논의되는 ICT 정책 이슈가 실제 정책으로 추진되는 양상을 분석하는 방법에 초점을 맞추면서 정책 격발 메커니즘의 개념을 통해 설정할 수 있는 변인들을 수치화해보고자 했다. 또한, 소셜 빅데이터를 통해 ICT 정책 분석 결과를 제시하는 데 필수적인 요소들을 제안해보고자 했다. 이렇게 제안할 수 있는 격발 메커니즘의 변인은 1) 범위, 2) 지속성, 3) 상호작용성, 4) 다양성, 5) 주목도, 6) 선호도, 7) 변형성이며, 각 변인은 현시점의 소셜 빅데이터 수집 및 분석수준에서 수치화해볼 수 있었다. 정책 분석결과를 제시하는 데 필수적으로감안할 요소로는 1) 데이터 수준에 따른 결과 해석, 2) 수집‧분석 시점 및 시점 간 차이 제시, 3) 가비지 수준 설정을 꼽을 수 있었다.
ICT 정책의 경우, 새로운 기술과 서비스의 출현이나 생활에 밀접한 서비스에 대한 이슈가 확산할 때마다 사회적 관심이 더욱 커지고 있다. ICT 기술과 서비스에 대한 사회 구성원들의 지식수준이 높아지면서 ICT 이슈가 정책 이슈로도 더 많이 논의되는 것이다. 따라서 본 연구에서 제시한 계량화된 정책분석방식이 변화하는 사회나 그 구성원을 분석하는 하나의 방법론적 아이디어를 제시할 수 있을 것으로 판단한다.
한편으로 본 연구에서 제시한 제안들은 새로운 형태의 소셜미디어 서비스와 소셜 빅데이터 수집‧분석기술이 진보함에 따라 가변적이어야 하는 한계점이 있다. 소셜미디어 서비스를 통한 소통의 방식은 끊임없이 변화하므로 현시점에서 적용 가능한 방법론을 발굴한다고 해도 이러한 방법론은 끊임없는 표준화‧ 체계화 과정을 거쳐야 한다. 후속 연구들에서 더욱 다채로운 방식으로 대용량의 빅데이터를 활용해 사회현상을 분석하거나, 사회과학적 방법론을 체계화하는 데 기여할 수 있는 도전적인 연구가 수행되기를 기대한다.
References
- H.G. Choi, A Study on The Diffusion Process of Informatization Policy Issue: Focusing on Analysis of Big Data in Social Text, Dissertation for the Degree of Doctor of Philosophy, 2014.
- L.N. Gerston, Public Policy Making: Process and Principles, M. E. Sharpe, Armonk, New York, 1997.
- S.T. Kim and Y.H. Lee, "New Functions of Internet Mediated Agenda-Setting: Agenda-Rippling and Reversed Agenda-Setting," Korean Journal of Journalism & Communication Studies, Vol. 50, No. 3, pp. 175-204, 2006.
- NIA, 2012 National Informatization White Paper, 2012.
- H.G. Choi and S.T. Kim, "A Study on Task Overlap of ICT Policy Related to Informatization : Focusing on Comparison of Government Departments' Policy Instruments and Goals Before the New Government in 2013," Korean Journal of Broadcasting & Telecommunications Research, No. 82, pp. 159-191, 2013.
- T.A. Birkland, Introduction to the Policy Process: Theories, Concepts, and Models of Public Policy Making, M. E. Sharpe, Armonk, New York, 2005.
- H. Rheingold, Smart Mobs, Perseus Books Group, New York City, New York, 2002.
- W.S. Jho and K.J. Song, "Civil Participation in the Policy-Making Process Through The Internet: The Policy Making Process of Single-Issue Network Movements," Korean Public Administration Review, Vol. 38, No. 5, pp. 197-214. 2004.
- T.R. Dye, Top Down Policy Making. CQ Press, Washington, D.C., 2000.
- J.W. Kingdon, Agendas, Alternativesm and Public Policies. Little Brown and Company, Boston, Massachusetts, 1984.
- M.H. Kim and H.K. Ahn, "The Transformation of Social Perception on Target Population and Policy Change," Korean Public Administration Review, Vol. 40, No. 4, pp. 469-490. 2006.
- M.O. Choi, "A Case Study of Environmental Policy Formation : A Focus on the Phenol Spills in Nakdong River of 1991 and 2008," GRI REVIEW, Vol. 15, No. 1, pp. 91-112. 2013.
- Gartner, Big Data Analytics, Gartner Group, 2011.
- C. Dobre and F. Xhafa, "Parallel Programming Paradigms and Frameworks in Big Data Era," International Journal of Parallel Programming, Vol. 42, No. 5, pp. 710-738, 2014. https://doi.org/10.1007/s10766-013-0272-7
- G. Bello-Orgaz, J.J. Jung, and D. Camacho, "Social Big Data: Recent Achievements and New Challenges," Information Fusion, Vol. 28, pp. 45-59, 2016. https://doi.org/10.1016/j.inffus.2015.08.005
- H.G. Choi, Media Analysis Method Using Social Big Data, Communication Books, Seoul, 2017.
- A. Wang, "Advertising Engagement: A Driver of Message Involvement on Message Effects," Journal of Advertising Research, Vol. 46, No. 4, pp. 355-368, 2006. https://doi.org/10.2501/S0021849906060429
- Y.W. Lee, W.H. Noh, and Y.S. Sung, "The Effects of the Characteristics of Corporate Brand's SNS on Brand Engagement: The Mediating Effect of Media Engagement," Journal of Marketing Studies, Vol. 23, No. 3, pp. 53-76, 2015.
- S.S. Oh, A Study on the Effect of Broadcasting Advertisement Sales Method based on Program Engagement on the Enhancement of Brand Ad Power of Terrestrial Advertisement, KOBACO, 2009.
- B.H. Back, I. Ha, and B.C. Ahn, "An Extraction Method of Sentiment Infromation from Unstructed Big Data on SNS," Journal of Korea Multimedia Society, Vol. 17, No. 6, pp. 671-680, 2014. https://doi.org/10.9717/kmms.2014.17.6.671
- B.I. Kim, H.C. Shin, and C.W. Ahn, "Copyright Limitations and Exceptions for 'Big Data' Analysis and 'Data Mining'," Copyright Quarterly, Vol. 30, No. 1, pp. 29-61, 2017.
- M.J. Choi and S.C. Yang, Internet Social Media and Journalism, KPF, 2009.
- S.T. Kim et al., Communication Research in the Big Data Era, Yulgokbook, Seoul, 2015.
- P.L.M. Vasterman, "Media-Hype: Self-Reinforcing News Waves, Journalistic Standards and the Construction of Social Problems," European Journal of Communication, Vol. 20, No. 4, pp. 508-530, 2005. https://doi.org/10.1177/0267323105058254
- Y.K. Cho and J.W. Yoo, "The Effect of Internet Interactivity on Knowledge Structure," Korean Journal of Broadcasting and Telecommunication Studies, Vol. 25, No. 5, pp. 267-308, 2011.
- V. Price, J.N. Cappella, and L. Nir, "Does Disagreement Contribute to More Deliberative Opinion?," Political Communication, Vol. 19, No. 1, pp. 95-112, 2002. https://doi.org/10.1080/105846002317246506
- H.J. Song, S.M. Shin, and S.G. Park, "Reading Dissonant Opinions on the Internet and Its Effects on Argument Repertoire and Tolerance," Korean Journal of Journalism & Communication Studies, Vol. 50, No. 5, pp. 160-183, 2006.
- D.M. Blei, A.Y. Ng, and M.I. Jordan, "Latent Dirichlet Allocation," The Journal of Machine Learning Research, Vol. 3, pp. 993-1022, 2003.