• 제목/요약/키워드: news topic

검색결과 233건 처리시간 0.021초

텍스트마이닝을 활용한 "잊힐 권리"의 토픽 분석 (Topic Analysis of the "Right to be Forgotten" Using Text Mining)

  • 이소현;구본진
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.275-298
    • /
    • 2022
  • 본 연구는 잊힐 권리와 관련한 뉴스 기사와 학술지 게재 논문을 대상으로 텍스트마이닝 분석을 활용해 각 문서 내에 나타난 논점과 특성을 살펴보았다. 분석을 위해 '잊힐 권리'와 '잊혀질 권리' 키워드를 검색어로 하여 2010년부터 2020년까지의 데이터를 수집하였다. 수집된 데이터를 대상으로 키워드 분석과 토픽모델링 분석을 수행한 결과, 지난 10년간 뉴스 기사와 학술지 논문에서 다루어진 쟁점은 크게 다르지 않으며, 접근방법 또한 유사한 것으로 나타났다. 다만 뉴스 기사와 학술지 논문 간 비교를 통해 이들 간 공통적으로 나타나는 쟁점과 부분적인 쟁점의 차이가 있음을 확인하였다. 따라서 본 연구에서 도출된 쟁점을 중심으로 기록관리학 분야에서도 적극적인 논의가 이루어져야 할 필요가 있으며, 공통적인 쟁점들을 우선적으로 고려하되, 쟁점상 이견이 존재하는 경우, 이를 다각적으로 논의하는 것이 필요하다고 볼 수 있다. 본 연구는 국내 기록관리학계에서 잊힐 권리와 관련된 논의가 이루어지고 있지 않은 현재의 상황에서 기록관리학 분야에서 잊힐 권리의 의미와 향후 발생할 수 있는 이슈를 도출해볼 수 있었다는데 의의가 있으며, 본 연구의 결과를 중심으로 기록관리학 분야에서 잊힐 권리에 대한 다양한 논의가 이루어지기를 기대한다.

A Study on the News Frame of COVID-19 Vaccine through Structural Topic Modeling and Semantic Network Analysis

  • Eun-Ji Yun;Bo-Young Kang
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.129-153
    • /
    • 2023
  • 본 연구는 코로나19 팬데믹 상황이 심각하였을 때, 대중들의 관심도가 높은 코로나19 백신과 관련한 대량의 언론 보도 프레임을 분석하여, 위기커뮤니케이션의 핵심 요소로서 바람직한 언론의 역할과 방향성을 모색하기 위해 수행되었다. 본 연구의 기간은 코로나19 백신 개발이 가시화되기 시작한 2020년 11월부터 2021년 6월까지 8개월이며, 연구 대상은 대중 신뢰도 및 이용도 순위에 따라 조선일보, 중앙일보, 동아일보, 한겨레로 설정하였다. 결과의 정확성 및 효율성을 제고하기 위해 최신 빅데이터 연구 기법인 구조적 토픽 모델링(STM) 및 의미연결망 분석 기법을 활용하였다. 연구결과, 구성 단어들의 명확한 군집도 및 중심성 분석값을 기반으로 각 언론사 당 16개 프레임, 총 64개의 유의미한 프레임이 도출되었다. 또한 프레임의 구성 정도 및 내용에 대한 차이를 확인하기 위해 4개 언론사를 비교 분석하였으며, 모든 언론사마다 유의미한 차이가 없음을 확인하였다.

스토킹 관련 언론기사에 대한 텍스트네트워크분석 (Text Network Analysis on Stalking-Related News Articles )

  • 지은선;정상희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.579-585
    • /
    • 2023
  • 본 연구의 목적은 텍스트네트워트분석을 통해 스토킹에 대한 정치성향의 언론기사 내에 핵심 단어를 탐색하고 내재된 의도를 살펴보는 것이다. 2018년 1월 1일부터 2022년 12월 31일까지 보도된 보수언론기사(조선일보, 중앙일보) 824건, 진보언론기사(한겨레신문, 경향신문) 783건으로 총 1,607건을 선정하여 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링 기법으로 도출된 주제범주의 양상을 탐색하였다. 연구결과는 보수언론과 진보언론의 공통된 토픽은 젠더폭력의 인식개선, 신변보호 및 처벌강도, 스토커 신상공개 도출되었고 두 언론의 상이한 토픽은 보수언론에서는 스토커의 가해행위, '신당역 살인사건'의 개요와 진보언론은 '신당역 살인사건'의 가중처벌요구, (사이버공간의) 성착취 범죄 근절로 구성되었다. 본 연구는 스토킹에 대한 언론기사 간의 이념적 의견에 따라 보도형태에 변화가 있음을 시사한다.

Statistical Properties of News Coverage Data

  • Lim, Eunju;Hahn, Kyu S.;Lim, Johan;Kim, Myungsuk;Park, Jeongyeon;Yoon, Jihee
    • Communications for Statistical Applications and Methods
    • /
    • 제19권6호
    • /
    • pp.771-780
    • /
    • 2012
  • In the current analysis, we examine news coverage data widely used in media studies. News coverage data is usually time series data to capture the volume or the tone of the news media's coverage of a topic. We first describe the distributional properties of autoregressive conditionally heteroscadestic(ARCH) effects and compare two major American newspaper's coverage of U.S.-North Korea relations. Subsequently, we propose a change point detection model and apply it to the detection of major change points in the tone of American newspaper coverage of U.S.-North Korea relations.

개인화된 뉴스 서비스를 위한 소셜 네트워크 기반의 콘텐츠 추천기법 (Content-based Recommendation Based on Social Network for Personalized News Services)

  • 홍명덕;오경진;가명현;조근식
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.57-71
    • /
    • 2013
  • 세계에는 수많은 사람들이 살아가고 있고, 사람들의 일상으로부터 매일, 매 시간 단위로 새로운 뉴스가 발생한다. 발생되는 뉴스는 예정된 일과 예상하지 못한 일들을 포함하고 있다. 발생하는 뉴스의 거대한 양과 이를 전달하는 수많은 미디어들로 인해 사람들은 뉴스 콘텐츠를 이용하는데 많은 시간을 소비하게 된다. 하지만 미디어에 시시각각 나타나는 속보와 실시간 이슈의 대부분이 가십 기사로 이루어져 있어 사용자들이 자신의 성향에 맞는 뉴스를 선별하고, 뉴스로부터 정보를 획득하는 것은 쉽지 않은 일이다. 또한 사용자의 관심사가 시간에 따라 변하기 때문에 뉴스 제공에 있어 사용자의 변하는 관심사를 반영하는 것이 요구된다. 본 논문에서는 사용자의 최근 관심사를 기반으로 사용자 선호도에 맞는 뉴스를 제공하기 위한 콘텐츠 기반의 추천 기법 및 시스템을 제안한다. 사용자의 최근 선호도를 파악하기 위하여 소셜 네트워크 서비스인 Facebook 사용자의 정보와 최근 게시글을 이용하여 동적으로 사용자 프로파일을 생성하여 이를 뉴스 서비스에 활용하고, 사용자 선호도에 적합한 뉴스를 추출하기 위해서 뉴스 콘텐츠의 분석을 요구한다. 뉴스 콘텐츠 분석을 위해 미디어에서 제공되는 뉴스의 카테고리를 사용하고, 뉴스 방송원고의 분석 및 주요 키워드 추출을 통해 뉴스 프로파일을 생성한다. 사용자 프로파일과 뉴스 프로파일 간의 유사도 측정을 위해서는 두 프로파일 간 형식의 일치화가 요구되므로 사용자 프로파일을 뉴스 프로파일과 동일한 형태로 생성한다. 사용자가 시스템에 접속하면 시스템은 사용자 프로파일에 명시된 선호도를 기반으로 뉴스 프로파일과의 유사도를 측정하고, 사용자 선호도에 가장 적합한 뉴스들을 제공하게 된다. 또한 사용자에게 제공된 뉴스 프로파일과 다른 뉴스 프로파일들 간에 유사도를 측정하여 유사도가 높은 관련된 뉴스들을 제공하게 된다. 제안한 개인화된 뉴스 서비스의 성능을 평가하기 위해 사용자에게 추천된 뉴스에 대한 사용자 평가와 시스템 예측값의 오차를 기반으로 6Sub-Vectors 벤치마크 알고리즘과 성능 평가를 수행하였고, 실험 결과를 통해 제안한 시스템의 우수성을 입증하였다.

인공지능발달 토픽 프레임 연구 -계열화(seriation)와 통합화(skeumorph)의 사회구성주의 중심으로- (A Study on AI Evolution Trend based on Topic Frame Modeling)

  • 권상희;차현주
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.66-85
    • /
    • 2020
  • 본 연구의 목적은 AI 기술 특허(전체)와 주요 신문에 나타난 AI 보도 프레임을 바탕으로 AI 발달과정 추세를 예측하고 이를 기술·설명하는 것이다. 이를 위해 지난 9년간 출원된 한국과 미국 기술특허 요약문과 국내 주요 신문의 AI(Artificial Intelligence) 뉴스 텍스트를 분석하였다. 본 연구는 빅데이터를 활용한 토픽모델링과 시계열회귀분석이 사용되었으며, 추가로 네트워크 의제 상관분석과 회귀분석 기법이 사용되었다. 본 연구결과는 다음과 같다. 첫째, Topic 모델링 분석결과, AI 기술특허 요약문에서는 인공지능, 알고리즘 5G(Hot AI 기술) 등의 순으로 확인되었으며, AI 뉴스보도에서는 산업 적용, 데이터 활용과 시장 적용 등의 순으로 확인되어 AI의 사회문화 보도 경향을 나타냈다. 둘째, 시계열회귀분석결과, 상승추세 토픽으로는 사회문화적으로 AI 일상적·문화적 이용과 산업적용 시작이 도출되었다. 하락추세토픽으로는 시스템, 하드웨어 기술 중심으로 나타났다. 셋째, 상관관계와 회귀관계를 활용한 QAP 분석 결과, AI 기술특허와 뉴스 보도 프레임 간의 상관관계는 높은 것으로 나타났다. 이를 통해 AI 발달에서 AI 기술특허와 뉴스 보도 프레임이 미디어 담론의 결정요인에 의해 사회적으로 구성되는 것을 알 수 있었다.

ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출 방법 (Method of Extracting the Topic Sentence Considering Sentence Importance based on ELMo Embedding)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.39-46
    • /
    • 2021
  • 본 연구는 뉴스 기사에서 기사문을 구성하는 문장별 중요도를 고려하여 요약문을 추출하는 방법에 관한 것으로 문장 중요도에 영향을 주는 특성으로 중심 문장(Topic Sentence)일 확률, 기사 제목 및 다른 문장과의 유사도, 문장 위치에 따른 가중치를 추출하여 문장 중요도를 계산하는 방법을 제안한다. 이때, 중심 문장(Topic Sentence)은 일반 문장과는 구별되는 특징을 가질 것이라는 가설을 세우고, 딥러닝 기반 분류 모델을 학습시켜 입력 문장에 대한 중심 문장 확률값을 구한다. 또한 사전학습된 ELMo 언어 모델을 활용하여 문맥 정보를 반영한 문장 벡터값을 기준으로 문장간 유사도를 계산하여 문장 특성으로 추출한다. LSTM 및 BERT 모델의 중심 문장 분류성능은 정확도 93%, 재현율 96.22%, 정밀도 89.5%로 높은 분석 결과가 나왔으며, 이렇게 추출된 문장 특성을 결합하여 문장별 중요도를 계산한 결과, 기존 TextRank 알고리즘과 비교하여 중심 문장 추출 성능이 10% 정도 개선된 것을 확인할 수 있었다.

토픽 모델링과 네트워크 분석을 활용한 사물주소 도입에 대한 언론보도 분석 (An Analysis of the Media's Report on the Adoption of the Address of Things using Topic Modeling and Network Analysis)

  • 모성훈;임철현;김현재;이정우
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.38-47
    • /
    • 2021
  • 본 연구는 주소를 둘러싼 국내외 환경변화 속에서 관계 법령 개정 및 시범사업 등에 의해 본격적으로 도입이 이루어지고 있는 사물주소에 대한 언론보도를 분석하였다. 네이버 뉴스 플랫폼에서 2018년 4월부터 2020년 9월까지 기간동안 '사물주소'라고 검색하여 수집된 언론보도기사의 제목과 원문을 수집하여 토픽 모델링 및 네트워크 분석을 실시하였다. 분석 결과, 보도주제는 4가지 유형으로 '사물주소체계 추진', '사물주소 부여대상 실증', '도로명주소 사용 개선', '주소 활성화를 위한 교육·홍보'로 나타났으며, 해당 기간동안 '사물주소 부여 실증' 주제가 주요 의제였음을 확인하였다. 분석 결과를 행정안전부의 「제3차 주소정책 기본계획(2018-2022)」과 비교하여 정책적 시사점을 제시하였다.

LDA 를 이용한 '프랜차이즈 규제' 관련 뉴스기사 토픽모델링 (Topic Modeling of News Article Related to Franchise Regulation Using LDA)

  • 양우령;양회창
    • 한국프랜차이즈경영연구
    • /
    • 제13권4호
    • /
    • pp.1-12
    • /
    • 2022
  • Purpose: In 2020, the franchise industry accomplished a significant growth compared to the previous year, as the number of franchise companies increased by 9.0% while the number of franchise brands increased by 12.5%. Despite growth in size, the Korean franchise industry underwent many negative incidents, such as franchise ownership sales to private equity funds, that led to deterioration of businesses. From this point of view, this study aims to make various proposals to help policy makers develop franchise industry policies by analyzing trends of the current and previous presidential administrations' franchise policies and regulations using newspaper articles. Research design, data and methodology: A total of 7,439 articles registered in Naver API from February 25, 2013 to November 29, 2021 were extracted. Among them, 34 unrelated video articles were deleted, and a total of 7,405 articles from both administrations were used for analysis. The R package was used for word frequency analysis, word clouding, word correlation analysis, and LDA (Latent Dirichlet Allocation) topic modeling. Results: The keyword frequency analysis shows that the most frequently mentioned keywords during the previous administration include 'no-brand', 'major company', 'bill', 'business field', and 'SMEs', and those mentioned during the current administration include 'industry' and 'policy'. As a result of LDA topic modeling, 9 topics such as 'global startups' and 'job creation' from the previous administration, and 10 topics such as 'franchise business' and 'distribution industry' from the current administration were derived. The results of LDAvis showed that the previous administration operated a policy based on mutual growth of large and small businesses rather than hostile regulations in the franchise business, whereas the current administration extended the regulation related to franchise business to the employment sector. Conclusions: The analysis of past two administrations' franchise policy, it can be suggested that franchisors and franchisees may complement each other in developing the Fair Transactions in Franchise Business Act and achieving balanced growth. Moreover, political support is needed for sound development of franchisors. Limitations and future research suggestions are presented at the end of this study.

단어 유사도를 이용한 뉴스 토픽 추출 (News Topic Extraction based on Word Similarity)

  • 김동욱;이수원
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1138-1148
    • /
    • 2017
  • 토픽 추출은 문서 집합으로부터 그 문서 집합을 대표하는 토픽을 자동 추출하는 기술이며 자연어 처리의 중요한 연구 분야이다. 대표적인 토픽 추출 방법으로는 잠재 디리클레 할당과 단어 군집화 기반 토픽 추출방법이 있다. 그러나 이러한 방법의 문제점으로는 토픽 중복 문제와 토픽 혼재 문제가 있다. 토픽 중복 문제는 특정 토픽이 여러 개의 토픽으로 추출되는 문제이며, 토픽 혼재 문제는 추출된 하나의 토픽 내에 여러 토픽이 혼재되어 있는 문제이다. 이러한 문제를 해결하기 위하여 본 연구에서는 토픽 중복 문제에 대해 강건한 잠재 디리클레 할당으로 토픽을 추출하고 단어 간 유사도를 이용하여 토픽 분리 및 토픽 병합의 단계를 거쳐 최종적으로 토픽을 보정하는 방법을 제안한다. 실험 결과 제안 방법이 잠재 디리클레 할당 방법에 비해 좋은 성능을 보였다.