• 제목/요약/키워드: news topic

검색결과 239건 처리시간 0.023초

텍스트 마이닝을 활용한 2017년 한국 대선 분석 (An Analysis of the 2017 Korean Presidential Election Using Text Mining)

  • 안은희;안정국
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.199-207
    • /
    • 2020
  • 최근 빅데이터 분석은 대량의 데이터로부터 미래를 예측하여 가치를 창출할 수 있어 다양한 분야에서 주목받고 있으며, 정치 캠페인 운영이나 결과 예측에도 활용되고 있다. 하지만 기존의 연구는 특정 SNS 데이터만을 분석하여 후보자들에 대한 정보를 취합하는데 한계가 있었다. 이에 본 연구는 2017년 한국 대선 후보별 뉴스와 댓글을 수집하여 뉴스 생성 추이, 토픽 추출, 감성 분석, 키워드 분석, 키워드 감성 분석을 하였다. 분석 결과, 대선 후보 간 다양한 토픽들이 생성되는 것을 확인하였으며, 후보별 이슈가 되는 중점 키워드와 이에 대한 유권자들의 호응도가 추출되었다. 본 연구는 포털 뉴스에서 생성되는 대선 캠페인에 대한 동향을 마이닝 할 수 있게 했다는 점과 감성 분석을 통해 대권주자들에 대한 유권자들의 관심과 의견들을 정량화하여 수치화한 것에 의의가 있다. 본 연구가 여론 수렴의 도구적 방법을 제시함으로써 이를 바탕으로 전략적인 행동 방안을 도출할 수 있을 것을 기대한다.

사건 탐지 및 추적을 위해 신문기사에서 자동 추출된 시간정보의 유용성 판단 (Judgment about the Usefulness of Automatically Extracted Temporal Information from News Articles for Event Detection and Tracking)

  • 김평;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권6호
    • /
    • pp.564-573
    • /
    • 2006
  • 시간정보는 정보 추출, 질의응답 시스템, 자동 요약과 같은 자연언어 처리 응용분야에서 중요한 역할을 한다. 사건 탐지 및 추적 분야에서는 기사의 발행일이 기사간 유사도 계산에 많이 사용되고 있지만 그 유용성에는 한계가 있다. 본 연구에서는 사건 탐지 및 추적 시스템의 성능을 향상시키기 위해서, 한국어 신문기사를 대상으로 비교적 간단한 자연언어 처리 기술을 사용해서 시간정보를 추출하는 방법을 개발하였다. 시간표현 어구를 추출하기 위해 품사패턴과 어휘사전이 사용되었고, 추출된 시간표현 어구는 정규화 과정을 통해 특정 시각 또는 기간으로 변환되었다. 실험을 통해 시간표현 추출과정의 정확도를 측정하였고, 기사에서 자동으로 추출된 시간을 사용함으로써 사건 탐지 및 추적 시스템의 성능을 향상시킬 수 있었다.

인공지능 서비스에 대한 온라인뉴스, 소셜미디어, 소비자리뷰 텍스트마이닝 (Text Mining of Online News, Social Media, and Consumer Review on Artificial Intelligence Service)

  • 이욱;임혜원;여하림;황혜선
    • Human Ecology Research
    • /
    • 제59권1호
    • /
    • pp.23-43
    • /
    • 2021
  • This study looked through the text mining analysis to check the status of the virtual assistant service, and explore the needs of consumers, and present consumer-oriented directions. Trendup 4.0 was used to analyze the keywords of AI services in Online News and social media from 2016 to 2020. The R program was used to collect consumer comment data and implement Topic Modeling analysis. According to the analysis, the number of mentions of AI services in mass media and social media has steadily increased. The Sentimental Analysis showed consumers were feeling positive about AI services in terms of useful and convenient functional and emotional aspects such as pleasure and interest. However, consumers were also experiencing complexity and difficulty with AI services and had concerns and fears about the use of AI services in the early stages of their introduction. The results of the consumer review analysis showed that there were topics(Technical Requirements) related to technology and the access process for the AI services to be provided, and topics (Consumer Request) expressed negative feelings about AI services, and topics(Consumer Life Support Area) about specific functions in the use of AI services. Text mining analysis enable this study to confirm consumer expectations or concerns about AI service, and to examine areas of service support that consumers experienced. The review data on each platform also revealed that the potential needs of consumers could be met by expanding the scope of support services and applying platform-specific strengths to provide differentiated services.

네이버 뉴스 댓글을 활용한 '비혼출산'에 대한 감성분석 (Sentiment Analysis on 'Non-maritalism Childbirth' Using Naver News Comments)

  • 허세영;김초원;정안용;이새봄
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.74-85
    • /
    • 2022
  • 한국 사회에서 결혼가치관의 변화, 비혼 만연 현상과 더불어 비혼출산이라는 새로운 가족 구성의 형태가 나타났고, 출생률 감소 문제와 결부되면서 사회적 논의가 이루어지고 있다. 이에 본 연구는 비혼출산에 대한 사람들의 감성과 인식을 알아보기 위해 방송인의 비혼출산 사실이 알려진 2020년 11월 16일부터 최근 2021년 8월 16일까지 비혼출산에 관한 뉴스기사 댓글을 이용해 감성분석을 수행하였다. 연구 결과, 방송인의 비혼출산 사실이 알려진 사회이슈기에는 긍정적인 댓글이 다수인 반면, 정부여당이 정책적 검토를 시작한 정책의제기부터 정책결정기까지는 부정적인 댓글이 다수였다. 단어 동시출현빈도에 기반한 네트워크를 살펴본 결과, 댓글에는 전통적 가족규범 측면, 정책적 측면, 개인적 측면의 인식이 나타났다. 본 연구는 비혼출산 이슈가 정책의 제화 이후 정책결정과정 동안 부정적 인식이 만연하였다는 점을 밝혀냈으며, 비혼출산에 대한 사회적 논의의 초석이 되었다는 점에서 의의가 있다.

텍스트마이닝을 통한 디지털플랫폼정부의 방향 모색: 4차산업혁명시대 담론으로부터의 교훈 (Exploring the Direction of Digital Platform Government by Text Mining Technique: Lessons from the Fourth Industrial Revolution Agenda)

  • 박수경;조지연;이봉규
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.139-146
    • /
    • 2022
  • 최근 몇 년간 빅데이터·AI를 활용하여 산업·사회문제를 해결하고 새로운 가치를 창출하는 것이 국가의 주요 정책목표로 논의되고 있다. 새 정부 또한 빅데이터·AI를 기반으로 국민·기업·정부가 사회문제 해결과 새로운 가치 창출하는 디지털플랫폼정부를 주요 국정과제로 설정하였다. 아직까지 그간의 논의를 정리하고 향후의 정책 방향을 논의한 연구는 많이 전개되지 못한 상황이다. 이에 본 연구는 지난 5년간의 논의의 진단을 통하여 우리의 현황과 과제를 살펴보고자 한다. 이를 위하여 앞서 통용되고 있던 개념인 4차산업혁명을 키워드로 하여, 신문사설을 수집하여 분석하였다. 텍스트 마이닝 기법을 적용하여 2017년부터 2022년까지 뉴스사설을 수집한 후 9개의 주요의제를 발견하였으며, 이를 기반으로 디지털플랫폼정부 기반의 미래사회에 대응을 위한 준비과제에 대한 시사점을 제공하였다.

트위터 게시물 분석을 통한 코로나바이러스감염증-19 백신에 대한 의견 탐색 (Exploring Opinions on COVID-19 Vaccines through Analyzing Twitter Posts)

  • 정우진;김규리;유승희;주영준
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.113-128
    • /
    • 2021
  • 본 연구는 코로나바이러스감염증-19(이하 코로나바이러스) 백신에 대한 사회적 의견을 파악하기 위해 트위터에서 작성된 백신 관련 게시물들을 분석하였다. 2020년 3월 16일부터 2021 3월 15일까지 1년간 트위터에서 작성된 코로나바이러스 백신 이름을 키워드로 포함한 45,413개의 게시물을 수집하여 분석하였다. 데이터 수집을 위해 활용된 코로나바이러스 백신 키워드는 총 12개이며, 수집된 게시물 수순으로 '화이자', '아스트라제네카', '모더나', '얀센', '노바백스', '시노팜', '시노백', '스푸트니크', '바라트', '캔시노', '추마코프', '벡토르'이다. 수집된 게시물들은 수기와 자동화된 방법을 동시 활용하여 키워드 분석, 감성 분석, 및 토픽모델링을 통하여 백신들에 대한 의견을 탐색하였다. 연구결과에 따르면 전반적으로 백신에 대한 부정적인 반응이 많았으며, 백신 접종 후유증에 대한 불안 및 백신의 효능에 대한 불신이 백신들에 대한 부정적인 주요 요소로 파악되었다. 이와는 반대로, 백신 접종에 따른 코로나바이러스 확산 억제에 대한 기대감이 백신에 대한 긍정적인 사회적 요소인 것을 확인할 수 있었다. 본 연구는 기존의 선행연구들이 뉴스 등 대중매체 데이터를 통해 코로나바이러스 백신에 대한 사회적 분위기를 파악하고자 했던 것과 달리, 소셜 미디어 데이터 수집 및 이를 활용한 키워드 분석, 감성 분석, 토픽 모델링 등의 여러 분석방법들을 사용하여 대중들의 의견을 파악하는 것으로 학술적 의의를 지닌다. 또한, 본 연구의 결과는 백신에 대한 사회적 분위기를 반영한 백신 접종 권장 정책 수립 기여라는 실질적 함의를 시사한다.

뉴노멀(New Normal) 시대 언어네트워크 분석에 의한 예술정책 방향 연구 (A Study on the Direction of Art Policy through Semantic Network Analysis in New Normal Era)

  • 김미연;권병웅
    • 예술경영연구
    • /
    • 제58호
    • /
    • pp.153-177
    • /
    • 2021
  • 본 연구는 코로나19로 촉발된 뉴노멀 시대의 예술정책에 관한 이론과 국내외 정책 동향을 바탕으로 언어네트워크 분석을 시도하였다. 이를 위해 2020년 3월부터 9월까지의 '코로나'와 '예술'의 키워드가 들어간 자료를 구글(Google)뉴스와 웹(web)문서에서 수집하여 227개의 정제된 주제어를 추출하였고, 추출된 주제어를 넷마이너 프로그램을 통해 주제어 빈도분석과 중심성을 지표로 분석하였다. 또한 각 주제어 간의 관계 분석을 위해 언어네트워크의 시각화 분석을 시도하였다. 분석결과 가장 많은 빈도수를 드러낸 주제어는 '코로나'였고, '문화예술', '예술', '공연', '온라인', '지원'이 최다 빈도수를 기록한 그룹에 포함되었다. 중심성 분석에서는 '코로나'가 가장 빈도가 높았고, '시대', '이후', '포스트', '예술', '문화예술' 순으로 나타나 빈도수가 높은 '코로나'와 '예술', '문화예술'은 대부분의 중심성에서도 우위를 차지했다. 특히, 주제어 빈도수와 중심성 분석에서 공통으로 상위를 차지하는 주제어는 '온라인'과 '지원' '정책'이다. 이는 코로나19로 인해 사회적 거리두기의 일상화에 따라 비대면·온라인콘텐츠의 급부상과 예술계에 대한 지원정책이 필요함을 나타내고 있다고 볼 수 있다.

텍스트 분석을 활용한 정보의 수요 공급 기반 뉴스 가치 평가 방안 (A Method for Evaluating News Value based on Supply and Demand of Information Using Text Analysis)

  • 이동훈;최호창;김남규
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.45-67
    • /
    • 2016
  • 최근 정보 유통의 주요 매체인 인터넷 뉴스와 SNS의 매체 간 특성 차이를 주목한 많은 연구가 있었음에도 불구하고, 양 매체의 차이를 정보의 수요 및 공급 관점에서 파악한 연구는 상대적으로 매우 부족하다. 일반적으로 새로운 정보는 언론사의 뉴스 기사를 통해 대중에게 노출되고, 대중은 이러한 기사에 대한 의견 또는 추가정보를 SNS를 통해 공유함으로써 해당 정보를 수용함과 동시에 확산시킨다. 이러한 측면에서 언론사가 뉴스를 제공하는 행위를 정보의 공급으로 파악할 수 있으며, 대중은 SNS를 통해 이에 대한 관심을 능동적으로 나타냄으로써 해당 정보에 대한 소비 수요를 표출하는 것으로 이해할 수 있다. 이는 상품 및 서비스의 가격이 수요와 공급의 관계에 의해 결정되는 것과 유사한 원리로, 정보의 가치를 정보 수요와 정보 공급의 관계에 기반을 두어 측정할 수 있음을 시사한다. 본 연구에서는 정보 공급의 대표 매체로 인터넷 뉴스 기사를, 정보 수요를 나타내는 대표 매체로 트위터를 선정하고, 특정 이슈에 대한 뉴스의 정보로서의 가치를 이와 관련된 트위터의 양으로 평가하는 뉴스가치지수(NVI, News Value Index)를 고안하여 제시한다. 구체적으로 제안 방법론은 각 이슈별로 NVI를 도출하고 이를 통해 시간의 흐름에 따른 정보 가치의 변화를 시각화하여 나타낸다. 또한 본 연구에서는 제안 방법론의 실무 적용 가능성을 평가하기 위해 인터넷 뉴스 387,018건과 트윗 31,674,795건에 대한 실험을 수행하였다. 그 결과 대부분의 이슈가 전체 정보 시장의 평균 가치에 수렴하는 형태로 변화함을 알 수 있었으며, 꾸준히 평균 이상의 가치를 가지며 정보 시장을 장악하는 등 특이한 양상을 보이는 흥미로운 이슈도 존재함을 파악할 수 있었다.

이상 패턴 분석을 통한 정책의 적합성 분석 연구 : S 시의 아동 급식 전자 카드 사례를 중심으로 (Analyzing the Relevancy of Policy by Abnormal Pattern Analysis : Focused on the Case of S-City's e-Card for Child Meal Support)

  • 전종식;권오병
    • 한국IT서비스학회지
    • /
    • 제17권1호
    • /
    • pp.135-153
    • /
    • 2018
  • E-Card Service for Child Nutrition Program is one of the main public policy services nowadays. In case of inconvenience during the use of the e-cards, it is recommended to cooperate with related organizations in order to promptly handle and provide guidance, and thoroughly manage child feeding service such as hygiene, nutrition and kindness etc. To do so, it is very important to provide food service that meets local actual conditions and children's needs in a cost effective manner for the underage who are worried about the poorly-fed by understanding the pattern of child feeding e-card service. Hence. this paper aims to investigate how child feeding e-card service efficiently provides meals according to the local situation and children's needs through big data analysis and to propose a method of identifying welfare conditions according to the purpose of service with actual application examples. The results suggest that, first of all, this study is able to judge appropriateness of public institution's policy in a timely and repetitive manner through non-standard data analysis such as Naver News and transaction data. Secondly, this paper proposes a multi-layered analysis framework, which performs online open data analysis to detect policy issues, visualizes retrieval and preprocessing of real data, and performs abnormal pattern recognition. These will be worthy of reference to other similar projects.

딥러닝 기반의 뉴스 분석을 활용한 주제별 최신 연관단어 추출 기법 (A Topic Related Word Extraction Method Using Deep Learning Based News Analysis)

  • 김성진;김건우;이동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 정보검색의 효율성을 위해 데이터를 분석하여 해당 데이터를 가장 잘 나타내는 연관단어를 추출 및 추천하는 연구가 활발히 이루어지고 있다. 현재 관련 연구들은 출현 빈도수를 사용하는 방법이나 LDA와 같은 기계학습 기법을 활용해 데이터를 분석하여 연관단어를 생성하는 방법을 제안하고 있다. 기계학습 기법은 결과 값을 찾는데 사용되는 특징들을 전문가가 직접 설계해야 하며 좋은 결과를 내는 적절한 특징을 찾을 때까지 많은 시간이 필요하다. 또한, 파라미터들을 직접 설정해야 하므로 많은 시간과 노력을 필요로 한다는 단점을 지닌다. 이러한 기계학습 기법의 단점을 극복하기 위해 인공신경망을 다층구조로 배치하여 데이터를 분석하는 딥러닝이 최근 각광받고 있다. 본 논문에서는 기존 기계학습 기법을 사용하는 연관단어 추출연구의 한계점을 극복하기 위해 딥러닝을 활용한다. 먼저, 인공신경망 기반 단어 벡터 생성기인 Word2Vec를 사용하여 다양한 텍스트 데이터들을 학습하고 룩업 테이블을 생성한다. 그 후, 생성된 룩업 테이블을 바탕으로 인공신경망의 한 종류인 합성곱 신경망을 활용하여 사용자가 입력한 주제어와 관련된 최근 뉴스데이터를 분석한 후, 주제별 최신 연관단어를 추출하는 시스템을 제안한다. 또한 제안한 시스템을 통해 생성된 연관단어의 정확률을 측정하여 성능을 평가하였다.