• 제목/요약/키워드: 뉴스 기사

검색결과 507건 처리시간 0.023초

기계학습 기반 국내 뉴스 헤드라인의 정확성 검증 연구 (Objectivity in Korean News Reporting : Machine Learning-Based Verification of News Headline Accuracy)

  • 백지수;이승언;한지영;차미영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-286
    • /
    • 2021
  • 뉴스 헤드라인에 제3자의 발언을 직접 인용해 전언하는 이른바 '따옴표 저널리즘'이 언론 보도의 객관주의 원칙을 해치는지는 언론학 및 뉴스 구독자에게 중요한 문제이다. 이 연구는 온라인 포털사이트를 통해 실시간 유통되는 한국어 기사의 정확성을 판별하기 위한 기계학습(Machine Learning) 모델을 제안한다. 이 연구에서 제안하는 모델은 Edit Distance와 FastText 기법을 활용해 기사 제목과 본문 내 인용구의 유사성을 측정하고, XGBoost 모델을 활용해 최종 분류한다. 아울러 이 모델을 통해 229만 건의 뉴스 헤드라인에 대해 직접 인용구가 포함된 기사가 취재원의 발언을 주관적인 윤색없이 독자들에게 전하고 있는지를 판별했다. 이뿐만 아니라 딥러닝 기반의 KoELECTRA 모델을 활용해 기사의 제목 내 인용구에 대한 감성 분석을 진행했다. 분석 결과, 윤색이 가미되지 않은 직접 인용형 기사의 비율이 지난 20년 동안 10% 이상 증가했으며, 기사 제목의 인용구에 나타나는 감정은 부정 감성이 긍정 감성의 2.8배 정도로 우세했다. 이러한 시도는 앞으로 계산사회과학 방법론과 빅데이터에 기반한 언론 보도의 평가 및 개선에 도움을 주리라 기대한다.

  • PDF

생성 AI 기반 뉴스 기사 심리지수를 활용한 부동산 가격 예측 모델 (Predictive Model for Real Estate Prices Using Sentiment Index of news articles based on Generative AI )

  • 김수아;권미주;조수빈;김은수;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1198-1199
    • /
    • 2023
  • 부동산 시장은 다양한 요인에 의해 가격이 결정되며 거시경제 변수뿐 만 아니라 뉴스 기사, SNS 등 다양한 비정형 데이터의 영향을 받는다. 특히 뉴스 기사는 국민들이 느끼는 경제 심리를 반영하고 있어 부동산 가격에 영향을 크게 미치는 변수라고 판단된다. 본 연구에서는 뉴스 기사의 세분화된 감정 분석을 통해 전통적인 분석 방법보다 더 의미 있는 결과를 얻을 수 있는 부동산 가격 예측 모델을 생성하였으며 뉴스 기사로부터 심리 지수를 산출하기 위해 생성 AI 를 활용하였다. 제안하는 매매가격지수 예측 모델을 통해 부동산 시장과 뉴스 기사와의 관계성에 대해 파악할 수 있으며, 사회/경제적 동향을 반영한 부동산 가격 변동을 예측할 수 있을 것으로 보인다.

검증 자료를 활용한 가짜뉴스 탐지 자동화 연구 (A Study on Automated Fake News Detection Using Verification Articles)

  • 한윤진;김근형
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권12호
    • /
    • pp.569-578
    • /
    • 2021
  • 오늘날 웹의 발전으로 우리는 각종 언론 매체를 통해 온라인 기사를 쉽게 접하게 된다. 온라인 기사를 쉽게 접할 수 있게 된 만큼 거짓 정보를 진실로 위장한 가짜뉴스 또한 빈번하게 찾아볼 수 있다. 가짜뉴스가 전 세계적으로 대두되면서 국내에서도 가짜뉴스를 탐지하기 위한 팩트 체크 서비스가 제공되고 있으나, 이는 전문가 기반의 수동 탐지 방법을 기반으로 하며 가짜뉴스 탐지를 자동화하는 기술에 대한 연구가 계속해서 활발하게 이루어지고 있다. 기존 연구는 기사 작성에 사용된 문맥의 특성이나, 기사 제목과 기사 본문의 내용 비교를 통한 탐지 방법이 가장 많이 사용되고 있으나, 이러한 시도는 조작의 정밀도가 높아졌을 때 탐지가 어려워질 수 있다는 한계를 가진다. 따라서 본 논문에서는 기사 조작의 발달에 따른 영향을 받지 않기 위하여 기사의 진위 여부를 판단할 수 있는 검증기사를 함께 사용하는 방법을 제안한다. 또한 가짜뉴스 탐지 정확도를 개선시킬 수 있도록 실험에 사용되는 기사와 검증기사를 문서 요약 모델을 통해 요약하는 과정을 추가했다. 본 논문에서는 제안 알고리즘을 검증하기 위해 문서 요약 기법 검증, 검증기사 검색 기법 검증, 그리고 최종적인 제안 알고리즘의 가짜뉴스 탐지 정확도 검증을 진행하였다. 본 연구에서 제안한 알고리즘은 다양한 언론 매체에 적용하여 기사가 온라인으로 확산되기 이전에 진위 여부를 판단하는 방법으로 유용하게 사용될 수 있다.

긍정적 뉴스에 따른 주가변동 분석 (Analysis of stock price fluctuations due to positive news)

  • 신태현;백재순;김성진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.161-162
    • /
    • 2024
  • 언젠가 한 번쯤 "뉴스에서 발생하는 소식들은 주가변동에 어떤 영향을 줄까?" 하고 궁금해 본 적이 있을 것이다. 본 논문에서는 이러한 궁금증을 해소하기 위해 뉴스기사에 따른 주식시장의 변동을 연구분석한 내용을 소개한다. 이를 위해 뉴스기사를 크롤링하고 자연어 처리 기술을 통해 긍정적 기사와 부정적 기사를 분류하고 해당 날짜의 주가변동 그래프를 분석하여 뉴스에서의 긍정적 요소와 부정적 요소가 주식시장에 얼마나 영향을 주는지 머신러닝 알고리즘을 통해 알아보았다.

  • PDF

준 실시간 뉴스 이슈 분석을 위한 계층적·점증적 군집화 (Hierarchical and Incremental Clustering for Semi Real-time Issue Analysis on News Articles)

  • 김호용;이승우;장홍준;서동민
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.556-578
    • /
    • 2020
  • 실시간으로 발생하는 뉴스 기사로부터 이슈를 분석하기 위한 다양한 연구가 진행되어 왔다. 하지만 범주에 따라 계층적으로 이슈를 분석하는 연구는 많이 진행되지 않았고, 계층적 이슈 분석을 위한 기존의 연구에서 제안하는 방식 또한 뉴스 기사 증가에 따라 군집화 속도가 느려지는 문제점이 있다. 따라서 본 논문에서는 준 실시간으로 뉴스 기사의 이슈를 분석하는 계층적·점증적 군집화 방식을 제안한다. 제안하는 군집화 방식은 샴 신경망을 이용한 가중 코사인 유사도 측정 모델 기반의 k-평균 알고리즘을 이용한 단어 군집 기반 문서 표현 방식을 통해 뉴스 기사를 문서 벡터로 표현한다. 그리고 문서 벡터로부터 초기 이슈 군집 트리를 생성하고, 새로 발생한 뉴스 기사를 해당 이슈 군집 트리에 추가하는 점증적 군집화 방식을 제안함으로써 뉴스 기사의 계층적 이슈를 준 실시간으로 분석한다. 마지막으로, 본 논문에서 제안하는 방식과 기존 방식들과의 성능평가를 통해 제안하는 군집화 방식이 정확도 측면에서 기존 방식 대비 NMI 지표 기준 0.26 정도 성능이 향상되었고, 속도 측면에서 약 10배 이상의 성능이 향상됨을 입증하였다.

연관규칙 마이닝을 활용한 뉴스기사 키워드의 연관성 탐사 (Discovering News Keyword Associations Using Association Rule Mining)

  • 김한준;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.63-71
    • /
    • 2011
  • 현재 대부분의 웹포털 사이트는 인기도 또는 중요도가 높은 키워드를 제공하는 서비스가 제공되고 있는데, 구체적으로 태그 클라우드 형태와 연관 검색 서비스와 같은 사용자 친화형 서비스를 지원하고 있다. 하지만 일반적으로 뉴스기사는 날짜와 분야별로 기사들이 분류되어 있기에, 사용자는 카테고리별로 나누어진 기사를 읽을 수만 있을 뿐 그 기사와 연관된 다른 기사를 쉽게 찾아보지는 못한 실정이다. 또한 연관 검색어 서비스도 사용자가 검색한 입력내용을 기반으로 연관성 정도를 분석하기에 충분한 객관성을 보장하지 못하고 있다. 본 논문에서는 기존의 태그 클라우드 방식에서 좀 더 나아가 축적된 뉴스 기사로 부터 검색 키워드와 밀접히 연관된 키워드를 추출하여 제공하는 기사 검색 방식을 제안한다. 제안 기법은 기본적으로 연관규칙 마이닝을 이용하여 키워드 연관성을 추출하게 되며, 뉴스기사 특성을 반영하여 문장 내부에 존재하는 키워드에 한정하여 연관성을 추출한다. 연관된 키워드 집합을 이용하여 키워드와 가장 밀접한 기사를 검색할 뿐만 아니라, 연관 키워드간의 관계성을 보여줌으로써 뉴스 기사들 속에 숨겨진 연관정보의 탐색을 가능하게 한다.

소셜미디어에서의 뉴스 정보 수용과 전통 미디어 뉴스 읽기의 비교 카카오톡의 대화와 신문 비교를 중심으로 (Comprehension of a News Story on SNS in Comparison to the Traditional Newspaper)

  • 이미나;양승찬;서희정
    • 한국언론정보학보
    • /
    • 제81권
    • /
    • pp.299-328
    • /
    • 2017
  • 본 연구는 소셜미디어에서의 뉴스 정보 수용을 기존의 전통적인 신문기사 형식의 뉴스 읽기와 비교 분석했다. 전통적인 신문기사 읽기 조건과 비교할 때 소셜미디어를 통한 뉴스 전달은 대화저널리즘 양식으로 이뤄진다고 보았으며 이러한 양식의 차이가 뉴스 정보의 기억과 구성에 어떤 차이를 만들어내는지를 유사실험을 통해 관찰했다. 실험에서는 동일한 내용의 가상의 기사를 전통적인 신문기사 형식과 소셜미디어의 대화체 이야기 정보 방식으로 제작해 신문기사 조건과 소셜미디어 조건에 활용했다. 뉴스의 이해 정도를 정보 기억(전체 내용 기억, 주요 내용 기억, 내용을 틀리게 기억한 정도, 부가적인 정보의 기억, 사실 정보 획득)과 구성(인과관계 기억)의 두 가지 측면에서 관찰했다. 분석결과, 신문기사 조건은 소셜미디어 조건보다 정보 기억에서 더 뛰어났다. 전체 내용의 기억 정도, 주요 내용을 기억한 정도, 부가적인 정보를 기억한 정도, 사실 정보 획득 등에서 신문기사 조건이 우세했으며, 내용을 틀리게 기억한 정도는 소셜미디어 조건이 더 높은 것으로 나타났다. 인과관계 기억의 경우, 일반적 인과관계를 기억하는 정도는 소셜미디어 조건이 더 뛰어났지만 해당 기사에 특정한 인과관계를 기억하는 정도는 신문기사 조건이 소셜미디어 조건보다 유의미하게 더 높은 것으로 나타났다. 이러한 연구결과는 전통적인 신문기사 형식이 뉴스 내용을 이해하는 데 도움이 됨을 시사하고 있다.

  • PDF

개체명 및 사용자 재확산 정보를 이용한 한국어 COVID-19 가짜 뉴스 검출 (COVID-19 Korean Fake News Detection using Named Entity and User Reproliferation Information)

  • 박채원;강지원;이다은;이문영;한진영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-90
    • /
    • 2021
  • 코로나바이러스감염증-19로 인한 팬데믹 상황이 지속되면서 감염증 정보의 불확실성으로 인해 코로나 관련 루머가 온라인상에서 빠르게 전파되고 있다. 이러한 코로나 관련 가짜 뉴스를 사전에 탐지하기 위해, 본 연구에서는 한국어 코로나 가짜 뉴스 데이터셋을 구축하고, 개체명과 사용자 재확산 정보를 이용한 한국어 가짜 뉴스 탐지 모델을 제안한다. 가짜 뉴스 팩트체킹 언론인 서울대팩트체크센터에서 코로나 관련 루머 및 가짜 뉴스에 대한 검증 기사를 수집한 후, 기사로부터 개체명 추출 모델을 통해 주제 키워드를 추출하고, 이를 이용해 유튜브 상의 사용자 재확산 정보를 수집하여 데이터셋을 구성하였다. BERT 기반의 제안 모델을 다양한 비교군과 비교하였고, 특성 조합에 따른 실험을 통해 각 특성 정보(기사 텍스트, 개체명 데이터, 유튜브 데이터)가 가짜 뉴스 탐지 성능에 미치는 영향을 알아보았다.

  • PDF

신문사 RSS를 활용한 실시간뉴스 어플리케이션 설계 및 구현 (Design and Implementation of Real-Time News App using RSS of the Internet Newspaper)

  • 송주환
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.631-637
    • /
    • 2018
  • 신문기사를 읽기 위하여 종이 신문의 이용은 줄고 스마트폰을 이용하는 경우가 많아지고 있어 뉴스 어플리케이션은 늘고 있다. 안드로이드 플레이 스토어의 많은 뉴스 어플리케이션은 2가지로 분류된다. 첫 번째는 특정 신문사에서 개발하여 해당 신문사의 기사만 배포하는 것이고, 나머지는 신문 목록을 보여주고 신문을 선택하면 신문사 홈페이지를 보여주는 것이다. 본 논문에서는 국내의 많은 신문사의 기사를 모아서 실시간으로 제공하기 위한 실시간뉴스 어플리케이션을 설계 및 구현하였다. 신문사들은 제공하는 RSS로 최신 기사를 제공한다. 서버프로그램은 최신기사를 시간 순으로 정렬하여 DB에 저장하고 실시간뉴스 어플리케이션에서 요구하는 기사를 실시간으로 전송한다. 최신 뉴스를 보기 위해 여러 곳에 분산된 신문사의 홈페이지를 각각 방문하지 않고도 각 신문사의 기사를 모아서 볼 수 있고 각 홈페이지를 접속하는데 사용되는 데이터의 사용을 줄일 수 있는 장점이 있다.

순환 신경망과 합성곱 신경망을 이용한 뉴스 기사 편향도 분석 (Analyzing Media Bias in News Articles Using RNN and CNN)

  • 오승빈;김현민;김승재
    • 한국정보통신학회논문지
    • /
    • 제24권8호
    • /
    • pp.999-1005
    • /
    • 2020
  • 오늘날의 검색 포털은 뉴스의 창구로서는 가장 큰 비율을 차지하지만, 중립성에 대해서는 의문이 제기되고 있다. 이는 포털 뉴스가 편향된 정보의 소비를 유도할 수 있기 때문이다. 본 논문은 뉴스 기사의 정치적 편향도를 딥러닝을 이용하여 측정하는 방법에 대하여 소개한다. 이는 기사를 비판적으로 바라보는 시각을 뉴스 독자에게 제공할 것이다. 구체적으로, 국회 회의록에서 추출한 키워드에 편향도를 부여하고, 이를 기반으로 기사의 편향도를 분석하여 머신러닝용 데이터를 구축하였다. 최종적으로 순환 신경망과 합성곱 신경망을 융합한 딥러닝을 통해 기사의 편향도를 계산하는 것을 목표로 하였다. 학습한 모델의 정확도를 분석한 결과 문장별 편향의 좌/우편향 판정은 95.6%의 정확도를 보였으나, 신문기사 전체에서는 46.0%의 정확도를 보였다. 이는 기존의 여러 편향성 연구와 다르게 특정 주제에 한정되지 않고 기사의 보수-진보 편향성을 분석할 수 있도록 한다.