• 제목/요약/키워드: 뉴스 헤드라인

검색결과 16건 처리시간 0.028초

온라인 뉴스 기사 헤드라인의 논조에 따른 댓글 양상 (Comments Complexion by Argument's Tone of Online News Headline)

  • 서기열;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.869-872
    • /
    • 2018
  • 온라인 뉴스 소비의 확산과 함께 댓글은 여론 형성에 큰 역할을 담당한다. 그러나 아직 댓글에 영향을 미치는 형식 요소에 대한 실증 데이터 기반의 연구는 미흡하다. 본 연구는 이의 시작으로 온라인 뉴스 기사 소비의 두 가지 중요 요소 즉, 헤드라인과 댓글의 관계에 대해 다루고자 한다. 이를 위해, 헤드라인의 논조 유무에 따른 댓글의 논쟁 활성화 정도 차를 확인하고자 댓글의 수와 길이를 분석하였다. '이세돌, 알파고 바둑대결', '최저임금', '북미회담' 기사로 총 537건의 해드라인과 약 85만개의 댓글을 수집하였다. 그 결과 논쟁 활성화 측면에서 논조가 있는 헤드라인일때 댓글의 수가 많고 길이가 길어 논쟁이 더 활발한 것을 할 수 있었다. 또, 댓글의 논쟁 주제도 차이가 있어 헤드라인의 논조가 있는 경우에 의견이나 감정을 표출하는 토픽이 더 많았다. 본 연구는 실증 데이터를 통해, 헤드라인의 논조 유무가 댓글의 논쟁의 활성화 정도와 주제에 영향을 주는 요소임을 밝힘으로써 댓글 소비에 대한 새로운 관점을 제시하고, 헤드라인의 형식 요소의 연구의 중요성을 확인한 데 그 의의가 있다.

호가창(Limit Order Book)과 뉴스 헤드라인을 이용한 딥러닝 기반 주가 변동 예측 (Deep Learning-based Stock Price Prediction Using Limit Order Books and News Headlines)

  • 류의림;김채현;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.541-544
    • /
    • 2021
  • 본 논문은 어떤 기업의 주식 주문 정보를 담고 있는 호가창(limit order book)과 해당 기업과 관련된 뉴스 헤드라인을 사용하여 해당 기업의 주가 등락을 예측하는 딥러닝 기반 모델을 제안한다. 제안 모델은 호가창의 중기 변화와 단기 변화를 모두 고려하는 한편, 동기간 발생한 뉴스 헤드라인까지 예측에 고려함으로써 주가 등락 예측 정확도를 높인다. 제안 모델은 호가창의 변화의 특징을 CNN(convolutional neural network)으로 추출하고 뉴스 헤드라인을 Word2vec으로 생성된 단어 임베딩 벡터를 사용하여 나타낸 뒤, 이들 정보를 결합하여 특정 기업 주식의 다음 날 등락여부를 예측한다. NASDAQ 실데이터를 사용한 실험을 통해 제안 모델로 5개 종목(Amazon, Apple, Facebook, Google, Tesla)의 일일 주가 등락을 예측한 결과, 제안 모델은 기존 방법에 비해 정확도를 최대 17.14%, 평균 10.7% 향상시켰다.

기계학습 기반 국내 뉴스 헤드라인의 정확성 검증 연구 (Objectivity in Korean News Reporting : Machine Learning-Based Verification of News Headline Accuracy)

  • 백지수;이승언;한지영;차미영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-286
    • /
    • 2021
  • 뉴스 헤드라인에 제3자의 발언을 직접 인용해 전언하는 이른바 '따옴표 저널리즘'이 언론 보도의 객관주의 원칙을 해치는지는 언론학 및 뉴스 구독자에게 중요한 문제이다. 이 연구는 온라인 포털사이트를 통해 실시간 유통되는 한국어 기사의 정확성을 판별하기 위한 기계학습(Machine Learning) 모델을 제안한다. 이 연구에서 제안하는 모델은 Edit Distance와 FastText 기법을 활용해 기사 제목과 본문 내 인용구의 유사성을 측정하고, XGBoost 모델을 활용해 최종 분류한다. 아울러 이 모델을 통해 229만 건의 뉴스 헤드라인에 대해 직접 인용구가 포함된 기사가 취재원의 발언을 주관적인 윤색없이 독자들에게 전하고 있는지를 판별했다. 이뿐만 아니라 딥러닝 기반의 KoELECTRA 모델을 활용해 기사의 제목 내 인용구에 대한 감성 분석을 진행했다. 분석 결과, 윤색이 가미되지 않은 직접 인용형 기사의 비율이 지난 20년 동안 10% 이상 증가했으며, 기사 제목의 인용구에 나타나는 감정은 부정 감성이 긍정 감성의 2.8배 정도로 우세했다. 이러한 시도는 앞으로 계산사회과학 방법론과 빅데이터에 기반한 언론 보도의 평가 및 개선에 도움을 주리라 기대한다.

  • PDF

한국어 뉴스 헤드라인의 토픽 분류에 대한 실증적 연구 (An Empirical Study of Topic Classification for Korean Newspaper Headlines)

  • 박제윤;김민규;오예림;이상원;민지웅;오영대
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.287-292
    • /
    • 2021
  • 좋은 자연어 이해 시스템은 인간과 같이 텍스트에서 단순히 단어나 문장의 형태를 인식하는 것 뿐만 아니라 실제로 그 글이 의미하는 바를 정확하게 추론할 수 있어야 한다. 이 논문에서 우리는 뉴스 헤드라인으로 뉴스의 토픽을 분류하는 open benchmark인 KLUE(Korean Language Understanding Evaluation)에 대하여 기존에 비교 실험이 진행되지 않은 시중에 공개된 다양한 한국어 라지스케일 모델들의 성능을 비교하고 결과에 대한 원인을 실증적으로 분석하려고 한다. KoBERT, KoBART, KoELECTRA, 그리고 KcELECTRA 총 네가지 베이스라인 모델들을 주어진 뉴스 헤드라인을 일곱가지 클래스로 분류하는 KLUE-TC benchmark에 대해 실험한 결과 KoBERT가 86.7 accuracy로 가장 좋은 성능을 보여주었다.

  • PDF

사회면 기사 분석(1998년~2009년)을 통해 본 뉴스 미디어의 현실구성 (A Trend Analysis of the Metro Sections of News Media in Korea during 1998 and 2009)

  • 정일권
    • 한국언론정보학보
    • /
    • 제50권
    • /
    • pp.143-163
    • /
    • 2010
  • 이 연구는 지난 12년간 (1998년에서 2009년) 국내 뉴스 미디어의 사회면 기사의 변화 추세와 뉴스 미디어 간의 차이를 분석하는 것을 목적으로 했다. 연구목적 달성을 위해 이 연구는 지난 12년간(1998년 1월에서 2009년 8월)의 사회면 기사 전체의 헤드라인을(n=53,765) 비교하여, 뉴스기사를 통해 드러나는 현실이 시간의 흐름에 따라 변화가 있는지를 조사했다. 그리고 신문과 방송이라는 매체적 특성 그리고 뉴스 미디어의 이념적 성향에 따른 차이를 비교해 보기 위해 국내 지상파 방송 3사에서 보도된 기사와 주요 7개 전국지에 게재된 기사의 헤드라인을 매체와 개별 뉴스 미디어의 두 수준에 걸쳐 비교했다. 분석 결과, 뉴스 미디어의 사회면 기사는 현실과 정권이라고 하는 요인에 의해 영향을 받으며 이 두 요인의 공통성으로 인해 뉴스 미디어간 다소의 유사성을 지니게 된다는 결론에 도달했다. 그러나 동일한 대상(현실과 정권)을 받아들이는 방향과 정도의 차이 때문에 뉴스 미디어 간에 차별화가 이뤄지며 이러한 차이는 사회면 기사의 주제 선택에 영향을 미치게 됨을 알 수 있었다.

  • PDF

지역신문 뉴스 프레임 비교: 핵폐기장 관련 보도를 중심으로 (A Comparative Study of Local Newspapers' News Frame: Focus on Nuclear Waste Site Reporting)

  • 최낙진
    • 한국언론정보학보
    • /
    • 제27권
    • /
    • pp.283-316
    • /
    • 2004
  • 본 연구는 국책사업인 핵폐기장 유치와 관련해 지역간 경쟁과정에서 나타난 갈등적 이슈들을 해당 지역신문들이 어떻게 다루고 있는지를 뉴스프레임 분석을 통해 고찰했다. 연구대상인 광주일보, 매일신문, 전북일보의 뉴스기사 분석결과, 핵폐기장이라는 같은 사건에 대해 각각의 신문들이 사용하는 주요 프레임이 상이하게 나타났다. 우선 광주일보와 매일신문에서는 대항 프레임이 높게 사용되었으며, 이와 달리 전북일보에서는 지역발전 프레임이 가장 높게 집계되었다. 또한 헤드라인 주제어와 뉴스프레임 구성은 깊은 연관성이 있는 것으로 밝혀졌다. 광주일보와 매일신문의 대항프레임 기사에서는 헤드라인 주제어로 핵폐기장 사용 빈도가 높았으며, 지역발전 프레임의 전북일보기사에서는 헤드라인 주제어로 방사성폐기장이 압도적으로 높게 나타났다. 정부의 '양성자'와 '핵폐기장' 연계정책 발표 이후에도 광주일보와 매일신문에서의 뉴스 프레임은 그 이전과 비교하여 변화가 거의 없었다. 이에 반해 전북일보에서는 연계 정책 발표 이후, 대항 프레임이 현격히 감소한 대신에 정책 프레임은 크게 증가한 것으로 집계되었다. 동시에 전북일보의 헤드라인 주제어 사용에서 핵폐기장은 급격하게 감소하였으며, 방사성폐기장은 급격하게 증가한 것으로 나타났다. 이러한 결과에서 전북일보는 헤드라인 주제어로 방사성폐기장을 즐겨 사용하여 핵폐기장의 부정적 이미지를 최소화하고, 핵폐기장 유치가 곧 지역발전이라는 여론을 조성한 것이라 할 수 있다. 언론이 구성한 세계가 현실 그 자체가 된다는 그간의 프레임 연구 결과들은 당시 전북 부안으로 핵폐기장 유치가 결정된 것은 결코 우연이 아님을 보여주고 있다.

  • PDF

호가창과 뉴스 헤드라인을 이용한 딥러닝 기반 주가 변동 예측 기법 (Deep Learning-based Stock Price Prediction Using Limit Order Books and News Headlines)

  • 류의림;이기용;정연돈
    • 한국전자거래학회지
    • /
    • 제27권1호
    • /
    • pp.63-79
    • /
    • 2022
  • 최근 머신러닝 및 딥러닝 기법을 활용한 주식 가격 예측 연구가 다양하게 이루어지고 있다. 그 중에서도 최근에는 주식 매수 및 매도 주문 정보를 담고 있는 호가창을 이용하여 주가를 예측하려는 연구가 시도되고 있다. 하지만 호가창을 활용한 연구는 대부분 가장 최근 일정 기간 동안의 호가창 추이만을 고려하며, 호가창의 중기 추이와 단기 추이를 같이 고려하는 연구는 거의 진행되지 않았다. 이에 본 논문에서는 호가창의 중기와 단기 추이를 모두 고려하여 주가 등락을 보다 정확히 예측하는 딥러닝 기반 예측 모델을 제안한다. 더욱이 본 논문에서 제안하는 모델은 중단기 호가창 정보 외에도 해당 종목에 대한 동기간 뉴스 헤드라인까지 고려하여 기업의 정성적 상황까지 주가 예측에 반영한다. 본 논문에서 제안하는 딥러닝 기반 예측 모델은 호가창 변화의 특징을 합성곱 신경망으로 추출하고 뉴스 헤드라인의 특징을 Word2vec을 이용하여 추출한 뒤, 이들 정보를 결합하여 특정 기업 주식의 다음 날 등락 여부를 예측한다. 실제 NASDAQ 호가창 데이터와 뉴스 헤드라인 데이터를 사용하여 제안 모델로 5개 종목(Amazon, Apple, Facebook, Google, Tesla)의 일일 주가 등락을 예측한 결과, 제안 모델은 기존 모델에 비해 정확도를 최대 17.66%p, 평균 14.47%p 향상시켰다. 또한 해당 모델로 모의 투자를 수행한 결과, 21 영업일 동안 종목에 따라 최소 $492.46, 최대 $2,840.83의 수익을 얻었다.

뉴스 사이트별 다크패턴(Dark Patterns) 광고 실태조사 및 분석 (Investigation and Analysis of Dark Patterns in Advertisements of News Websites)

  • 한준영;연상준;오준형
    • 정보보호학회논문지
    • /
    • 제34권3호
    • /
    • pp.515-525
    • /
    • 2024
  • 다크패턴은 온라인상에서 서비스 제공자가 은밀한 속임수를 통해 필요 정보를 숨겨 사용자가 원하는 행동을 못하게 하거나, 의도하지 않은 행동을 유도하는 사용자 경험 디자인이다. 본 연구에서는 세계 상위 200개 뉴스 웹사이트를 대상으로 배너, 기사형, 팝업, 영상 광고와 같은 다크패턴의 사용 양상과 사용자에게 미치는 영향을 분석했다. 연구 결과, 배너 광고와 사용자 이탈률 및 순방문자 수 사이에는 유의미한 관련성이 없다는 결과가 나왔다. 지역별 분석 결과, 최초 화면 이동배너와 헤드라인 뉴스 화면 이동배너는 남아메리카에서, 헤드라인 뉴스 화면 고정배너는 아시아에서 가장 많이 관측되었다. 나머지 모든 분류는 유럽에서 가장 많이 관측되어 유럽 웹사이트가 가장 많은 수와 많은 종류의 다크패턴을 가지고 있다.

Open API를 이용한 통합 뉴스 메쉬업 서비스 (Integration News MashUp Service by Open API)

  • 김기택;최광섭;최윤정;이상미;박미라;민준기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.1071-1074
    • /
    • 2009
  • 기존의 온라인 신문에서는 다른 신문사의 기사와 비교하기 위하여 다른 스크립트 창에서 확인해야 하는 등의 번거로움이 있다. 이를 해결하기 위해서 본 논문에서는 매일같이 쓰여지는 뉴스 기사들을 신문사별, 분야별로 분류하여 사용자가 원하는 방식으로 서비스하는 'Rose News Reader' 시스템을 제안한다. 이 시스템은 여러 뉴스사의 뉴스 헤드라인 정보를 보여줌으로써 자신이 원하는 모든 정보를 한꺼번에 비교할 수 있고, 분석을 통한 올바르고 정확한 정보 습득할 수 있다.

  • PDF

인공지능 기반의 언어 생성 모델 분석 (AI-based language generation model analysis)

  • 이승철;장용훈;박창현;서영석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.519-522
    • /
    • 2020
  • 1989년에 WWW(World Wide Web)이 도입 되면서 세계적으로 인터넷의 보급이 시작되었다. 정보화 시대라고 알려진 3차 산업혁명 이후로 대량의 정보들이 소셜 미디어를 통하여 생산되었다. 소셜미디어는 2007년에 인터넷 사용자들 중 56%의 이용률을 보였지만 2008년 2분기에는 75%의 이용률로 증가함에 따라 대부분의 사용자들이 많이 사용하며 의존하게 되었다. 또한 소셜 미디어를 통해 발생 되는 데이터들을 이용하여 기업들은 이윤 창출을 할 수 있다. 하지만 이러한 소셜 미디어는 악의적인 목적을 통해 주가 조작, 정치적 선동 등을 할 수 있는 가짜 뉴스와 허위 정보들을 생성할 수 있으며 이에 따라 대책이 시급하다. 또한 가짜 뉴스는 사람이 글을 작성할 수도 있지만 최근 인공지능 기술의 발달에 따라 프로그램을 통해 자동적으로 생성 될 수도 있다. 본 논문에서는 이와 같은 실제 뉴스와 인공지능을 기반으로 한 뉴스를 분석한다. Kaggle에서 실제 뉴스 데이터를 수집하여 헤드라인을 OpenAI의 GPT-2 언어 모델을 통해 뉴럴 가짜 뉴스를 생성 하였다. 파이썬의 NLTK 모듈을 이용하여 전처리를 진행하였고 t-검정과 박스 플롯을 활용하여 분석을 진행하였다. 분석된 주요 속성들을 의사결정트리를 통해 모델 검증을 하였고 k-fold 교차검증을 통해 분류 모델을 평가하였다. 결과로 전체 분류 정확도 평균 89%의 성능을 보여주었다.