• Title/Summary/Keyword: 뉴스기사 분석

Search Result 357, Processing Time 0.033 seconds

Correlation Analysis between News Articles and Music Charts using Big Data Technologies based on R (R 기반의 빅데이터 기술을 활용한 뉴스기사와 음원차트의 상관관계 분석)

  • Ha, Jung-chul;Kang, Dong-hoon;Park, Jae-mo;Gil, Joon-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.636-639
    • /
    • 2016
  • 빅데이터의 일종인 뉴스기사 중에 아이돌 그룹관련 뉴스기사는 아이돌 그룹의 대중적 인기에 힘입어 전체 연예계 기사 중에 점점 큰 비중을 차지하고 있다. 아이돌 그룹의 소속사는 여러 홍보 방법 중 뉴스기사의 노출을 통해 비교적 저렴한 비용으로 홍보하여 음원차트 순위 향상을 위해 노력하고 있다. 본 논문에서는 뉴스기사와 음원차트 간의 상관관계를 분석하여 뉴스기사의 노출이 효율적 홍보 수단 인지를 알아보기 위해 먼저 감성분석을 통해 긍정기사와 부정기사가 음원차트 순위에 미치는 영향을 분석하고, 뉴스기사의 수가 많을수록 음원차트 순위가 상승하는지에 대해 알아보고자 한다. 이를 위해 본 논문에서는 R 언어를 이용하여 데이터 수집을 위한 웹 크롤러 설계, 회귀분석을 이용한 감성사전 구축 및 감성분석, 마지막으로 피어스만 상관계수를 이용한 상관관계 분석을 수행한다.

Effect of the Recommendation Story in Online Journalism on the User's News Selection (온라인 저널리즘의 추천기사가 뉴스 이용자의 뉴스기사 선택에 미치는 영향)

  • Park, Kwang-Soon;Ahn, Jong-Mook
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.16 no.3
    • /
    • pp.1795-1805
    • /
    • 2015
  • This paper analyzed the recommendation stories in the online journalism on the user's news choice by college students in two ways. One way is recommendation stories, and the other one is their arrangement and the index of use. From the results of the analysis, 7 out of 11 types of recommendation stories had positive effects on selecting news stories, while the 4 other types had little effect. Most of the recommendation stories that had little effect on the user's news selection were 'comments' or 'things' related to tweets' on SNS. The arrangements of new stories and the searched keywords had some effects on the user's news choice but had no effect on the index of use. In addition, the hours of using news stories and the types of recommendation stories were mostly correlated with each other. Consequently, formal factors, such as the arrangement of news stories and the recommendation stories of online journalism, had positive effects on the user's news selection, as well as headlines and keywords of news stories.

Article Analytic and Summarizing Algorithm by facilitating TF-IDF based on k-means (TF-IDF를 활용한 k-means 기반의 효율적인 대용량 기사 처리 및 요약 알고리즘)

  • Jang, Minseo;OH, Sujin;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.271-274
    • /
    • 2018
  • 본 논문에서는 뉴스기사 데이터를 활용하여 대규모 뉴스기사를 소주제로 분류하는 군집 분석 방법을 제안한다. 또한, 분류된 뉴스기사를 사용자가 빠르게 이해하고 접할 수 있도록 핵심 문장을 추출하여 제공하는 방법을 제안한다. 분석 데이터는 포털 사이트 점유율 1위인 네이버의 경제 분야 뉴스기사를 크롤링하여 수집한다. 뉴스기사의 분석을 위해 전 처리를 통해 특수문자, 조사, 어미, 구두점 등의 불 용어 처리를 수행한다. 또한, k-means 알고리즘을 이용하여 대용량의 뉴스기사를 주제 별로 분류하는 것을 진행하며 그것을 토대로 핵심 문장을 추출한다. 추출된 핵심 문장은 분류된 뉴스기사의 주제를 나타내며 사용자에게 빠르게 정보를 전달하기 위해 활용한다. 본 논문의 연구 내용이 여러 언론사 사이트에 반영되면 사이트 품질과 사용자 만족도 향상에 기여할 수 있을 것으로 보인다.

Analysis on the Hyperlink of News Articles on the Internet Media : Focusing upon the Naver, Daum, Yahoo Site (인터넷 미디어 뉴스기사 본문의 하이퍼링크에 대한 분석 -네이버, 다음, 야후를 중심으로-)

  • Park, Kwang-Soon
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.11
    • /
    • pp.329-340
    • /
    • 2010
  • This paper aims to analyze the hyperlink between the portal sites and the press dot coms news and to grasp the features of news service on the online journalism. As a result of the analysis, the portal sites, in the number of news articles which the hyperlink service had been provided, were more than the press dot coms. But in the number of the hyperlinks in the news story which hyperlink service had been provided, the press dot coms were more than the portal sites. The contents that were hyperlinked to the news stories of online journalism were composed of a informative type and an advertising one. All contents that were hyperlinked to the news stories on portal site were informative. On the other hand, about 92% of the contents that were hyperlinked to the news stories on the press web sites were advertising. By means of this analysis, the features of news service on the online journalism could be grasped.

An Analysis of the Contents and Make-up of the Page in a News Story of the Internet Newspaper -focusing on Naver, Daum, Nate, Yahoo- (인터넷신문의 뉴스기사 페이지 구성과 콘텐츠에 대한 분석 -네이버, 다음, 네이트, 야후를 중심으로-)

  • Park, Kwang-Soon
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.15 no.3
    • /
    • pp.1345-1354
    • /
    • 2014
  • This paper has analyzed how the format of the text page and the contents of space surrounding the text in the news stories of the portal sites are made-up. The result of analysis showed that the formats of the text page in Naver news story were more intricate than those of Daum, Nate and Yahoo. Also, Naver was higher in the number of advertising, the type of advertising, the entertainment contents, and various types of contents than other three portals. Especially, the percentage of new story related to entertainers was the highest. It was the portal site Daum that advertised the news story most of all in its text page. In contrast, it was portal site Yahoo that inserted the advertisements least of all. But from the whole sides, it was found that the formats and contents of the text page of the news story in these three portal sites have similarly been made-up. Consequently speaking, for the serviceability of use in news story, it can be evaluated that the news service method in portal sites is higher than that in press dot coms.

Emergency Disaster Support Fund of Korea in 2020 confirmed through News Articles of Major Newspaper (주요 신문사 뉴스 기사를 통해 살펴본 2020년도 대한민국의 긴급재난지원금)

  • Kwon, Choong-hoon;Lee, Hyoung-Ha
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.169-170
    • /
    • 2020
  • 본 연구는 코로나19 상황에서 대한민국 긴급재난지원금의 모습을 주요 신문사 뉴스 기사들을 통해 분석하고 그 결과를 제시하고자 한다. 분석대상은 2020년 3월 22일부터(긴급재난지원금 첫 보도) 5월 31일까지, 중앙일간지(11개 신문사)의 '긴급재난지원금' 관련 신문기사들이다. 신문기사 분석방법론은 관련 연구주제가 선행연구가 축적되지 않는 상황에서 나름 가치 있는 연구접근법이다. 본 연구에서는 뉴스기사 빅데이터 분석 서비스인 빅카인즈를 활용하여, 관련기사의 뉴스 트렌드, 연관어, 관계도 등을 분석하여 제시하였다. 본 연구는 향후 해당 분석대상을 가지고, 보다 밀도 있고 깊이 있는 언어네트워크(의미망) 분석으로 확장해 나갈 계획이다.

  • PDF

Time Window based Cache Replacement Strategy using Popularity and Life of News-Demand Data (NOD(News On Demand) 데이터의 인기도와 생명주기를 이용하는 시간 윈도우에 기반한 캐시 재배치 기법)

  • 최태욱;박성호;김영주;정기동
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.101-103
    • /
    • 1998
  • 뉴스기사를 구성하는 NOD데이터는 VOD(Video on Demand) 데이터와는 달리 미디어의 종류 및 크기, 시간적인 접근 지역성, 사용자와 상호 작용성 등의 차이점을 가질 뿐만 아니라 새로운 뉴스기사가 수시로 생성되고 사용자가 인기도가 높은 기사와 최신의 뉴스기사에 더 많이 접근하는 특성을 가진다. 본 논문에서는 현재 서비스중인 전자신문의 로그파일을 분석하여 NOD 뉴스기사의 인기도가 Zipf분포와 다름을 보이고, 뉴스기사의 생명주기Lifr Cycle)에 따른 접근 확률분포 제시한다. NOD 데이터의 접근 편기성으로 인하여 데이터 캐싱을 통한 NOD 서버의 성능 향상을 기대할 수 있으나 뉴스기사의 생명주기가 짧고 접근시간대별로 사용자 접근형태가 변하는 등의 이유로 단순히 인기도만 고려한 캐싱은 빈번한 데이터 재배치 문제로 인해 높은 캐시 관리비용을 야기한다. 따라서 본 논문에서는 뉴스 기사의 접근 편기성에 나타나는 인기도(popularity)와 생명주기를 조합한 척도를 제안하고 이를 이용한 재배치를 제안한다.

  • PDF

Analysis of the Types of News Stories on the Online Broadcast -Focusing upon the Broadcasting Websites of NAVER Newsstand- (온라인 방송의 뉴스기사 유형에 대한 분석 -네이버 뉴스스탠드의 방송사 홈페이지를 중심으로-)

  • Park, Kwang Soon
    • Journal of Digital Convergence
    • /
    • v.19 no.3
    • /
    • pp.177-185
    • /
    • 2021
  • This paper aimed to grasp what the percentage in the types of news stories on the online broadcast is, which was conducted by analyzing the news stories of 9 broadcasting websites on the Naver newsstand. For the analysis, a total of 270 days' samples were selected, including 30 days per broadcast on 9 broadcasting websites. For a method of analysis, One-way ANOVA was used to examine the difference among broadcasting websites. The analysis was made centering with priorities given to the type of news stories by the composition of language, the type of genre as a standard of stories, and so on. As a result of analysis, all the programs in the off-line broadcast have been produced and transmitted as a video-typed story, but a half of those in on-line broadcast have been made up of the stories composed of photo and text. The online newspaper has been producing a new type of news' story using video-typed story or computer graphic while the online broadcast has actively been utilizing stories composed of photos and text, which are types of newspaper's stories. From above-mentioned results, it can be understood that the boundary among media is getting more and more indistinct on the environment of online media, showing the phenomenon that the type of broadcast's stories is becoming old-fashioned.

An Analysis of the influence of the Editorial Elements of Portal News Section on the News User's Choice of Articles (포털 뉴스섹션의 편집요인이 뉴스 이용자의 기사선택에 미치는 영향에 대한 분석)

  • Park, Kwang-Soon
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.13 no.5
    • /
    • pp.2087-2095
    • /
    • 2012
  • The editorial elements which are used in this paper are made up of news categories, photograph articles, titles of article written bold strokes and contents of article. Of these elements, only the three elements of photographic articles, the titles of article written bold strokes and contents of article had some effects on the choice of articles. For the portal news, only the news categories, the titles of article written bold strokes and the name of newspaper had an effect on the choice of articles. Of the news genres such as politics, business, social affairs, sports, culture/entertainment, world news and IT/science, only the three genres of social affairs, culture/entertainment and world news had some effects on news users' choice. For the difference between man group and woman group in analyzing the choice of articles, there was the difference in four elements of business, sports, culture/entertainment and IT/science.

Identifying Seoul city issues based on topic modeling of news article (토픽 모델링 기반 뉴스기사 분석을 통한 서울시 이슈 도출)

  • Kwon, Min-Ji
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.11-13
    • /
    • 2019
  • 대중들에게 정보를 빠르고 정확하게 제공하는 대표 매체인 뉴스 기사는 일 평균 1만 5천 건 이상이 보도되고 있다. 특정 주제 또는 분야에 대한 전반적인 동향을 파악하고자 대량의 텍스트 데이터를 수집하여 텍스트 마이닝(Text mining)과 머신러닝 등을 적용하는 연구들이 활발하게 수행되고 있다. 본 연구에서는 서울시의 이슈 및 문제를 파악하고자 약 5년간 뉴스 기사를 수집하여 키워드 분석 및 토픽 모델링을 적용하였다. 분석 결과 5년간의 뉴스 기사에서 빈번하게 출현하는 키워드들을 도출하였고 연도별로 도출된 키워드들을 비교분석하였다. 또한 토픽 모델링 적용 결과 뉴스 기사를 구성하는 20개의 주제를 도출하였으며 이를 기반으로 서울시의 주요 이슈들을 파악할 수 있다. 본 연구는 연도별, 분야별 세부 내용 및 시계열 분석, 다른 도시들의 이슈 및 문제를 도출하는데 활용될 것으로 기대된다.

  • PDF