• 제목/요약/키워드: news articles

검색결과 584건 처리시간 0.025초

News Article Identification Methods in Natural Language Processing on Artificial Intelligence & Bigdata

  • Kang, Jangmook;Lee, Sangwon
    • International Journal of Advanced Culture Technology
    • /
    • 제9권3호
    • /
    • pp.345-351
    • /
    • 2021
  • This study is designed to determine how to identify misleading news articles based on natural language processing on Artificial Intelligence & Bigdata. A misleading news discrimination system and method on natural language processing is initiated according to an embodiment of this study. The natural language processing-based misleading news identification system, which monitors the misleading vocabulary database, Internet news articles, collects misleading news articles, extracts them from the titles of the collected misleading news articles, and stores them in the misleading vocabulary database. Therefore, the use of the misleading news article identification system and methods in this study does not take much time to judge because only relatively short news titles are morphed analyzed, and the use of a misleading vocabulary database provides an effect on identifying misleading articles that attract readers with exaggerated or suggestive phrases. For the aim of our study, we propose news article identification methods in natural language processing on Artificial Intelligence & Bigdata.

인터넷 기사와 Best Item 분석을 통해 살펴본 어린이 화장품 연구 (A Study on Children's Cosmetics Based on Analyzing Internet News and Best Items)

  • 심준영
    • 패션비즈니스
    • /
    • 제22권2호
    • /
    • pp.134-149
    • /
    • 2018
  • The number of children wearing make-up is increasing. "Children's cosmetics" is not a legal term though it is commonly used. The purpose of this study is to analyze discussions on children's cosmetics based on news articles found on the internet. This study also identifies what products are being distributed as children's cosmetics. Keyword searches were conducted using internet portal sites. Information was extracted from news articles and Best Item 100 for children's cosmetics. The results of analyzing news articles and Best Item 100 lists are as follows : 1. There were two main discussion topics in news articles. The first topic was related to marketing(the branding and trends of children's cosmetics). The other topic was about government regulations(side effects, harmful ingredients, control, regulations, attention, proper product usage, product categorization, and the overall safety of children's cosmetics). By 2014, many articles had covered government control and regulation. However, since 2017, news articles have focused on the product categorization and the concern for overall safety has dramatically increased. 2. Three different product categories have appeared in the Best Item 100; they are cosmetics, toys, and other products. In market, consumers recognized children's cosmetics as cosmetics and also as toys. Between 2017 and 2018's Best Item, other products are dramatically down, color cosmetics and single cosmetics are on the rise, and the purchase of domestic products has increased.

포털 뉴스섹션의 편집요인이 뉴스 이용자의 기사선택에 미치는 영향에 대한 분석 (An Analysis of the influence of the Editorial Elements of Portal News Section on the News User's Choice of Articles)

  • 박광순
    • 한국산학기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.2087-2095
    • /
    • 2012
  • 본 연구에 이용된 편집요인은 뉴스 카테고리, 사진기사, 굵은 활자체의 기사제목, 신문제호, 기사제목의 내용 등으로 구성되었다. 이 같은 요인 중 사진기사, 굵은 활자체의 기사제목, 기사제목의 내용 등 3개 요인만이 뉴스 이용자들의 기사선택에 영향을 미치는 것으로 나타났다. 이들 요인을 포털뉴스 이용시간의 차이에 따른 분석에서는 뉴스 카테고리, 굵은 활자체의 기사제목, 신문제호 등 3개 요인만이 영향을 미치는 것으로 나타났다. 뉴스 장르가 뉴스 이용자들의 기사선택에 미치는 영향에 대한 분석에서는 정치, 경제, 사회, 스포츠, 문화/연예, 국제, IT/과학 장르 중 사회, 문화/연예, 국제 등 3개 요인만이 이용자들의 기사선택에 영향을 미치는 것으로 나타났다. 이들 요인에 대한 남녀집단 간의 분석에서는 경제, 스포츠, 문화/연예, IT/과학 등 4개 장르에서 기사선택에 차이가 있는 것으로 나타났다. 본 연구는 오프라인 신문에 비해 다양한 방식으로 기사를 노출시키는 온라인 매체에서 전통적인 신문편집의 요소가 기사선택에 어떠한 영향을 미치는가를 파악하여 온 오프라인 신문 간 편집요소의 역할에 대한 차이와 온라인 매체에서의 효과적인 편집방안을 수립하는데 기초적인 단서를 제공할 목적으로 수행되었다.

준 실시간 뉴스 이슈 분석을 위한 계층적·점증적 군집화 (Hierarchical and Incremental Clustering for Semi Real-time Issue Analysis on News Articles)

  • 김호용;이승우;장홍준;서동민
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.556-578
    • /
    • 2020
  • 실시간으로 발생하는 뉴스 기사로부터 이슈를 분석하기 위한 다양한 연구가 진행되어 왔다. 하지만 범주에 따라 계층적으로 이슈를 분석하는 연구는 많이 진행되지 않았고, 계층적 이슈 분석을 위한 기존의 연구에서 제안하는 방식 또한 뉴스 기사 증가에 따라 군집화 속도가 느려지는 문제점이 있다. 따라서 본 논문에서는 준 실시간으로 뉴스 기사의 이슈를 분석하는 계층적·점증적 군집화 방식을 제안한다. 제안하는 군집화 방식은 샴 신경망을 이용한 가중 코사인 유사도 측정 모델 기반의 k-평균 알고리즘을 이용한 단어 군집 기반 문서 표현 방식을 통해 뉴스 기사를 문서 벡터로 표현한다. 그리고 문서 벡터로부터 초기 이슈 군집 트리를 생성하고, 새로 발생한 뉴스 기사를 해당 이슈 군집 트리에 추가하는 점증적 군집화 방식을 제안함으로써 뉴스 기사의 계층적 이슈를 준 실시간으로 분석한다. 마지막으로, 본 논문에서 제안하는 방식과 기존 방식들과의 성능평가를 통해 제안하는 군집화 방식이 정확도 측면에서 기존 방식 대비 NMI 지표 기준 0.26 정도 성능이 향상되었고, 속도 측면에서 약 10배 이상의 성능이 향상됨을 입증하였다.

토픽모델링을 활용한 한국과 미국의 산업수학 이슈 비교 (Comparison of Industrial Mathematics Issues between Korea and the US Using Topic Modeling)

  • 김성연
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.30-45
    • /
    • 2022
  • 본 연구에서는 텍스트마이닝을 활용해 한국과 미국의 온라인 뉴스와 포럼에서 산업수학과 관련한 이슈를 파악하고, 그 결과를 비교 분석하였다. 이를 위해 한국의 주요 포털 사이트인 네이버의 뉴스 기사, 클리앙의 게시글과 댓글, 그리고 미국의 New York Times와 CNN의 뉴스 기사, Reddit의 게시글과 댓글에서 산업수학과 관련한 텍스트 데이터를 수집하여 구조적 토픽모델링 분석을 수행하였다. 주요 분석결과는 다음과 같다. 첫째, 한국의 뉴스는 산업수학의 필요성과 정부의 지원 측면에 대해, 미국에서는 산업수학이 활용되는 다양한 분야에 대해 다루는 것으로 나타났다. 둘째, 한국에서는 온라인 뉴스와 포럼에서 각기 다른 주제로 동일한 개수의 이슈가 나타났지만, 미국에서는 온라인 포럼보다 뉴스 기사에서 더 많은 이슈를 다루고 있는 것으로 나타났다. 이를 토대로 한국에서 산업수학이 정착하는 데 있어 연구자들에게는 학술적, 그리고 정부에는 실무적 시사점을 제시하였다.

Predicting Stock Prices Based on Online News Content and Technical Indicators by Combinatorial Analysis Using CNN and LSTM with Self-attention

  • Sang Hyung Jung;Gyo Jung Gu;Dongsung Kim;Jong Woo Kim
    • Asia pacific journal of information systems
    • /
    • 제30권4호
    • /
    • pp.719-740
    • /
    • 2020
  • The stock market changes continuously as new information emerges, affecting the judgments of investors. Online news articles are valued as a traditional window to inform investors about various information that affects the stock market. This paper proposed new ways to utilize online news articles with technical indicators. The suggested hybrid model consists of three models. First, a self-attention-based convolutional neural network (CNN) model, considered to be better in interpreting the semantics of long texts, uses news content as inputs. Second, a self-attention-based, bi-long short-term memory (bi-LSTM) neural network model for short texts utilizes news titles as inputs. Third, a bi-LSTM model, considered to be better in analyzing context information and time-series models, uses 19 technical indicators as inputs. We used news articles from the previous day and technical indicators from the past seven days to predict the share price of the next day. An experiment was performed with Korean stock market data and news articles from 33 top companies over three years. Through this experiment, our proposed model showed better performance than previous approaches, which have mainly focused on news titles. This paper demonstrated that news titles and content should be treated in different ways for superior stock price prediction.

온라인 뉴스 가치 평가 및 개인화 기법 (A Method for Evaluating Online News Value and Personalization)

  • 최광선;김수동
    • 한국산학기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.8195-8209
    • /
    • 2015
  • 본 논문의 연구 목표는 뉴스 가치 평가에 근거한 중요 뉴스 자동 추천 및 개인화 방안을 제시하는 데에 있다. 뉴스 가치 평가는 전통적인 오프라인 신문에서 편집장들이 1면 뉴스를 선정할 때 사용하는 접근법으로 본 논문에서는 이를 시스템적으로 구현하는 방안을 제시한다. 이렇게 함으로써 콘텐츠 주제에 대한 전통적인 개인 선호 성향과는 다르게 뉴스의 사회적 가치에 대한 관심 성향을 기준으로 중요 뉴스를 선별할 수가 있다. 뉴스의 사회적 가치는 지면 신문의 기존 연구에서 제시한 사회적 중요도, 새로운 볼거리, 수용자 관련성, 인간적 흥미 4가지 기준을 준용하였고, 본 연구에서는 이를 시스템적으로 적용하기 위한 절차적, 구조적 방안을 도출하였다. 중요 뉴스의 선별 과정은 뉴스의 가치 평가를 위한 과정과 평가된 결과를 개인화하는 과정으로 구성된다. 실험을 통해 특정 시점에서의 각 온라인 뉴스 서비스들의 중요 뉴스들과 본 논문에서 제시한 기법을 통해 선별된 중요 뉴스들에 대한 사용자 만족도를 비교 평가하여 본 연구에서 제안하는 방법이 더 효과적임을 확인하였다.

신문에 나타난 간호의 이미지에 관한 연구 (The Image of Nursing projected in Newspapers)

  • 정면숙;강영실
    • 대한간호학회지
    • /
    • 제23권1호
    • /
    • pp.16-28
    • /
    • 1993
  • The purpose of this study was to identify the im-. age of nursing, that is, to see how nursing is viewed in newspapers. Articles about nursing from two Korean daily newspapers from Jan. 1, 1987 to Dec.31, 1991 were examined for subject, type, attitude and author-ship. The inter-rater reliability was 0.89(by The Holsti method). The major findings were as follows : 1. The total number of articles were 110. 2. As for the subjests matter, articles related to professional nursing activities appeared most frequently(29.6%) , there about labor issues and activity to promote nurses's job climate 19.4%, and about official activities of nursing 11.2%. 3. Commentary articles appeared most frequently(41.2%) , Other article forms were straight news(27. 1%), contribution(17.6%) and inter-views (10.6%). 4. Feature stories acounted for 62.4% and news articles for 37.6%. Most of the articles were of national interests(96.5%), the rest(3.5%) of news from abroad. 5. Articles favorable toward nursing accounted for 54.1%, neutral 28.2%, negative 17.6%. 6. Many articles were written by the reporters (66.3%).

  • PDF

A Heuristic Method of In-situ Drought Using Mass Media Information

  • Lee, Jiwan;Kim, Seong-Joon
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.168-168
    • /
    • 2020
  • This study is to evaluate the drought-related bigdata characteristics published from South Korean by developing crawler. The 5 years (2013 ~ 2017) drought-related posted articles were collected from Korean internet search engine 'NAVER' which contains 13 main and 81 local daily newspapers. During the 5 years period, total 40,219 news articles including 'drought' word were found using crawler. To filter the homonyms liken drought to soccer goal drought in sports, money drought economics, and policy drought in politics often used in South Korea, the quality control was processed and 47.8 % articles were filtered. After, the 20,999 (52.2 %) drought news articles of this study were classified into four categories of water deficit (WD), water security and support (WSS), economic damage and impact (EDI), and environmental and sanitation impact (ESI) with 27, 15, 13, and 18 drought-related keywords in each category. The WD, WSS, EDI, and ESI occupied 41.4 %, 34.5 %, 14.8 %, and 9.3 % respectively. The drought articles were mostly posted in June 2015 and June 2017 with 22.7 % (15,097) and 15.9 % (10,619) respectively. The drought news articles were spatiotemporally compared with SPI (Standardized Precipitation Index) and RDI (Reservoir Drought Index) were calculated. They were classified into administration boundaries of 8 main cities and 9 provinces in South Korea because the drought response works based on local government unit. The space-time clustering between news articles (WD, WSS, EDI, and ESI) and indices (SPI and RDI) were tried how much they have correlation each other. The spatiotemporal clusters detection was applied using SaTScan software (Kulldorff, 2015). The retrospective and prospective cluster analyses were conducted for past and present time to understand how much they are intensive in clusters. The news articles of WD, WSS and EDI had strong clusters in provinces, and ESI in cities.

  • PDF

모바일 뉴스 기사를 위한 중첩 기반의 스마트 광고 기법 (Overlapping-based Smart Advertisement Technique for Mobile News Articles)

  • 리자얀티 리타;황민태
    • 한국정보통신학회논문지
    • /
    • 제24권8호
    • /
    • pp.1015-1021
    • /
    • 2020
  • 모바일 뉴스를 접하는 사용자 관점에서는 광고 표출이 없는 순수한 뉴스 기사를 원하지만, 뉴스 제공 회사 관점에서는 광고 수익을 위해 여러 가지 유형으로 광고를 표출하기를 원한다. 본 논문에서는 모바일 뉴스 기사에 표출되는 광고의 유형을 기사의 일부 영역에 고정 배치되는 기사 고정형, 모바일 단말기 화면상에 고정 배치되는 화면 고정형 그리고 이들이 섞여있는 혼합형으로 구분하고서 각 방식의 장단점을 비교하였다. 그리고 뉴스 제공 회사에서 모바일 뉴스 기사를 읽는 독자에게 거부감을 주지 않는 범위에서 효율적으로 광고를 배치하는 중첩 기반의 스마트 솔루션을 제안하였다. 제안하는 방식은 기사 고정형의 일종으로서 뉴스 기사에 부가적으로 제공되는 사진 혹은 가상의 영역에 광고를 중첩하는 기술이다. 성능 평가 결과 제안하는 방식은 광고의 개수나 크기에 따라 광고 이미지의 일부가 중첩되어 가려질 수도 있지만 기존의 광고 표출 방식보다 더 효율적으로 뉴스 기사를 위한 공간을 제공함을 알 수 있다.