• Title/Summary/Keyword: 뉴스빅데이터

Search Result 206, Processing Time 0.03 seconds

COVID_19 fake news and real news discrimination system (코로나19 가짜뉴스와 진짜뉴스 판별 시스템)

  • Lee, Jimin;Lee, Jisun;Woo, Jiyoung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.411-412
    • /
    • 2022
  • 본 논문에서는 코로나19 뉴스와 코로나19 가짜뉴스의 데이터셋을 활용하여 입력 받은 뉴스가 가짜뉴스일 확률을 예측한다. 가짜 뉴스 본문에는 코로나19, 대통령, 정부, 가짜, 언론 등의 키워드의 빈도가 높았다. 위의 키워드를 토대로 나이브 베이즈 모델링을 하여 이를 적용해 가짜 뉴스를 가려내는 웹페이지를 개발하였다.

  • PDF

Developing Corporate Valuation System with Opinion Mining Based on Big Data (빅데이터 기반의 오피니언 마이닝을 이용한 기업 가치 평가 시스템 개발)

  • Lee, Jung-Tae;Cheon, Mina;Lim, Sang-Woo;June, Byung-Seok;Kim, Jae-Hoon;Han, Yeong-Woo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.126-128
    • /
    • 2013
  • 빅데이터(Big Data)는 현재 생산되고 있는 데이터 중 그 규모가 방대하고, 생성 주기가 짧으며, 수치 데이터 뿐 아니라 텍스트 이외의 멀티미디어 등 비정형화된 데이터를 포함하는 대규모 데이터를 말한다. 빅데이터를 처리하여 가치 있는 정보를 추출하는 방법에 관한 연구가 활발하게 진행되고 있으며, 이를 바탕으로 빅데이터가 다양한 분야에서 활용되고 있다. 현재 국내 주식시장에서도 빅데이터를 이용하여 기업의 투자에 활용하고 있다. 이 논문에서는 인터넷의 증권과 관련된 뉴스를 수집하여 수집된 뉴스와 주가 지수를 이용하여 기업 뉴스 평가 시스템을 개발하는 방법을 제안한다.

  • PDF

Analysis of Weather News using Big Data Analytics Tools R (빅데이터 분석도구 R을 활용한 기상뉴스 데이터분석)

  • Kim, YongSu;Ban, ChaeHoon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.10a
    • /
    • pp.448-450
    • /
    • 2016
  • 정보기술과 디지털 경제의 확산으로 대규모의 데이터가 생산되는 정보화시대에서 빅 데이터의 중요성이 강조되고 있으며 다양한 분야에서 이를 응용하고 있다. 빅 데이터 분석도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 본 논문에서는 R을 이용하여 기상뉴스에 나타난 기상관련 빅 데이터를 분석한다. 다양한 뉴스에서 기상 관련 데이터를 수집하고 어떠한 텍스트가 분포되어 있는지 빈도 조사를 수행한다.

  • PDF

News Big Data Analysis of Media Companies related to Lifelong Education for the Disabled (장애인 평생교육 관련 언론사 뉴스 빅데이터 분석)

  • Kwon, Choong-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.183-184
    • /
    • 2022
  • 본 연구는 장애인 평생교육 관련 언론사 뉴스 빅데이터를 한국언론재단의 빅카인즈(BIGKinds) 시스템을 이용하여 분석하였다. 본 연구에서는 2000년 1월 1일부터 2020년 12월 31일까지 20년간, 총 54개 언론사에서 보도한 '장애인 평생교육' 관련 뉴스 기사들을 추출하였다. 그 분석대상 뉴스 빅데이터를 대상으로 키워드 트렌드 분석, 언어 네트워크 지도 구현, 연관어 분석(워드클라우드 제시) 등을 진행하였다. 본 연구 결과는 장애인 평생교육 관련 정책 입안 연구 및 실증적인 연구(평생교육 참여 요인 및 효과 등)의 기초자료로 활용될 수 있을 것으로 기대된다.

  • PDF

The Next Generation of Energy News Big Data Analytics (차세대 에너지 관련 뉴스 빅데이터 분석)

  • Lee, YeChan;Cho, HaeChan;Ban, ChaeHoon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.10a
    • /
    • pp.451-453
    • /
    • 2016
  • 대규모의 데이터가 생산되고 저장되는 정보화 시대에서 현재와 과거의 데이터를 바탕으로 미래를 추측하고 방향성을 알아갈 수 있는 빅데이터의 중요성이 강조되고 있다. 정형되지 못한 대규모 데이터를 빅데이터 분석 도구인 R을 통해 통계를 기초로 데이터의 정보분석과 정형화하도록 한다. 본 논문에서는 R을 이용하여 뉴스에서 나타나는 차세대 에너지 관련 빅데이터를 분석한다. 뉴스 기사에서 차세대 에너지 관련 데이터를 수집하고 수집된 키워드를 이용하여 근미래의 효율적인 차세대 에너지의 등장을 예측한다. 에너지 산업의 추진에 대한 흐름과 방향성을 제시하고 의사결정을 위한 기술적 과제를 도출함으로 탄력적인 경영과 의사결정에 도움을 주며 기술적 문제의 근원을 사전에 예측하고 방지할 수 있을 것으로 보여진다.

  • PDF

News Article Big Data Analysis based on Machine Learning in Distributed Processing Environments (분산 처리 환경에서의 기계학습 기반의 뉴스 기사 빅 데이터 분석)

  • Oh, Hee-bin;Lee, Jeong-cheol;Kim, Kyungsup
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.59-62
    • /
    • 2017
  • 본 논문에서는 텍스트 형태의 빅 데이터를 분산처리 환경에서 기계학습을 이용하여 분석하고 유의미한 데이터를 만들어내는 시스템에 대해 다루었다. 빅 데이터의 한 종류인 뉴스 기사 빅 데이터를 분산 시스템 환경(Spark) 내에서 기계 학습(Word2Vec)을 이용하여 뉴스 기사의 키워드 간의 연관도를 분석하는 분산 처리 시스템을 설계 및 구현하였고, 사용자가 입력한 검색어와 연관된 키워드들을 한눈에 파악하기 쉽게 만드는 시각화 시스템을 설계하였다.

『Superintendent's Direct Election System』 shown in Media News Big Data (언론사 뉴스 빅데이터를 통해 살펴본 『교육감 직선제』)

  • Kwon, Choong-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.351-354
    • /
    • 2022
  • 본 연구는 최근 2022년 6월 1일에 실시된 전국 시도교육청 교육감 선거를 계기로 진행된 연구이다. 본 연구의 목적은 2010년 1월 1일부터 2022년 6월 10일까지 '교육감 직선제'를 다룬 언론사 기사들을 분석하여 그 결과를 객관적으로 제시하는 것이다. 분석 대상은 2010년 1월 1일부터 2022년 6월 10일까지 기간을 설정한 후, '교육감'과 '직선제' 2개의 용어가 모두 포함된 국내 54개 주요 언론사 뉴스 기사들(5,610건)이다. 본 연구에서는 뉴스 빅데이터 분석시스템인 빅카인즈(BIGKinds) 서비스를 적극적으로 이용하여 뉴스 트렌드 분석, 네트워크(관계도) 분석, 연관어 분석 등을 진행하였다. 본 연구자료는 관련 학문 연구자와 교육 현장 종사자들에게 시사점을 줄 수 객관적인 자료로 활용될 것이다. 본 연구는 향후 지방교육자치와 교육감 선거의 발전적 모델 탐색을 위한 다양한 연구 과정으로 확대 전개하고자 한다.

  • PDF

A study on the Change of Perception of Public Health before and after COVID-19 (COVID-19 발생 전·후 공공의료에 대한 인식변화)

  • Kim, Yu Jeong;Lee, Dong Su
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.367-370
    • /
    • 2022
  • 본 연구는 코로나19 발생 전·후 공공의료를 둘러싼 사회적 인식변화를 뉴스빅데이터를 통해 파악하고자 시도되었다. 뉴스빅데이터는 코로나19 확진자가 처음 발생한 2020년 1월을 기준으로 나누었으며, 코로나19 발생 이전(2018년 1월~2019년 12월, 총 24개월) 40,834건과 코로나19가 발병 이후(2020년 1월~2021년 12월, 총 21개월) 61,761건이었다. 수집된 빅데이터는 R 4.1.1 for Windows를 활용하여 단어 빈도 분석, 연관규칙분석을 실시하였다. 연구결과, 코로나19 발생 전후 뉴스기사에서 공공의료를 둘러싼 핵심어를 비교할 때 코로나19 발생 후에 발생 전보다 큰 폭으로 상승한 단어는 '확산'(664%), '대응'(658%), '의사'(518%), '상황'(504%), '공공병원'(486%), '의료진'(455%), '확충'(324%), '인력'(305%), '어려움'(272%), '정부'(247%)순으로 나타났다. 코로나19 발생 전후 공공의료를 둘러싼 키워드의 연관규칙 분석을 통해서 의료의 패러다임이 일자리 산업에서 감염증 대응을 위한 보건의료로 전환되는 것을 알수 있었다.

  • PDF

The Venture Business Starts News and SNS Big Data Analytics (벤처창업 관련 뉴스 및 SNS 빅데이터 분석)

  • Ban, ChaeHoon;Lee, YeChan;Ahn, DaeJoong;Kwak, YoonHyeok
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.99-102
    • /
    • 2017
  • 대규모의 데이터가 생산되고 저장되는 정보화 시대에서 현재와 과거의 데이터를 바탕으로 미래를 추측하고 방향성을 알아갈 수 있는 빅데이터의 중요성이 강조되고 있다. 정형화 되지 못한 대규모 데이터를 빅데이터 분석 도구인 R과 웹크롤링을 통해 분석하고 그 통계를 기초로 데이터의 정형화와 정보 분석을 하도록 한다. 본 논문에서는 R과 웹크롤링을 이용하여 최근 이슈가 되고 있는 벤처창업을 주 키워드로 하여 뉴스 및 SNS에서 나타나는 벤처창업 관련 빅데이터를 분석한다. 뉴스기사와 페이스북, 트위터에서 벤처창업 관련 데이터를 수집하고 수집된 데이터에서 키워드를 분류하여 효율적인 벤처창업의 방법과 종류, 방향성에 대해 예측한다. 과거의 벤처창업 실패요인을 분석하고 현재의 문제점을 찾아 데이터 분석을 통해 벤처창업의 흐름과 방향성을 제시하여 창업자들이 겪을 수 있는 어려움을 사전에 예측하고 파악함으로써 실질적인 벤처창업에 크게 이바지할 것으로 보여 진다.

  • PDF

Exploring the leading indicator and time series analysis on the diffusion of big data in Korea (빅데이터 확산에 대한 선행 데이터 탐색 및 국내 확산 과정의 시계열 분석)

  • Choi, Jin;Kim, YoungJun
    • Journal of Technology Innovation
    • /
    • v.26 no.4
    • /
    • pp.57-97
    • /
    • 2018
  • Big Data has spread rapidly in various industries since 2010. We analyzed the general characteristics of big data through time series analysis on the initial process of spreading big data and investigated the difference of diffusion characteristics in each industry. By analyzing papers, patents, news data, and Google Trend using Big Data as a keyword, we searched for data corresponding to the leading indicator, and confirmed that trends in news and Google Trend preceded the papers and patents by two years. We used Google Trend to compare the introduction period of domestic, US, Japan, and China and quantify the process of spreading the eight main industries in Korea through news data. Through this study, we present an empirical research method on how the general technology spreads in several industry sectors and we have figured out where the spreading speed difference of big data originated in each industry in Korea. The method presented here can be used to analyze the technology introduced from foreign countries in developing countries because it can be analyzed in diffusion process of other technologies besides big data and corresponds to the diffusion of technology keywords in a specific country. And, on the corporate side, this approach shows what path is effective when it comes to launching and spreading new technologies.