• 제목/요약/키워드: news big-data

검색결과 290건 처리시간 0.024초

빅데이터 분석기법을 활용한 아파트 가격 관련 뉴스 기사의 극성 분석 (A Study on the Polarity of Apartment Price News Using Big Data Analysis Method)

  • 조상연;홍은표
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.47-54
    • /
    • 2019
  • 본 연구는 빅데이터 분석 방법인 오피니언 마이닝을 사용하여 아파트 가격 관련 뉴스 기사의 극성을 확인하는 연구로 자료는 2012년, 2018년 2년간 네이버에 게시된 인터넷 뉴스 기사를 사용하였다. 감성분석 모형을 모델링하고 주제 지향형 감성사전 구축 방법을 제안하였다. 제안한 감성분석 모형을 통해 분석한 결과, 아파트 가격이 상승하는 시기에는 사회적 이슈 선정에 있어서 언론사의 성향에 따라 차이가 있는 것을 확인하였고 정부와 동일한 성향의 언론사에서 긍정 기사가 많은 것을 확인하였다. 부동산 분야에서 사용할 수 있는 감성분석 모형을 제시하고 부동산 관련 비정형 데이터의 극성을 분석하였다는 것에 의의가 있다. 향후 다양한 분야에 접목하기 위해서는 주제별 감성사전을 구축해야 하며 다양한 비정형 데이터를 수집하고 수집 기간을 확장하는 것이 필요하다.

확률형 아이템 뉴스 마이닝 : Word2Vec 활용한 키워드 유사도 분석 (Mining Loot Box News : Analysis of Keyword Similarities Using Word2Vec)

  • 김태경;손원석;전성민
    • 한국IT서비스학회지
    • /
    • 제20권2호
    • /
    • pp.77-90
    • /
    • 2021
  • Online and mobile games represent digital entertainment. Not only the game grows fast, but also it has been noted for unique business models such as a subscription revenue model and free-to-play with partial payment. But, a recent revenue mechanism, called a loot-box system, has been criticized due to overspending, weak protection to teenagers, and more over gambling-like features. Policy makers and research communities have counted on expert opinions, review boards, and temporal survey studies to build countermeasures to minimize negative effects of online and mobile games. In this process, speed was not seriously considered. In this study, we attempt to use a big data source to find a way of observing a trend for policy makers and researchers. Specifically, we tried to apply the Word2Vec data mining algorithm to news repositories. From the findings, we acknowledged that the suggested design would be effective in lightening issues timely and precisely. This study contributes to digital entertainment service communities by providing a practical method to follow up trends; thus, helping practitioners have concrete grounds for balancing public concerns and business purposes.

빅데이터를 활용한 안전분야 트렌드 분석 : 가짜뉴스(fake news)를 중심으로 (An Analysis of Trends on the Safety Area Utilizing Big Data : Focused on Fake News)

  • 주성빈
    • 융합보안논문지
    • /
    • 제17권5호
    • /
    • pp.111-119
    • /
    • 2017
  • 2017년 3월 기준, 가짜 뉴스로 인한 폐해는 대체로 정치적 이슈에 집중되어 있다. 국외에서 가짜뉴스 문제는 2016년 미국 대선에서 크게 화제가 된 적이 있고 독일, 프랑스 등 선거를 앞둔 국가들에서도 새로운 정치사회적 문제로 등장하였다. 국내에서는 대통령 탄핵소추 및 탄핵 인용, 조기 대선 등 정치적 이슈와 맞물려 이슈 및 언급량이 집중되고 있다. 이러한 현상은, 최근 다양한 형태의 기사 생성방법 및 정보의 공유방식과 연계되어, 정치적 쟁점과 관련된 가짜 뉴스뿐만 아니라 안전 이슈(safety & security issue)와 관련된 가짜 뉴스의 생산, 확산에 이르고 있고, 결과적으로 국민들에게 상당한 혼란을 야기할 수 있는 정보로 변질될 가능성이 농후하다. 따라서 이러한 문제인식은 관련된 실태분석과 효과적인 대응방안을 고민하는 것은 현 시점에서 중요함을 의미한다. 따라서 이 연구는 가짜 뉴스가 안전 분야에 어떠한 형태로 생성되고 있고, 관련 분야에 어떻게 영향을 미치는가를 확인하는 것이 주요 목적이다. 이를 위해 실시간으로 발생하는 수많은 데이터 속에서 이슈 진단 분석 전망 관리를 위한 정확하고 유의미한 분석을 하고자 하였다. 그 결과, 우리나라에서 언급되고 있는 가짜뉴스는 정치적 이슈뿐만 아니라 안전 이슈와 관련되어 지속적으로 생성되고 있고, 국외에서 발생하는 일반적 형태와는 차이를 보이고 있음을 알 수 있다.

한국 사행산업 관련 뉴스의 빅데이터 분석을 통한 인식 연구 (Study on Perceptions through Big data Analysis on Gambling related News in Korea)

  • 문혜정;김성경
    • 방송공학회논문지
    • /
    • 제22권4호
    • /
    • pp.438-447
    • /
    • 2017
  • 이 연구는 사행산업의 분야인 복권, 체육진흥투표권, 경마, 카지노에 대해 언론에서는 어떻게 다루어지고 있는지를 1990년부터 2015년까지의 뉴스데이터를 의미연결망 분석을 통해 밝혀보고자 하는 연구이다. 기사의 빈도와 연결성을 프레이밍과 시민관심 정도로 재조명 하여 기사에 대한 언론보도자의 의도와 시민의 인식차이를 밝히고, 이를 통해 정책적 특성과 개혁과제를 탐색하였다. 분석결과 복권의 경우 당첨번호, 당첨금, 조작의혹 등 당첨에 대한 부분이 주제인 '사회문제' 형태였으며, 체육진흥투표권의 경우에는 사업입찰, 불법사이트, 발매대상 등 주로 사업추진과 불법사이트에 대한 '의무정보' 종류였고, 경마의 경우 사업장, 홍보, 기사 등으로 사업홍보나 광고 관련 뉴스이었고, 마지막으로 카지노의 경우에는 불법, 도박장, 외국인 등 '주요정보'에 해당하는 논문이었다. 시대에 따라 1990년대에는 카지노, 2000년대에는 복권, 2010년대에는 경마에 대한 기사보도가 많아졌으며, 이에 대한 시민의 반응도 사업비리, 당첨, 시민운동 등의 차이가 있었다. 마지막으로 기사의 빈도와 연결성이 나타내는 프레이밍 정도와 시민의 관심은 '1. 홍보광고(경마), 2. 의무정보(스포츠베팅), 3. 사회이슈(복권), 4. 주요정보(카지노)' 네 가지로 구분되었으며 이 중 사고, 비리 등 주요기사로 구분되는 사회문제가 주요 공공의제로 형성되는 것을 확인할 수 있었다.

빅데이터를 활용한 "조리학원"의 의미연결망 분석에 관한 연구 (A Study on the Semantic Network Analysis of "Cooking Academy" through the Big Data)

  • 이승후;김학선
    • 한국조리학회지
    • /
    • 제24권3호
    • /
    • pp.167-176
    • /
    • 2018
  • In this study, Big Data was used to collect the information related to 'Cooking Academy' keywords. After collecting all the data, we calculated the frequency through the text mining and selected the main words for future data analysis. Data collection was conducted from Google Web and News during the period from January 1, 2013 to December 31, 2017. The selected 64 words were analyzed by using UCINET 6.0 program, and the analysis results were visualized with NetDraw in order to present the relationship of main words. As a result, it was found that the most important goal for the students from cooking school is to work as a cook, likewise to have practical classes. In addition, we obtained the result that SNS marketing system that the social sites, such as Facebook, Twitter, and Instagram are actively utilized as a marketing strategy of the institute. Therefore, the results can be helpful in searching for the method of utilizing big data and can bring brand-new ideas for the follow-up studies. In practical terms, it will be remarkable material about the future marketing directions and various programs that are improved by the detailed curriculums through semantic network of cooking school by using big data.

장애인 평생교육 관련 언론사 뉴스 빅데이터 분석 (News Big Data Analysis of Media Companies related to Lifelong Education for the Disabled)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.183-184
    • /
    • 2022
  • 본 연구는 장애인 평생교육 관련 언론사 뉴스 빅데이터를 한국언론재단의 빅카인즈(BIGKinds) 시스템을 이용하여 분석하였다. 본 연구에서는 2000년 1월 1일부터 2020년 12월 31일까지 20년간, 총 54개 언론사에서 보도한 '장애인 평생교육' 관련 뉴스 기사들을 추출하였다. 그 분석대상 뉴스 빅데이터를 대상으로 키워드 트렌드 분석, 언어 네트워크 지도 구현, 연관어 분석(워드클라우드 제시) 등을 진행하였다. 본 연구 결과는 장애인 평생교육 관련 정책 입안 연구 및 실증적인 연구(평생교육 참여 요인 및 효과 등)의 기초자료로 활용될 수 있을 것으로 기대된다.

  • PDF

언론사 뉴스 빅데이터를 통해 살펴본 『교육감 직선제』 (『Superintendent's Direct Election System』 shown in Media News Big Data)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.351-354
    • /
    • 2022
  • 본 연구는 최근 2022년 6월 1일에 실시된 전국 시도교육청 교육감 선거를 계기로 진행된 연구이다. 본 연구의 목적은 2010년 1월 1일부터 2022년 6월 10일까지 '교육감 직선제'를 다룬 언론사 기사들을 분석하여 그 결과를 객관적으로 제시하는 것이다. 분석 대상은 2010년 1월 1일부터 2022년 6월 10일까지 기간을 설정한 후, '교육감'과 '직선제' 2개의 용어가 모두 포함된 국내 54개 주요 언론사 뉴스 기사들(5,610건)이다. 본 연구에서는 뉴스 빅데이터 분석시스템인 빅카인즈(BIGKinds) 서비스를 적극적으로 이용하여 뉴스 트렌드 분석, 네트워크(관계도) 분석, 연관어 분석 등을 진행하였다. 본 연구자료는 관련 학문 연구자와 교육 현장 종사자들에게 시사점을 줄 수 객관적인 자료로 활용될 것이다. 본 연구는 향후 지방교육자치와 교육감 선거의 발전적 모델 탐색을 위한 다양한 연구 과정으로 확대 전개하고자 한다.

  • PDF

빅데이터 분석도구 R을 활용한 기상뉴스 데이터분석 (Analysis of Weather News using Big Data Analytics Tools R)

  • 김용수;반재훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.448-450
    • /
    • 2016
  • 정보기술과 디지털 경제의 확산으로 대규모의 데이터가 생산되는 정보화시대에서 빅 데이터의 중요성이 강조되고 있으며 다양한 분야에서 이를 응용하고 있다. 빅 데이터 분석도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 본 논문에서는 R을 이용하여 기상뉴스에 나타난 기상관련 빅 데이터를 분석한다. 다양한 뉴스에서 기상 관련 데이터를 수집하고 어떠한 텍스트가 분포되어 있는지 빈도 조사를 수행한다.

  • PDF

Data Empowered Insights for Sustainability of Korean MNEs

  • PARK, Young-Eun
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제6권3호
    • /
    • pp.173-183
    • /
    • 2019
  • This study aims to utilize big data contents of news and social media for developing a corporate strategy of multinational enterprises and their global decision-making through the data mining technique, especially text mining. In this paper, the data of 2 news media (BBC and CNN) and 2 social media (Facebook and Twitter) were collected for the three global leading Korean companies (Samsung, Hyundai Motor Company, and LG) from April, 2018 to April, 2019. The findings of this paper have shown that traditional news media and also modern social media have become devastating tools to extract global trends or phenomena for businesses. Moreover, this presents that a company can adopt a two-track strategy through two different types of media by deriving the key issues or trends from news media channels and also grasping consumers' sentiments, preference or issues of interest such as battery or design from social media. In addition, analyzing the texts of those media and understanding the association rules greatly contribute to the comparison between two different types of media channels to see the difference. Lastly, this provides meaningful and valuable data empowered insights to find a future direction comprehensively and develop a global strategy for sustainability of business.

간호간병통합서비스 관련 온라인 기사 및 소셜미디어 빅데이터의 의미연결망 분석 (Semantic Network Analysis of Online News and Social Media Text Related to Comprehensive Nursing Care Service)

  • 김민지;최모나;염유식
    • 대한간호학회지
    • /
    • 제47권6호
    • /
    • pp.806-816
    • /
    • 2017
  • Purpose: As comprehensive nursing care service has gradually expanded, it has become necessary to explore the various opinions about it. The purpose of this study is to explore the large amount of text data regarding comprehensive nursing care service extracted from online news and social media by applying a semantic network analysis. Methods: The web pages of the Korean Nurses Association (KNA) News, major daily newspapers, and Twitter were crawled by searching the keyword 'comprehensive nursing care service' using Python. A morphological analysis was performed using KoNLPy. Nodes on a 'comprehensive nursing care service' cluster were selected, and frequency, edge weight, and degree centrality were calculated and visualized with Gephi for the semantic network. Results: A total of 536 news pages and 464 tweets were analyzed. In the KNA News and major daily newspapers, 'nursing workforce' and 'nursing service' were highly rated in frequency, edge weight, and degree centrality. On Twitter, the most frequent nodes were 'National Health Insurance Service' and 'comprehensive nursing care service hospital.' The nodes with the highest edge weight were 'national health insurance,' 'wards without caregiver presence,' and 'caregiving costs.' 'National Health Insurance Service' was highest in degree centrality. Conclusion: This study provides an example of how to use atypical big data for a nursing issue through semantic network analysis to explore diverse perspectives surrounding the nursing community through various media sources. Applying semantic network analysis to online big data to gather information regarding various nursing issues would help to explore opinions for formulating and implementing nursing policies.