• 제목/요약/키워드: public opinion prediction model

검색결과 6건 처리시간 0.024초

유튜브 데이터를 활용한 20대 대선 여론분석 (Analysis of public opinion in the 20th presidential election using YouTube data)

  • 강은경;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.161-183
    • /
    • 2022
  • 여론조사는 유권자들의 투표행위를 예측하고, 그 행위에 영향을 준다는 점에서 선거운동의 강력한 수단이자, 언론의 가장 중요한 기사거리로 자리잡고 있다. 하지만, 여론조사가 활발할수록 후보자들의 공약과 정책을 검증하기 보다 당선 가능성이나 지지도에 관한 조사만 반복적으로 실시하는 등 선거 캠페인에 관한 효과 측정에서 유권자들의 마음을 제대로 반영하지 못하는 경우가 많다. 여론조사의 선거 결과에 대한 부실한 예측이 언론사의 권위를 실추시켰다 하더라도, 어느 후보가 최종 승리할지에 대해 인간의 본능적인 궁금증을 풀어줄 명백한 대안이 없기 때문에 사람들은 여론조사에 대한 관심을 쉽게 놓지 못한다. 이에, 온라인 빅데이터를 통해 인사이트를 발굴하는 환경을 제공하는 썸트렌드의 '유튜브 분석' 기능을 활용하여 20대 대선에 대한 여론을 회고적으로 파악해 보고자 한다. 본 연구를 통해 간단한 유튜브 데이터 분석 결과만으로도 실제 여론(혹은 여론조사 결과)에 근접한 결과를 쉽게 도출하고, 성능이 좋은 여론 예측모형을 구축할 수 있음을 확인하였다.

소셜 미디어(SNS) 데이터 증강을 활용한 효과적인 여론조사 예측 모델 분석 (Analyzing Effective Poll Prediction Model Using Social Media (SNS) Data Augmentation)

  • 황선익;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1800-1808
    • /
    • 2022
  • 선거기간이 되면 많은 여론조사 기관에서 후보자별 지지율을 조사하여 배포한다. 과거에는 여론조사 기관에 의존하여 지지율을 조사할 수밖에 없었지만, 현대 사회에서는 인터넷이나 모바일 SNS나 커뮤니티를 통해 국민 여론이 표출된다. 따라서 인터넷상에 표출된 국민 여론을 자연어 분석을 통해서 파악하면 여론조사 결과만큼 정확한 후보자 지지율을 파악할 수 있다. 따라서 본 논문은 인터넷 커뮤니티 게시글 데이터를 통해 유저들의 정치 관련 언급을 종합하여 선거기간 후보자의 지지율을 추론하는 방법을 제시한다. 게시글에서 지지율을 분석하기 위해 KoBert, KcBert, KoELECTRA모델을 활용하여 실제 여론조사와 가장 상관관계가 높은 모델 생성 방법을 제시하고자 한다.

온라인 게시글의 조회수 분석을 통한 인기도 예측 (Prediction Model for Popularity of Online Articles based on Analysis of Hit Count)

  • 김수도;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제12권4호
    • /
    • pp.40-51
    • /
    • 2012
  • 한국의 온라인 토론게시판은 의견 공유뿐 아니라 여론 형성과 참여를 위한 공간으로 활발히 사용되고 있다. 토론게시판에서 어떤 글은 사회적 정치적 이슈를 몰고 다니기도 하고 어떤 글은 사용자의 관심을 끌지 못하기도 한다. 본 논문에서는 한국의 유명 토론게시판인 다음 아고라와 서프라이즈에서 수집한 글의 통계적 정보를 이용하여 글의 인기를 분석하고 인기글을 예측하기 위한 예측모델을 제안한다. 분석결과 아고라는 87.52%의 글이 게시판에 제출된 후 하루가 지나기 전에 글의 인기가 끝나고 있었지만 서프라이즈는 39%의 글이 4일 이상 인기가 지속되고 있었다. 그렇지만 글의 인기기간과 조회수의 상관관계는 낮았다. 조회수 증가가 오랫동안 지속된다고 해서 최종 조회수가 높다는 것을 의미하지는 않는다. 본 논문에서는 분류와 예측 분야에서 잘 알려진 SVM 모델과 유사매칭 모델, 그리고 새롭게 제안한 예측 모델 '베이스 라인'을 이용하여 인기글을 예측하고 평가하였다. SVM 모델이 F-measure와 정밀도에서 유사매칭과 베이스라인보다 우수하였으며, 베이스라인이 실행시간에서 가장 우수한 성능을 보였다.

기업의 SNS 노출과 주식 수익률간의 관계 분석 (The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea)

  • 김태환;정우진;이상용
    • Asia pacific journal of information systems
    • /
    • 제24권2호
    • /
    • pp.233-253
    • /
    • 2014
  • Can the stock market really be predicted? Stock market prediction has attracted much attention from many fields including business, economics, statistics, and mathematics. Early research on stock market prediction was based on random walk theory (RWT) and the efficient market hypothesis (EMH). According to the EMH, stock market are largely driven by new information rather than present and past prices. Since it is unpredictable, stock market will follow a random walk. Even though these theories, Schumaker [2010] asserted that people keep trying to predict the stock market by using artificial intelligence, statistical estimates, and mathematical models. Mathematical approaches include Percolation Methods, Log-Periodic Oscillations and Wavelet Transforms to model future prices. Examples of artificial intelligence approaches that deals with optimization and machine learning are Genetic Algorithms, Support Vector Machines (SVM) and Neural Networks. Statistical approaches typically predicts the future by using past stock market data. Recently, financial engineers have started to predict the stock prices movement pattern by using the SNS data. SNS is the place where peoples opinions and ideas are freely flow and affect others' beliefs on certain things. Through word-of-mouth in SNS, people share product usage experiences, subjective feelings, and commonly accompanying sentiment or mood with others. An increasing number of empirical analyses of sentiment and mood are based on textual collections of public user generated data on the web. The Opinion mining is one domain of the data mining fields extracting public opinions exposed in SNS by utilizing data mining. There have been many studies on the issues of opinion mining from Web sources such as product reviews, forum posts and blogs. In relation to this literatures, we are trying to understand the effects of SNS exposures of firms on stock prices in Korea. Similarly to Bollen et al. [2011], we empirically analyze the impact of SNS exposures on stock return rates. We use Social Metrics by Daum Soft, an SNS big data analysis company in Korea. Social Metrics provides trends and public opinions in Twitter and blogs by using natural language process and analysis tools. It collects the sentences circulated in the Twitter in real time, and breaks down these sentences into the word units and then extracts keywords. In this study, we classify firms' exposures in SNS into two groups: positive and negative. To test the correlation and causation relationship between SNS exposures and stock price returns, we first collect 252 firms' stock prices and KRX100 index in the Korea Stock Exchange (KRX) from May 25, 2012 to September 1, 2012. We also gather the public attitudes (positive, negative) about these firms from Social Metrics over the same period of time. We conduct regression analysis between stock prices and the number of SNS exposures. Having checked the correlation between the two variables, we perform Granger causality test to see the causation direction between the two variables. The research result is that the number of total SNS exposures is positively related with stock market returns. The number of positive mentions of has also positive relationship with stock market returns. Contrarily, the number of negative mentions has negative relationship with stock market returns, but this relationship is statistically not significant. This means that the impact of positive mentions is statistically bigger than the impact of negative mentions. We also investigate whether the impacts are moderated by industry type and firm's size. We find that the SNS exposures impacts are bigger for IT firms than for non-IT firms, and bigger for small sized firms than for large sized firms. The results of Granger causality test shows change of stock price return is caused by SNS exposures, while the causation of the other way round is not significant. Therefore the correlation relationship between SNS exposures and stock prices has uni-direction causality. The more a firm is exposed in SNS, the more is the stock price likely to increase, while stock price changes may not cause more SNS mentions.

텍스트 마이닝을 활용한 영화흥행 예측 연구 (Study on prediction for a film success using text mining)

  • 이상훈;조장식;강창완;최승배
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1259-1269
    • /
    • 2015
  • 최근 빅 데이터는 학계에서 키워드로 자리매김을 하고 있다. 빅 데이터의 유용성은 학계뿐만 아니라 정부, 지자체 그리고 기업체까지 파급되고 있고, 빅 데이터 속에서 유용한 정보를 도출해 내기 위해 노력하고 있다. 본 연구에서는 영화에 대한 리뷰를 가지고 텍스트 마이닝 (text mining)을 이용한 빅 데이터 분석을 수행한다. 본 연구의 목적은 포털 사이트 'D'사와 영화진흥위원회의 영화에 대한 리뷰 데이터, 그리고 고객들의 평점평균 (score)과 스크린 수 (screen number)를 설명변수로 사용하고, 영화 흥행 여부를 종속변수로 하여 로지스틱 회귀분석을 통한 영화 흥행 예측 모형을 제안하는 것이다. 분석결과, 본 연구에서 제안한 예측모형의 정분류율은 95.74%로 얻어졌다.

Sentiment Analysis on Global Events under Pandemic of COVID-19

  • Junjun, Zhang;Noh, Giseop
    • International Journal of Advanced Culture Technology
    • /
    • 제10권3호
    • /
    • pp.272-280
    • /
    • 2022
  • During last few years, pandemic of COVID-19 has been a global issue. Under the COVID-19, global events have been restricted or canceled to secure public hygiene and safety. Since one of the largest global events is Olympic Games, we selected recent Olympic Games as our case of analysis. Tokyo Olympic Games (TOG) was held in 2021, but it encountered a millennium disaster, the pandemic of COVID-19. In such a special period, it is of great significance to explore the emotional tendency of global views before and TOG via artificial intelligence. This paper vastly collects the TOG comment data of mainstream websites in South Korea, China, and the United States by implementing crawler program for sentiment analysis (SA). And we use a variety of sentiment analysis models to compare the accuracy of the experimental results, to obtain more reliable SA results. In addition, in the prediction results, to reduce the distortion of opinion by a minority, we introduce an algorithm called "Removing Biased Minority Opinions (RBMO)" and provide how to apply this method to the interpretation domain. Through our method, more authoritative SA results were obtained, which in turn provided a basis for predicting the sentiment tendency of countries around the world in TOG during the COVID-19 epidemic.