DOI QR코드

DOI QR Code

토픽 모델 기반의 국가 별 SNS 관심 이슈 분석 시스템

Analysis System for SNS Issues per Country based on Topic Model

  • 김성훈 (고려대학교 정보보호대학원 정보보호학과) ;
  • 윤지원 (고려대학교 정보보호대학원 정보보호학과)
  • 투고 : 2016.06.20
  • 심사 : 2016.08.10
  • 발행 : 2016.11.15

초록

전 세계적으로 SNS의 이용이 활발해짐에 따라, 그와 관련한 다양한 연구가 활발히 진행 중에 있다. 특히 기존의 문서 내 주제 추출에 활용되던 토픽 모델이 SNS 분석에 효과가 있음이 밝혀짐에 따라, 토픽 모델 기반의 이슈 분석과 관련한 연구들이 대거 등장하였다. 이에 본 연구에서는 기존 토픽 모델 기반의 SNS 이슈 분석 기술에 전 세계 지도 시각화 및 이슈 매칭 기술을 결합하여, 전 세계의 각 국가 별 특정 주제와 관련한 관심 이슈와 그 분포의 변화 추이를 분석할 수 있는 시스템을 제안한다. 시스템 구성 요소는 트윗 수집 및 국가 별 분류 모듈, 토픽 모델 기반의 국가 별 토픽 및 분포 추출 모듈, Google geochart 기반의 토픽 및 분포 시각화 모듈이 있다. 미국과 UK 두 국가에서 발생한 5월 한 달간의 ISIS 관련 트윗을 대상으로 실험한 결과, 두 국가의 ISIS 관련 관심 이슈와 그 변화 추이를 확인할 수 있었다.

As the use of SNS continues to increase, various related studies have been conducted. According to the effectiveness of the topic model for existing theme extraction, a huge number of related research studies on topic model based analysis have been introduced. In this research, we suggested an automation system to analyze topics of each country and its distribution in twitter by combining world map visualization and issue matching method. The core system components are the following three modules; 1) collection of tweets and classification by nation, 2) extraction of topics and distribution by country based on topic model algorithm, and 3) visualization of topics and distribution based on Google geochart. In experiments with USA and UK, we could find issues of the two nations and how they changed. Based on these results, we could analyze the differences of each nation's position on ISIS problem.

키워드

참고문헌

  1. Blei, D., A. Ng, and M. Jordan, "Latent Dirichlet Allocation," Journal of Machine Learning Research, Vol. 3, pp. 993-1022, 2003.
  2. Steyvers, M., Griffiths, T.: Probabilistic topic models, Handbook of Latent Semantic Analysis 427(7), pp. 424-440, 2007.
  3. Bae, J. H., J. E. Son, and M. Song, "Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques," Journal of Intelligence and Information Systems, Vol. 19, No. 3, pp. 141-156, 2013. (in Korean) https://doi.org/10.13088/jiis.2013.19.3.141
  4. Jin, S. A., G. E. Heo, Y. K. Jeong, and M. Song, "Topic-Network based Topic Shift Detection on Twitter," Journal of the Korean Society for Information Management, Vol. 30, No. 1, pp. 285-302, 2013. (in Korean) https://doi.org/10.3743/KOSIM.2013.30.1.285
  5. Ryu, W. J., J. W. Ha, Md. Hijbul Alam, and S. K. Sang, "Extracting Trends from Twitter using a Topic Modeling Technique," Proc. of Korea Computer Congress, pp. 191-193, 2013. (in Korean)
  6. Kang, B. I., M. Song, and W. S. Jho, "A Study on Opinion Mining of Newspaper Texts based on Topic Modeling," Journal of the Korean Library and Information Science Society, Vol. 47, No. 4, pp. 315-334, 2013. (in Korean)
  7. Jeong, D. M., J. S. Kim, G. N. Kim, J. U. Heo, B. W. On, and M. J. Kang, "A Proposal of a Keyword Extraction System for Detecting Social Issues," Journal of Intelligence and Information Systems, Vol. 19, No. 3, pp. 1-23, 2013. (in Korean) https://doi.org/10.13088/jiis.2013.19.3.001
  8. Bae, J. H., N. K. Han, and M. Song, "Twitter Issue Tracking System by Topic Modeling Techniques," Journal of intelligence and information systems, Vol. 20, No. 2, pp. 109-122, 2014. (in Korean) https://doi.org/10.13088/JIIS.2014.20.2.109
  9. Karandikar, Anand. 2010. Clustering short status messages: Atopic model based approach. M.phil. thesis, University of Maryland.
  10. Hong, L., and Davison, B. D. 2010. Empirical study of topic modeling in twitter. In Workshop on Social Media Analytics.
  11. F. LU, B. Shen, J. Lin, H. Zhang, "A Method of SNS Topic Models Extraction Based on Self-Adaptively LDA Modeling," Proc. of 2013 Third International Conference on Intelligent System Design and Engineering Applications, IEEE Computer Society, pp. 112-115, 2013.
  12. Adrian Benton, Michael J. Paul, Braden Hancock, Mark Dredze: Collective Supervision of Topic Models for Predicting Surveys with Social Media, AAAI 2016: 2892-2898.
  13. David Alvarez-Melis, Martin Saveski. 2016. Topic Modeling in Twitter: Aggregating Tweets by Conversations, ICWSM 2016: 519-522.
  14. Park, J. H., "IS, 'Terrorist threat' newly released 60 countries including Korea," NEWSIS, November 26, 2015. (in Korean)