News based Stock Market Sentiment Lexicon Acquisition Using Word2Vec

Word2Vec을 활용한 뉴스 기반 주가지수 방향성 예측용 감성 사전 구축

  • 김다예 (연세대학교 정보대학원) ;
  • 이영인 (연세대학교 정보대학원)
  • Received : 2018.08.11
  • Accepted : 2018.08.31
  • Published : 2018.08.31

Abstract

Stock market prediction has been long dream for researchers as well as the public. Forecasting ever-changing stock market, though, proved a Herculean task. This study proposes a novel stock market sentiment lexicon acquisition system that can predict the growth (or decline) of stock market index, based on economic news. For this purpose, we have collected 3-year's economic news from January 2015 to December 2017 and adopted Word2Vec model to consider the context of words. To evaluate the result, we performed sentiment analysis to collected news data with the automated constructed lexicon and compared with closings of the KOSPI (Korea Composite Stock Price Index), the South Korean stock market index based on economic news.

주식 시장에 대한 예측은 오랜 기간 많은 이들의 꿈이었다. 하지만 수많은 노력에도 불구하고 주식 시장을 정확하게 예측하기란 쉬운 일이 아니었다. 본 연구는 주식 시장의 방향성에 주목하여 이 방향성을 예측할 수 있는 감성사전을 구축하는 새로운 방법을 제시한다. 이를 위해 2015년 1월 1일부터 2017년 12월 31일까지 3년간의 증시 뉴스 25,000여 건의 데이터를 수집하여, 문맥을 고려하기 위한 Word2Vec을 적용하였다. 이를 바탕으로 뉴스에 감성분석을 실시하여 KOSPI 종가 지수를 예측해 보았다.

Keywords

References

  1. 김재봉, 김형중, "주가지수 방향성 예측을 위한 도메인 맞춤형 감성사전 구축방안", 한국디지털콘텐츠학회논문지, 제18권, 제3호, pp.585-592, 2017.
  2. 박은정, 조성준, "KoNLPy : 쉽고 간결한 한국어 정보처리 파이썬 패키지", 제26회 한글 및 한국어 정보처리 학술대회논문집, 2014.
  3. 안성원, 조성배, "뉴스 텍스트 마이닝과 시계열 분석을 이용한 주가예측", 한국정보과학회 학술발표논문집, 제37권, 제1C호, pp.364-369, 2010.
  4. 유은지, 김유신, 김남규, 정승렬, "주가지수 방향성 예측을 위한 주제지향감성사전 구축 방안", 지능정보연구, 제19권, 제1호, pp.95-110, 2013. https://doi.org/10.13088/jiis.2013.19.1.095
  5. 한남기, "word2vec 학습 자질을 사용한 새로운 한글 개체명 인식 모델 제안", 석사학위논문, 연세대학교, 서울, 2016.
  6. 홍태호, 김은미, 차은정, "뉴스 감성분석과 SVM을 이용한 다우존스 지수와 S&P500 지수 예측", 인터넷전자상거래연구, 제17권, 제1호, pp.23-36, 2017.
  7. Antweiler, W. and M. Frank, "Is all that talk just noise? The information content of internet stock message boards", The Journal of Finance, Vol.59, No.3, pp.1259-1294, 2004. https://doi.org/10.1111/j.1540-6261.2004.00662.x
  8. Bollen, J., H. Mao, and X. Zeng, "Twitter mood predicts the stock market", Journal of Computational Science, Vol.2, No.1, pp.1-8, 2011. https://doi.org/10.1016/j.jocs.2010.12.007
  9. Fama, E., "The behavior of stock-market prices", The Journal of Business, Vol.38, No.1, pp.34-105, 1965. https://doi.org/10.1086/294743
  10. Hiransha, M., E. Gopalakrishnan, K. Vijay, and K. Soman, "NSE Stock Market Prediction Using Deep-Learning Models", Procedia Computer Science, Vol.132, pp.1351-1362, 2018. https://doi.org/10.1016/j.procs.2018.05.050
  11. Jain, A., "Data clustering: 50 years beyond K-means", Pattern Recognition Letters, Vol.31, No.8, pp.651-666, 2010. https://doi.org/10.1016/j.patrec.2009.09.011
  12. Li, Q., T. Wang, P. Li, L. Liu, Q. Gong, and Y. Chen, "The effect of news and public mood on stock movements", Information Sciences, Vol.278, pp.826-840, 2014. https://doi.org/10.1016/j.ins.2014.03.096
  13. Li, X., H. Xie, L. Chen, J. Wang, and X. Deng, "News impact on stock price return via sentiment analysis", Knowledge-Based Systems, Vol.69, No.1, pp.14-23, 2014.
  14. Matsubara, T., R. Akita, and K. Uehara, "Stock Price Prediction by Deep Neural Generative Model of News Articles", IEICE Transactions on Information and Systems, Vol.E101, No.4, pp.901-908, 2018.
  15. Mikolov, T., K. Chen, G. Corrado, and J. Dean, "Efficient Estimation of Word Representations in Vector Space", arXiv preprint, arXiv:1301.3781 [cs.CL], 2013.
  16. Oliveira, N., P. Cortez, and N. Areal, "Stock market sentiment lexicon acquisition using microblogging data and statistical measures", Decision Support Systems, Vol.85, pp.52-73, 2016
  17. Pang, B. and L. Lee, "Opinion mining and sentiment analysis", Foundations and Trends in Information Retrieval, Vol.2, No.1-2, pp.1-135, 2018.
  18. Qian, B. and K. Rasheed, "Stock market prediction with multiple classifiers", Applied Intelligence, Vol.26, No.1, pp.25-33, 2007. https://doi.org/10.1007/s10489-006-0001-7
  19. Salton, G. and M. McGill, Introduction to Modern Information Retrieva, McGraw-Hill, 1986.
  20. Schumaker, R. and H. Chen, "Textual Analysis of stock market prediction using breaking financial news : The AZFin Text System", ACM Transactions on Information Systems, Vol.27, No.2, pp.1-19, 2009.
  21. Schumaker, R., Y. Zhang, C. Huang, and H. Chen, "Evaluating sentiment in financial news articles", Decision Support Systems, Vol.53, No.3, pp.458-464, 2012. https://doi.org/10.1016/j.dss.2012.03.001
  22. Wu, G., T. Hou, and J. Lin, "Can economic news predict Taiwan stock market returns?", Asia Pacific Management Review, 2018.
  23. Yu, Y., W. Duan, and Q. Cao, "The impact of social and conventional media on firm equity value : a sentiment analysis approach", Decision Support Systems, Vol.55, No.4, pp.919-926, 2013. https://doi.org/10.1016/j.dss.2012.12.028
  24. Zhang, X., H. Fuehres, and P. Gloor, "Predicting Stock Market Indicators Through Twitter "I hope it is not as bad as I fear", Procedia-Social and Behavioral Sciences, Vol.26, pp.55-62, 2011. https://doi.org/10.1016/j.sbspro.2011.10.562
  25. Zhou, X., Z. Pan, H. Guyu, T. Siqi, and C. Zhao, "Stock Market Prediction on High-Frequency Data Using Generative Adversarial Nets", Mathematical Problems in Engineering, Vol.2018, 2018.
  26. http://marketdata.krx.co.kr/mdi#document=030402.
  27. http://finance.naver.com/news/mainnews.nhn.
  28. http://scikit-learn.org/stable/index.html.
  29. https://ko.dict.naver.com/detail.nhn?docid=867600.
  30. https://radimrehurek.com/gensim/.