DOI QR코드

DOI QR Code

멀티태스킹 딥러닝을 이용한 다중요인모형의 주식시장 인덱스 예측

Application of Multifactor Model to Stock Market Index Prediction using Multi-Task Deep Learning

  • 발행 : 20180000

초록

전통적으로 주식시장 효율성을 입증하는 연구에서는 수익률 예측을 위한 주성분 요인 분석이 많이사용되었다. 본 연구에서는 S&P 500 종합주가지수에 포함된 주식들의 수익률 중 주 요인을 추출하기위하여 딥러닝 기법 중 한 가지인 장단기메모리네트워크를 사용하였다. 추출된 요인들을 갖고 2007년12월부터 2010년 12월까지의 S&P 500 종합주가지수의 샘플 외 수익률을 예측한 결과 장단기메모리네트워크를 사용한 요인들은 주성분 분석에 의해 추출된 요인들보다 우월한 예측력을 보였다. 특히장단기메모리네트워크의 요인들은 2008년 1월부터 2009년 6월까지의 금융위기 동안의 수익률을예측하는 데 있어 주성분 분석의 요인들보다 작은 평균 예측 오차를 보였다. LSTM 요인 추출 전– 잡음제거, 수축적인 데이터 압축 기법-다양한 데이터 차원 축소 기법을 사용하였을 때에는 예측오차를 더욱 줄일 수 있었다. 나아가 본 연구에서는 LSTM 네트워크와 데이터 차원 축소기법을동시다발적으로 진행할 수 있는 멀티태스킹 딥러닝을 소개하여 다중요인모형의 예측력을 향상시키고주가 수익률 예측을 위한 다중요인모형의 응용가능성을 선보였다.

A multifactor model, extracting the common factors in returns and then tests whether expectedreturns are explained by the cross-sections of the loadings of security returns on the factors, havebeen popularly studied in cross-sectional return predictability in an efficient stock market. Wedeploy a long short-term memory (LSTM) networks in a multifactor model using individual stockreturns in predicting out-of-sample return of the S&P 500 composite index from December, 2007to December, 2010. We find that a LSTM network, a state-of-the art technique for sequence learningoutperforms a factor regression by principal components. The outperformance, measured by themean squared errors, is clear in predicting composite returns during the most recent financial crisis(January, 2008-June, 2009) when the LSTM is trained by data after dimensionality reduction byvarious autoencoders including denoising, and contractive autoencoder. Furthermore, we suggesta unique architecture of a multitasking network, consolidating an autoencoder and a LSTM network,resulting the best performance in application of a AE+LSTM network to a multifactor model

키워드