DOI QR코드

DOI QR Code

오토인코더를 이용한 요인 강화 HAR 모형

Autoencoder factor augmented heterogeneous autoregressive model

  • 박민수 (성균관대학교 통계학과) ;
  • 백창룡 (성균관대학교 통계학과)
  • Park, Minsu (Department of Statistics, Sungkyunkwan University) ;
  • Baek, Changryong (Department of Statistics, Sungkyunkwan University)
  • 투고 : 2021.09.08
  • 심사 : 2021.10.28
  • 발행 : 2022.02.28

초록

실현 변동성은 강한 종속성을 가짐이 잘 알려져 있으며, 글로벌 금융 시장과 유기적으로 연관이 되어 있을 뿐만 아니라 환율, 유가, 이자율 등의 거시적인 지표와도 밀접한 관계가 있다. 본 논문은 이러한 실현 변동성의 효과적인 예측을 위해서 오토인코더를 이용한 FAHAR (autoencoder factor-augmented heterogeneous autoregressive, AE-FAHAR) 모형을 제안한다. AE-FAHAR 모형은 강한 종속성을 HAR 구조로 반영하고, 외부 효과에 대한 영향을 오토인코더를 사용하여 몇 개의 요인으로 추출하여 이를 반영한다. 오토인코더는 비선형 방법으로 요인을 추정하기에 많은 계산 시간이 필요하지만 복잡하고 비정상성을 가질 수 있는 고차원 시계열 자료의 요약에 더 적합하다. 이는 곧 실증 자료 분석을 통해 AE-FAHAR 모형이 예측 오차를 줄임을 확인할 수 있었다. 또한 계산 시간을 줄이고 추정 오차를 줄이기 위해 오토인코더에 사전학습 및 앙상블을 적용하는 등의 방법에 대해서도 논의하였다.

Realized volatility is well known to have long memory, strong association with other global financial markets and interdependences among macroeconomic indices such as exchange rate, oil price and interest rates. This paper proposes autoencoder factor-augmented heterogeneous autoregressive (AE-FAHAR) model for realized volatility forecasting. AE-FAHAR incorporates long memory using HAR structure, and exogenous variables into few factors summarized by autoencoder. Autoencoder requires intensive calculation due to its nonlinear structure, however, it is more suitable to summarize complex, possibly nonstationary high-dimensional time series. Our AE-FAHAR model is shown to have smaller out-of-sample forecasting error in empirical analysis. We also discuss pre-training, ensemble in autoencoder to reduce computational cost and estimation errors.

키워드

과제정보

이 논문은 한국연구재단의 지원을 받아 수행된 기초연구 사업임 (NRF-2019R1F1A1057104).

참고문헌

  1. Agarap AF (2018). Deep Learning Using Rectified Linear Units (relu), arXiv preprint arXiv:1803.08375.
  2. Andersen TG, Bollerslev T, Diebold FX, and Labys P (2003). Modeling and forecasting realized volatility, Econometrica, 71, 579-625. https://doi.org/10.1111/1468-0262.00418
  3. Baek C and Park M (2021). Sparse vector heterogeneous autoregressive modeling for realized volatility, Journal of the Korean Statistical Society, 50, 495-510. https://doi.org/10.1007/s42952-020-00090-5
  4. Bai J and Ng S (2008). Large Dimensional Factor Analysis, Now Publishers Inc.
  5. Cattell RB (1966). The scree test for the number of factors, Multivariate behavioral research, 1, 245-276. https://doi.org/10.1207/s15327906mbr0102_10
  6. Corsi F (2009). A simple approximate long-memory model of realized volatility, Journal of Financial Econometrics, 7, 174-196. https://doi.org/10.1093/jjfinec/nbp001
  7. Gu S, Kelly B, and Xiu D (2021). Autoencoder asset pricing models, Journal of Econometrics, 222, 429-450. https://doi.org/10.1016/j.jeconom.2020.07.009
  8. Kim D and Baek C (2020). Factor-augmented HAR model improves realized volatility forecasting, Applied Economics Letters, 27, 1002-1009. https://doi.org/10.1080/13504851.2019.1657554
  9. Kingma DP and Ba J (2014). Adam: A Method for Stochastic Optimization, arXiv preprint arXiv:1412.6980.
  10. Kramer MA (1991). Nonlinear principal component analysis using autoassociative neural networks, AIChE Journal, 37, 233-243. https://doi.org/10.1002/aic.690370209
  11. Srivastava N, Hinton G, Krizhevsky A, Sutskever I, and Salakhutdinov R (2014). Dropout: a simple way to prevent neural networks from overfitting, Journal of Machine Learning Research, 15, 1929-1958.