DOI QR코드

DOI QR Code

Drought index forecast using ensemble learning

앙상블 기법을 이용한 가뭄지수 예측

  • Jeong, Jihyeon (Department of Statistics, Kyungpook National University) ;
  • Cha, Sanghun (Department of Statistics, Kyungpook National University) ;
  • Kim, Myojeong (School of Architectural, Civil, Environment, and Energy Engineering, Kyungpook National University) ;
  • Kim, Gwangseob (School of Architectural, Civil, Environment, and Energy Engineering, Kyungpook National University) ;
  • Lim, Yoon-Jin (National Institute of Meteorological Sciences) ;
  • Lee, Kyeong Eun (Department of Statistics, Kyungpook National University)
  • 정지현 (경북대학교 통계학과) ;
  • 차상훈 (경북대학교 통계학과) ;
  • 김묘정 (경북대학교 공과대학 건설환경에너지공학부) ;
  • 김광섭 (경북대학교 공과대학 건설환경에너지공학부) ;
  • 임윤진 (국립기상과학원 응용기상연구과) ;
  • 이경은 (경북대학교 통계학과)
  • Received : 2017.09.04
  • Accepted : 2017.09.20
  • Published : 2017.09.30

Abstract

In a situation where the severity and frequency of drought events getting stronger and higher, many studies related to drought forecast have been conducted to improve the drought forecast accuracy. However it is difficult to predict drought events using a single model because of nonlinear and complicated characteristics of temporal behavior of drought events. In this study, in order to overcome the shortcomings of the single model approach, we first build various single models capable to explain the relationship between the meteorological drought index, Standardized Precipitation Index (SPI), and other independent variables such as world climate indices. Then, we developed a combined models using Stochastic Gradient Descent method among Ensemble Learnings.

가뭄의 심도와 빈도가 강해지는 상황에서 가뭄예측을 위한 연구가 지속적으로 이루어지고 있으나 가뭄현상의 시간적 변동이 비선형적이며 복잡하여 단일 모형만으로 예측하기에는 한계가 있다. 이 연구에서는 기상가뭄지수인 표준강수지수 (SPI)와 세계기후지수, 날씨 관련 변수 등과 같은 다양한 설명변수들 사이의 관계를 설명할 선행 모형과 가법 모형을 먼저 구축한 후 앙상블 기법 중 확률 기울기 하강 (stochastic gradient descent; SGD) 방법을 이용하여 가중치를 설정하는 결합모형을 구축하였다. 우리나라 14개 지역에 대한 1954년 ~ 2013년 자료를 이용하여 모형을 구축하고 2014년 ~ 2015년 자료를 이용하여 모형의 성능을 비교하였다. 그 결과 14개 지역 중 8개 지역에 대하여 개별 모형에 비해 결합모형의 성능이 좋았으며 가뭄 예측이 개선되었다.

Keywords

References

  1. Clarke, B. (2003). Comparing bayes model averaging and stacking when model approximation error cannot be ignored. Journal of Machine Learning Research, 4, 683-712.
  2. Friedman, J. H. and Stuetzle, W. (1981). Projection pursuit regression. Journal of the American Statistical Association, 76, 817-823. https://doi.org/10.1080/01621459.1981.10477729
  3. Huber, P. J. (1964). Robust estimation of a location parameter. The Annals of Mathematical Statistics, 35, 73-101. https://doi.org/10.1214/aoms/1177703732
  4. Kwak, S. (2014). Comparison of ensemble pruning methods using Lasso-bagging and WAVE-bagging. Journal of the Korean Data & Information Science Society, 25, 1371-1383. https://doi.org/10.7465/jkdi.2014.25.6.1371
  5. Robbins, H. and Monro, S. (1951). A Stochastic approximation method. The Annals of Mathematical Statistics, 22, 400-407. https://doi.org/10.1214/aoms/1177729586
  6. Wolpert, D. H. (1999). An efficient method to estimate bagging's generalization error. Machine Learning Journal, 35, 41-55. https://doi.org/10.1023/A:1007519102914
  7. Yoon, S. (2016). Generating high resolution of daily mean temperature using statistical models. Journal of the Korean Data & Information Science Society, 27, 1215-1224. https://doi.org/10.7465/jkdi.2016.27.5.1215