• Title/Summary/Keyword: 다중모형 앙상블

Search Result 23, Processing Time 0.03 seconds

Bias-correction of near-real-time multi-satellite precipitation products using machine learning (머신러닝 기반 준실시간 다중 위성 강수 자료 보정)

  • Sungho Jung;Xuan-Hien Le;Van-Giang Nguyen;Giha Lee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.280-280
    • /
    • 2023
  • 강수의 정확한 시·공간적 추정은 홍수 대응, 가뭄 관리, 수자원 계획 등 수문학적 모델링의 핵심 기술이다. 우주 기술의 발전으로 전지구 강수량 측정 프로젝트(Global Precipitation Measurement, GPM)가 시작됨에 따라 위성의 여러 센서를 이용하여 다양한 고해상도 강수량 자료가 생산되고 있으며, 기후변화로 인한 수재해의 빈도가 증가함에 따라 준실시간(Near-Real-Time) 위성 강수 자료의 활용성 및 중요성이 높아지고 있다. 하지만 준실시간 위성 강수 자료의 경우 빠른 지연시간(latency) 확보를 위해 관측 이후 최소한의 보정을 거쳐 제공되므로 상대적으로 강수 추정치의 불확실성이 높다. 이에 따라 본 연구에서는 앙상블 머신러닝 기반 수집된 위성 강수 자료들을 관측 자료와 병합하여 보정된 준실시간 강수량 자료를 생성하고자 한다. 모형의 입력에는 시단위 3가지 준실시간 위성 강수 자료(GSMaP_NRT, IMERG_Early, PERSIANN_CCS)와 방재기상관측 (AWS)의 온도, 습도, 강수량 지점 자료를 활용하였다. 지점 강수 자료의 경우 결측치를 고려하여 475개 관측소를 선정하였으며, 공간성을 고려한 랜덤 샘플링으로 375개소(약 80%)는 훈련 자료, 나머지 100개소(약 20%)는 검증 자료로 분리하였다. 모형의 정량적 평가 지표로는 KGE, MAE, RMSE이 사용되었으며, 정성적 평가 지표로 강수 분할표에 따라 POD, SR, BS 그리고 CSI를 사용하였다. 머신러닝 모형은 개별 원시 위성 강수 자료 및 IDW 기법보다 높은 정확도로 강수량을 추정하였으며 공간적으로 안정적인 결과를 나타내었다. 다만, 최대 강수량에서는 다소 과소추정되므로 이는 강수와 관련된 입력 변수의 개수 업데이트로 해결할 수 있을 것으로 판단된다. 따라서 불확실성이 높은 개별 준실시간 위성 자료들을 관측 자료와 병합하여 보정된 최적 강수 자료를 생성하는 머신러닝 기법은 돌발성 수재해에 실시간으로 대응 가능하며 홍수 예보에 신뢰도 높은 정량적인 강수량 추정치를 제공할 수 있다.

  • PDF

Performance Characteristics of an Ensemble Machine Learning Model for Turbidity Prediction With Improved Data Imbalance (데이터 불균형 개선에 따른 탁도 예측 앙상블 머신러닝 모형의 성능 특성)

  • HyunSeok Yang;Jungsu Park
    • Ecology and Resilient Infrastructure
    • /
    • v.10 no.4
    • /
    • pp.107-115
    • /
    • 2023
  • High turbidity in source water can have adverse effects on water treatment plant operations and aquatic ecosystems, necessitating turbidity management. Consequently, research aimed at predicting river turbidity continues. This study developed a multi-class classification model for prediction of turbidity using LightGBM (Light Gradient Boosting Machine), a representative ensemble machine learning algorithm. The model utilized data that was classified into four classes ranging from 1 to 4 based on turbidity, from low to high. The number of input data points used for analysis varied among classes, with 945, 763, 95, and 25 data points for classes 1 to 4, respectively. The developed model exhibited precisions of 0.85, 0.71, 0.26, and 0.30, as well as recalls of 0.82, 0.76, 0.19, and 0.60 for classes 1 to 4, respectively. The model tended to perform less effectively in the minority classes due to the limited data available for these classes. To address data imbalance, the SMOTE (Synthetic Minority Over-sampling Technique) algorithm was applied, resulting in improved model performance. For classes 1 to 4, the Precision and Recall of the improved model were 0.88, 0.71, 0.26, 0.25 and 0.79, 0.76, 0.38, 0.60, respectively. This demonstrated that alleviating data imbalance led to a significant enhancement in Recall of the model. Furthermore, to analyze the impact of differences in input data composition addressing the input data imbalance, input data was constructed with various ratios for each class, and the model performances were compared. The results indicate that an appropriate composition ratio for model input data improves the performance of the machine learning model.

Drought Outlook using APCC MME Seasonal Prediction Information (APCC MME 계절예측정보를 이용한 가뭄전망)

  • Kang, Boo-Sik;Moon, Su-Jin;Sohn, Soo-Jin;Lee, Woo-Jin
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1784-1788
    • /
    • 2010
  • APEC 기후센터(APEC Climate Center, APCC)에서 제공하는 다중모형앙상블(Multi-model Ensemble, MME) 형태의 계절예측정보를 이용하여 3개월 가뭄전망을 수행하였다. APCC MME는 기후예측모형이 가지는 불확실성을 최소화하기 위한 방법으로, 아시아 태평양 지역 내 9개 회원국 16개 기관 21개 기후모형의 계절예측정보를 활용하여, 개별 모형이 가지는 계통오차(Systematic error)를 앙상블 기법을 통하여 상쇄함으로써 최적의 예측자료를 도출한다. 또한, 기후예측 모형이 예측한 대기순환장은 관측 지점변수와 경험적 통계적 관련성을 가지므로, 이를 바탕으로 상세지역의 이상기후에 대한 정보를 도출할 수 있다. 본 연구에서는 가뭄 관리 및 전망을 위한 입력 자료로서, 기상전문 기관인 APEC 기후센터 (APEC Climate Center, APCC)에서 제공하는 전구 규모의 기온 및 강수 전망자료를 기상청 산하 59개 지점의 전망자료로 통계적 규모 축소화 기법을 통해 3개월 예보를 실시하였다. APCC 계절예측자료를 가뭄모니터링시스템의 자료입력 포맷에 따라 적절히 가공한 뒤, 가뭄 관리 및 전망을 위하여 SPI(Standard Precipitation Index) 및 PDSI(Palmer Drought Severity Index)지수의 입력자료로 사용하여 SPI 및 PDSI 지수를 산정하였다. 또한 분위사상법(Quantile Mapping)을 이용하여 총 59개 지점의 과거 월평균 관측값과 최근 2009년에 대한 모의값의 누적확률분포값을 계산하고 모의값의 확률분포를 관측값의 확률분포에 사상시켜 가뭄 전망을 위한 기상변수의 오차를 보정하고자 하였다. 이러한 계절예측정보를 이용하여 가뭄 전망에 대한 신뢰도가 높아진다면, 사전예방 및 피해완화로 가뭄상황에 대한 신속한 대처 및 피해의 경감이 이루어질 수 있을 것이다.

  • PDF

Hydrologic Variable Prediction Using Nonlinear Ensemble Model (비선형 앙상블 모형을 이용한 수문량 예측)

  • Kwon, Hyun-Han;Kim, Min-Ji;Kim, Jang-Kyung;Na, Bong-Gil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.359-359
    • /
    • 2011
  • 기존 수자원계획에 있어서 수문량 예측은 매우 제한적으로 활용되고 있는 실정으로서 최근 기후변화 및 이상기후로 기인하는 기상학적 불확실성 증가에 대해서 효과적으로 대응 하기가 어렵다. 본 연구에서는 기상인자를 활용한 수문변량 예측기법을 개발하고자 하며 국내에 수문자료가 충분한 지역에 대해서 모형의 적합성과 타당성을 평가하고자 한다. 대부분의 수문변량은 해수면온도, 해수면기압, 바람장 등 Large Scale의 기상학적 특성과 연관성을 가지고 있으며 선행시간을 가지고 수문순환에 영향을 주고 있다. 수문변량과 기상학적 변량사이에는 일반적으로 비선형 관계를 가지고 있는 것으로 알려지고 있으며 이러한 비선형 관계를 효과적으로 예측하기 위해서 본 연구에서는 비선형 예측모형을 개발 하고자 한다. 최근 비선형 예측모형에서 불확실성을 고려한 모형에 대한 연구가 활발히 진행되고 있으며 특히, 다중 모형을 사용한 Ensemble 개념의 예측모형 도입이 이루어지고 있다. 본 연구에서는 국내 다목적댐 유입량 및 강수량에 대해서 최적 기상변량을 도출하고 이를 활용한 비선형 Ensemble 예측모형을 개발하였다. 일반적인 선형 회귀분석 모형에 비해 기상현상과 수문현상에 비선형성을 효과적으로 재현할 수 있는 장점을 확인할 수 있었으며 이와 더불어 예측결과에 대한 불확실성을 제공함으로서 신뢰성 있는 수자원 계획을 위한 기초자료로서 활용이 가능할 것으로 판단된다.

  • PDF

Development of Predictive Model for Length of Stay(LOS) in Acute Stroke Patients using Artificial Intelligence (인공지능을 이용한 급성 뇌졸중 환자의 재원일수 예측모형 개발)

  • Choi, Byung Kwan;Ham, Seung Woo;Kim, Chok Hwan;Seo, Jung Sook;Park, Myung Hwa;Kang, Sung-Hong
    • Journal of Digital Convergence
    • /
    • v.16 no.1
    • /
    • pp.231-242
    • /
    • 2018
  • The efficient management of the Length of Stay(LOS) is important in hospital. It is import to reduce medical cost for patients and increase profitability for hospitals. In order to efficiently manage LOS, it is necessary to develop an artificial intelligence-based prediction model that supports hospitals in benchmarking and reduction ways of LOS. In order to develop a predictive model of LOS for acute stroke patients, acute stroke patients were extracted from 2013 and 2014 discharge injury patient data. The data for analysis was classified as 60% for training and 40% for evaluation. In the model development, we used traditional regression technique such as multiple regression analysis method, artificial intelligence technique such as interactive decision tree, neural network technique, and ensemble technique which integrate all. Model evaluation used Root ASE (Absolute error) index. They were 23.7 by multiple regression, 23.7 by interactive decision tree, 22.7 by neural network and 22.7 by esemble technique. As a result of model evaluation, neural network technique which is artificial intelligence technique was found to be superior. Through this, the utility of artificial intelligence has been proved in the development of the prediction LOS model. In the future, it is necessary to continue research on how to utilize artificial intelligence techniques more effectively in the development of LOS prediction model.

A Study on Prediction of Attendance in Korean Baseball League Using Artificial Neural Network (인경신경망을 이용한 한국프로야구 관중 수요 예측에 관한 연구)

  • Park, Jinuk;Park, Sanghyun
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.6 no.12
    • /
    • pp.565-572
    • /
    • 2017
  • Traditional method for time series analysis, autoregressive integrated moving average (ARIMA) allows to mine significant patterns from the past observations using autocorrelation and to forecast future sequences. However, Korean baseball games do not have regular intervals to analyze relationship among the past attendance observations. To address this issue, we propose artificial neural network (ANN) based attendance prediction model using various measures including performance, team characteristics and social influences. We optimized ANNs using grid search to construct optimal model for regression problem. The evaluation shows that the optimal and ensemble model outperform the baseline model, linear regression model.

A Correction of East Asian Summer Precipitation Simulated by PNU/CME CGCM Using Multiple Linear Regression (다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구)

  • Hwang, Yoon-Jeong;Ahn, Joong-Bae
    • Journal of the Korean earth science society
    • /
    • v.28 no.2
    • /
    • pp.214-226
    • /
    • 2007
  • Because precipitation is influenced by various atmospheric variables, it is highly nonlinear. Although precipitation predicted by a dynamic model can be corrected by using a nonlinear Artificial Neural Network, this approach has limits such as choices of the initial weight, local minima and the number of neurons, etc. In the present paper, we correct simulated precipitation by using a multiple linear regression (MLR) method, which is simple and widely used. First of all, Ensemble hindcast is conducted by the PNU/CME Coupled General Circulation Model (CGCM) (Park and Ahn, 2004) for the period from April to August in 1979-2005. MLR is applied to precipitation simulated by PNU/CME CGCM for the months of June (lead 2), July (lead 3), August (lead 4) and seasonal mean JJA (from June to August) of the Northeast Asian region including the Korean Peninsula $(110^{\circ}-145^{\circ}E,\;25-55^{\circ}N)$. We build the MLR model using a linear relationship between observed precipitation and the hindcasted results from the PNU/CME CGCM. The predictor variables selected from CGCM are precipitation, 500 hPa vertical velocity, 200 hPa divergence, surface air temperature and others. After performing a leave-oneout cross validation, the results are compared with the PNU/CME CGCM's. The results including Heidke skill scores demonstrate that the MLR corrected results have better forecasts than the direct CGCM result for rainfall.

Generation of the bias-corrected satellite precipitation based on machine learning using multiple satellite precipitation products (다중 위성 강수자료를 이용한 머신러닝 기반 최적 위성 강수자료 생성)

  • Jung, Sung Ho;Nguyen, Van Giang;Kim, Young Hun;Lee, Gi Ha
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.40-40
    • /
    • 2021
  • 수재해 방지를 위한 수문해석 모형에서 정량적인 강수자료의 역할은 매우 중요하다. 최근에는 기후변화로 인한 국지성 집중호우 등 돌발 강수의 빈도가 증가하고 있어 지상에 설치된 우량계보다 시·공간적 변동성을 반영할 수 있는 격자형 위성 강수자료의 활용성이 커지고 있다. 하지만 위성강수자료는 관측 시에 대기의 상태 또는 위성별 관측 센서, 공간적 스케일 차이 등에 의해 실제 내린 강수와의 편의가 존재한다. 이를 해결하기 위해 지점 강수자료를 이용한 통계적, 지형정보학적 상세화 기법이 적용되고 있으나, 대부분의 연구에서 강수자료의 양적 보정만을 목적으로 수행되었다. 본 연구에서는 머신러닝 기반의 랜덤포레스트(random forest) 모델을 사용하여 다중위성 강수자료(CHIRPSv2, CMORPH, GSMaP, TRMMv7)와 기상청에서 제공하는 AWS, ASOS 지점 강수를 사용하여 최적 위성강수자료를 생성 후 각 위성강수자료와 비교·분석하였다. 2003년에서 2017년까지의 각 위성강수자료를 수집하여 같은 공간 스케일로 전처리한 뒤 모델에 입력하였으며 AWS 강수자료는 훈련, ASOS 강수자료는 검증에 이용되었다. 그 결과, 생성된 최적 위성강수자료는 각 위성강수자료보다 지점강수와의 편의가 줄고 높은 상관관계를 나타내고 있다. 이는 앞으로 사용될 위성강수자료의 시·공간적 보정 및 단기예측에 활용할 수 있으며, 특히 원격탐사자료의 의존도가 높은 미계측 대유역 수문해석에 정량적인 강수자료를 제공할 수 있을 것으로 판단된다.

  • PDF

A Study on the Timing of Spring Onset over the Republic of Korea Using Ensemble Empirical Mode Decomposition (앙상블 경험적 모드 분해법을 이용한 우리나라 봄 시작일에 관한 연구)

  • Kwon, Jaeil;Choi, Youngeun
    • Journal of the Korean Geographical Society
    • /
    • v.49 no.5
    • /
    • pp.675-689
    • /
    • 2014
  • This study applied Ensemble Empirical Mode Decomposition(EEMD), a new methodology to define the timing of spring onset over the Republic of Korea and to examine its spatio-temporal change. Also this study identified the relationship between spring onet timing and some atmospheric variations, and figured out synoptic factors which affect the timing of spring onset. The averaged spring onset timing for the period of 1974-2011 was 11th, March in Republic of Korea. In general, the spring onset timing was later with higher latitude and altitude regions, and it was later in inland regions than in costal ones. The correlation analysis has been carried out to find out the factors which affect spring onset timing, and global annual mean temperature, Arctic Oscillation(AO), Siberian High had a significant correlation with spring onset timing. The multiple regression analysis was conducted with three indices which were related to spring onset timing, and the model explained 64.7%. As a result of multiple regression analysis, the effect of annual mean temperature was the greatest and that of AO was the second. To find out synoptic factors affecting spring onset timing, the synoptic analysis has been carried out. As a result the intensity of meridional circulation represented as the major factor affect spring onset timing.

  • PDF

Development of Multisite Spatio-Temporal Downscaling Model for Rainfall Using GCM Multi Model Ensemble (다중 기상모델 앙상블을 활용한 다지점 강우시나리오 상세화 기법 개발)

  • Kim, Tae-Jeong;Kim, Ki-Young;Kwon, Hyun-Han
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.35 no.2
    • /
    • pp.327-340
    • /
    • 2015
  • General Circulation Models (GCMs) are the basic tool used for modelling climate. However, the spatio-temporal discrepancy between GCM and observed value, therefore, the models deliver output that are generally required calibration for applied studies. Which is generally done by Multi-Model Ensemble (MME) approach. Stochastic downscaling methods have been used extensively to generate long-term weather sequences from finite observed records. A primary objective of this study is to develop a forecasting scheme which is able to make use of a MME of different GCMs. This study employed a Nonstationary Hidden Markov Chain Model (NHMM) as a main tool for downscaling seasonal ensemble forecasts over 3 month period, providing daily forecasts. Our results showed that the proposed downscaling scheme can provide the skillful forecasts as inputs for hydrologic modeling, which in turn may improve water resources management. An application to the Nakdong watershed in South Korea illustrates how the proposed approach can lead to potentially reliable information for water resources management.