• Title/Summary/Keyword: 앙상블평균

Search Result 122, Processing Time 0.023 seconds

Development of ensemble weighting technique for sequential forecasted rainfall to extend forecast precedence time (예측 선행시간 확장을 위한 순차적 예측강우 가중평균 앙상블 생성기법 개발)

  • Na, Wooyoung;Kang, Minseok;Kim, Gildo;Lee, Hyunwook;Yoo, Chulsang
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.59-59
    • /
    • 2019
  • 최근 기후변화로 인해 대류성 집중호우가 빈번하게 발생하고 있으며, 이러한 강우 특성은 산지지역에 위치한 소하천유역에 상당한 피해를 야기한다. 대류성 집중호우는 규모가 작고 속도가 빠르기 때문에 중규모 이상의 유역에서 부분적으로 상이한 강우특성을 보인다. 아울러 이러한 호우패턴의 변화는 일시적인 현상이 아닌 하나의 기상 특성으로 자리를 잡아가고 있기 때문에 이에 대한 대책마련이 더욱 필요한 실정이다. 돌발홍수 예경보시스템에 예측강우 자료는 예측 선행시간의 한계를 가진다. 즉, 예측강우 자료자체가 가지는 편의와 불확실성으로 인해 예측 선행시간이 3시간을 초과하면 신뢰도가 급격히 하락하게 된다. 이를 해결하기 위해 우리나라에서는 지상관측치와의 편의를 보정하거나 예측강우자료 자체의 품질을 개선하려는 노력을 지속하고 있다. 본 연구에서는 예측 선행시간을 확장하고자 순차적으로 생산되는 예측강우를 가중평균하여 앙상블 예측치를 모의하는 기법을 개발하였다. 각 선행시간별 예측강우자료를 앙상블 멤버로 인식하여 이들의 공분산 구조를 파악하고, 분산과 공분산 수치를 이용하여 가중치를 결정하였다. 1, 2, 3시간 예측 선행시간에 대한 확장 가능성을 확인하고자 하였고, 최적의 앙상블 멤버 개수를 결정하여 적용 및 평가하였다. 본 연구에서는 2016년과 2017년에 발생한 주요 호우사상을 선정하고, 우리나라 전역에 걸쳐 예측강우 앙상블 생성 방법론을 적용하였다. 그 결과, 가중평균 앙상블의 예측치가 예측강우장 1개, 단순평균 앙상블 예측치에 비해 좋은 품질의 예측 성능을 보였으며, 예측치의 분산 또한 감소하여 예측에 대한 불확실성이 줄어듦을 확인하였다.

  • PDF

Correlation Analysis Between Climate Indices and Long-Term Trend of Extreme Rainfall using EEMD (앙상블 경험적 모드분해법을 이용한 기상인자와 우리나라 극치강우의 장기경향성간의 상관성 분석)

  • Kim, Hanbeen;Joo, Kyungwon;Kim, Taereem;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.230-230
    • /
    • 2019
  • 대규모순환패턴과 같은 기후시스템에서의 상태와 변화를 정량화하여 나타낸 기상인자는 수문기상학적 변수와 밀접한 연관이 있는 것으로 알려져 있으며, 이에 따라 비정상성 빈도해석의 수행에 있어서 확률분포모형의 매개변수에 대한 공변량으로 널리 활용되고 있다. 본 연구에서는 비정상성 강우빈도해석 시 매개변수의 공변량으로 우리나라의 극치강우의 장기경향성을 잘 반영할 수 있는 기상인자를 선정하고자 한다. 먼저, 시계열자료를 주기성을 가지는 내재모드함수와 장기경향성을 나타내는 잔여값으로 분해할 수 있는 앙상블 경험적 모드분해법을 이용하여 우리나라 전역에 분포된 61개 지점에서 관측된 연 최대치 강우자료의 평균 및 분산에 대한 잔여값을 추출하였다. 다음으로 11개의 월 단위 기상인자에 대한 계절별 연 평균 시계열과 추출된 평균 및 분산의 잔여값과의 상관계수를 산정하였다. 그 결과, 11개의 기상인자 중 Atlantic Meridional Mode (AMM), Atlantic Multi-decadal Oscillation (AMO), North Atlantic Oscillation (NAO)가 우리나라 연 최대치 강우자료의 평균 및 분산에 대한 장기경향성과 높은 상관성이 있는 것으로 나타났다. 계절적으로는 AMM과 AMO의 경우 이전 년도 가을철 평균이 전 지점 평균 약 0.6, NAO는 이전 년도 여름철 평균이 전 지점 평균 0.3 이상의 유의한 상관계수를 가지는 것으로 나타났다.

  • PDF

Ensemble Design of Machine Learning Technigues: Experimental Verification by Prediction of Drifter Trajectory (앙상블을 이용한 기계학습 기법의 설계: 뜰개 이동경로 예측을 통한 실험적 검증)

  • Lee, Chan-Jae;Kim, Yong-Hyuk
    • Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology
    • /
    • v.8 no.3
    • /
    • pp.57-67
    • /
    • 2018
  • The ensemble is a unified approach used for getting better performance by using multiple algorithms in machine learning. In this paper, we introduce boosting and bagging, which have been widely used in ensemble techniques, and design a method using support vector regression, radial basis function network, Gaussian process, and multilayer perceptron. In addition, our experiment was performed by adding a recurrent neural network and MOHID numerical model. The drifter data used for our experimental verification consist of 683 observations in seven regions. The performance of our ensemble technique is verified by comparison with four algorithms each. As verification, mean absolute error was adapted. The presented methods are based on ensemble models using bagging, boosting, and machine learning. The error rate was calculated by assigning the equal weight value and different weight value to each unit model in ensemble. The ensemble model using machine learning showed 61.7% improvement compared to the average of four machine learning technique.

Comparison of Stock Price Forecasting Performance by Ensemble Combination Method (앙상블 조합 방법에 따른 주가 예측 성능 비교)

  • Yang, Huyn-Sung;Park, Jun;So, Won-Ho;Sim, Chun-Bo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.524-527
    • /
    • 2022
  • 본 연구에서는 머신러닝(Machine Learning, ML)과 딥러닝(Deep Learning, DL) 모델을 앙상블(Ensemble)하여 어떠한 주가 예측 방법이 우수한지에 대한 연구를 하고자 한다. 연구에 사용된 모델은 하이퍼파라미터(Hyperparameter) 조정을 통하여 최적의 결과를 출력한다. 앙상블 방법은 머신러닝과 딥러닝 모델의 앙상블, 머신러닝 모델의 앙상블, 딥러닝 모델의 앙상블이다. 세 가지 방법으로 얻은 결과를 평균 제곱근 오차(Root Mean Squared Error, RMSE)로 비교 분석하여 최적의 방법을 찾고자 한다. 제안한 방법은 주가 예측 연구의 시간과 비용을 절약하고, 최적 성능 모델 판별에 도움이 될 수 있다고 사료된다.

Development and Evaluation of an Ensemble Forecasting System for the Regional Ocean Wave of Korea (앙상블 지역 파랑예측시스템 구축 및 검증)

  • Park, JongSook;Kang, KiRyong;Kang, Hyun-Suk
    • Journal of Korean Society of Coastal and Ocean Engineers
    • /
    • v.30 no.2
    • /
    • pp.84-94
    • /
    • 2018
  • In order to overcome the limitation of deterministic forecast, an ensemble forecasting system for regional ocean wave is developed. This system predicts ocean wind waves based on the meteorological forcing from the Ensemble Prediction System for Global of the Korea Meteorological Administration, which is consisted of 24 ensemble members. The ensemble wave forecasting system is evaluated by using the moored buoy data around Korea. The root mean squared error (RMSE) of ensemble mean showed the better performance than the deterministic forecast system after 2 days, especially RMSE of ensemble mean is improved by 15% compared with the deterministic forecast for 3-day lead time. It means that the ensemble method could reduce the uncertainty of the deterministic prediction system. The Relative Operating Characteristic as an evaluation scheme of probability prediction was bigger than 0.9 showing high predictability, meaning that the ensemble wave forecast could be usefully applied.

Spatial Entities Extraction using Bidirectional LSTM-CRF Ensemble (Bidirectional LSTM-CRF 앙상블을 이용한 공간 개체 추출)

  • Min, Tae Hong;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.133-136
    • /
    • 2017
  • 공간 정보 추출은 대량의 텍스트 문서에서 자연어로 표현된 공간 관련 개체 및 관계를 추출하는 것으로 질의응답 시스템, 챗봇 시스템, 네비게이션 시스템 등에서 활용될 수 있다. 본 연구는 한국어에 나타나 있는 공간 개체들을 효과적으로 추출하기 위한 앙상블 기법이 적용된 Bidirectional LSTM-CRF 모델을 소개한다. 한국어 공간 정보 말뭉치를 이용하여 실험한 결과, 기존 모델보다 매크로 평균이 향상되어 전반적인 공간 관계 추출에 유용할 것으로 기대한다.

  • PDF

Spatial Entities Extraction using Bidirectional LSTM-CRF Ensemble (Bidirectional LSTM-CRF 앙상블을 이용한 공간 개체 추출)

  • Min, Tae Hong;Lee, Jae Sung
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.133-136
    • /
    • 2017
  • 공간 정보 추출은 대량의 텍스트 문서에서 자연어로 표현된 공간 관련 개체 및 관계를 추출하는 것으로 질의응답 시스템, 챗봇 시스템, 네비게이션 시스템 등에서 활용될 수 있다. 본 연구는 한국어에 나타나 있는 공간 개체들을 효과적으로 추출하기 위한 앙상블 기법이 적용된 Bidirectional LSTM-CRF 모델을 소개한다. 한국어 공간 정보 말뭉치를 이용하여 실험한 결과, 기존 모델보다 매크로 평균이 향상되어 전반적인 공간 관계 추출에 유용할 것으로 기대한다.

  • PDF

Attention-Based Ensemble for Mitigating Side Effects of Data Imbalance Method (데이터 불균형 기법의 부작용 완화를 위한 어텐션 기반 앙상블)

  • Yo-Han Park;Yong-Seok Choi;Wencke Liermann;Kong Joo Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.546-551
    • /
    • 2023
  • 일반적으로 딥러닝 모델은 모든 라벨에 데이터 수가 균형을 이룰 때 가장 좋은 성능을 보인다. 그러나 현실에서는 특정라벨에 대한 데이터가 부족한 경우가 많으며 이로 인해 불균형 데이터 문제가 발생한다. 이에 대한 해결책으로 오버샘플링과 가중치 손실과 같은 데이터 불균형 기법이 연구되었지만 이러한 기법들은 데이터가 적은 라벨의 성능을 개선하는 동시에 데이터가 많은 라벨의 성능을 저하시키는 부작용을 가지고 있다. 본 논문에서는 이 문제를 완화시키고자 어텐션 기반의 앙상블 기법을 제안한다. 어텐션 기반의 앙상블은 데이터 불균형 기법을 적용한 모델과 적용하지 않은 모델의 출력 값을 가중 평균하여 최종 예측을 수행한다. 이때 가중치는 어텐션 메커니즘을 통해 동적으로 조절된다. 그로므로 어텐션 기반의 앙상블 모델은 입력 데이터 특성에 따라 가중치를 조절할 수가 있다. 실험은 에세이 자동 평가 데이터를 대상으로 수행하였다. 실험 결과로는 제안한 모델이 데이터 불균형 기법의 부작용을 완화하고 성능이 개선되었다.

  • PDF

Analysis of ensemble streamflow prediction effect on deriving dam releases for water supply (용수공급을 위한 댐 방류량 결정에서의 앙상블 유량 예측 효과 분석)

  • Kim, Yeonju;Kim, Gi Joo;Kim, Young-Oh
    • Journal of Korea Water Resources Association
    • /
    • v.56 no.12
    • /
    • pp.969-980
    • /
    • 2023
  • Since the 2000s, ensemble streamflow prediction (ESP) has been actively utilized in South Korea, primarily for hydrological forecasting purposes. Despite its notable success in hydrological forecasting, the original objective of enhancing water resources system management has been relatively overlooked. Consequently, this study aims to demonstrate the utility of ESP in water resources management by creating a simple hypothetical exercise for dam operators and applying it to actual multi-purpose dams in South Korea. The hypothetical exercise showed that even when the means of ESP are identical, different costs can result from varying standard deviations. Subsequently, using sampling stochastic dynamic programming (SSDP) and considering the capacity-inflow ratio (CIR), optimal release patterns were derived for Soyang Dam (CIR = 1.345) and Chungju Dam (CIR = 0.563) based on types W and P. For this analysis, Type W was defined with standard deviation equal to the mean inflow, and Type P with standard deviation ten times of the mean inflow. Simulated operations were conducted from 2020 to 2022 using the derived optimal releases. The results indicate that in the case of Dam Chungju, more aggressive optimal release patterns were derived under types with smaller standard deviations, and the simulated operations demonstrated satisfactory outcomes. Similarly, Soyang Dam exhibited similar results in terms of optimal release, but there was no significant difference in the simulation between types W and P due to its large CIR. Ultimately, this study highlights that even with the same mean values, the standard deviation of ESP impacts optimal release patterns and outcomes in simulation. Additionally, it underscores that systems with smaller CIRs are more sensitive to such uncertainties. Based on these findings, there is potential for improvements in South Korea's current operational practices, which rely solely on single representative values for water resources management.

Generation of runoff ensemble members using the shot noise process based rainfall-runoff model (Shot Noise Process 기반 강우-유출 모형을 이용한 유출 앙상블 멤버 생성)

  • Kang, Minseok;Cho, Eunsaem;Yoo, Chulsang
    • Journal of Korea Water Resources Association
    • /
    • v.52 no.9
    • /
    • pp.603-613
    • /
    • 2019
  • This study proposes a method to generate runoff ensemble members using a rainfall-runoff model based on the shot noise process (hereafter the rainfall-runoff model). The proposed method was applied to generate runoff ensemble members for three drainage basins of Daerim 2, Guro 1 and the Jungdong, whose results were then compared with the observed. The parameters of the rainfall-runoff model were estimated using the empirical formulas like the Kerby, Kraven II and Russel, also the concept of modified rational formula. Gamma and exponential distributions were used to generate random numbers of the parameters of the rainfall-runoff model. Especially, the gamma distribution is found to be useful to generate various random numbers depending on the pre-assigned relationship between mean and standard deviation. Comparison between the generated runoff ensemble members and the observed shows that those runoff ensemble members generated using the gamma distribution with its standard deviation twice of the mean properly cover the observed runoff.