• 제목/요약/키워드: Model Ensemble

검색결과 638건 처리시간 0.029초

A Jittering-based Neural Network Ensemble Approach for Regionalized Low-flow Frequency Analysis

  • Ahn, Kuk-Hyun
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.382-382
    • /
    • 2020
  • 과거 많은 연구에서 다수의 모형의 결과를 이용한 앙상블 방법론은 인공지능 모형 (artificial neural network)의 예측 능력에 향상을 갖고 온다 논하였다. 본 연구에서는 미계측유역의 저수량(low flow)의 예측을 위하여 Jittering을 기반으로 한 인공지능 모형을 제시하고자 한다. 기본적인 방법론은 설명변수들에게 백색 잡음(white noise)를 삽입하여 훈련되는 자료를 증가시키는 것이다. Jittering을 기반으로 한 인공지능 모형에 대한 효과를 검증하기 위하여 본 연구에서는 Multi-output neural network model을 기반으로 모형을 구축하였다. 다음으로 Jittering을 기반으로 한 앙상블 모형을 variable importance measuring algorithm과 결합시켜서 유역특성치와 예측되는 저수량의 특성치들의 관계를 추론하였다. 본 연구에서 사용되는 방법론들의 효용성을 평가하기 위해서 미동북부에 위치하고 있는 총 207개의 유역을 사용하였다. 결과적으로 본 연구에서 제시한 Jittering을 기반으로 한 인공지능 앙상블 모형은 단일예측모형 (single modeling approach)을 정확도 측면에서 우수한 것으로 확인되었다. 또한, 적은 숫자의 앙상블 모형에서도 그 정확성이 단일예측모형보다 우수한 것을 확인하였다. 마지막으로 본 연구에서는 유역특성치들의 효과가 살펴보고자 하는 저수량의 특성치들에 따라서 일관적으로 영향을 미치거나 그 중요도가 변화하는 것을 확인하였다.

  • PDF

신경망과 의사결정 나무를 이용한 충수돌기염 환자의 재원일수 예측모형 개발 (Length-of-Stay Prediction Model of Appendicitis using Artificial Neural Networks and Decision Tree)

  • 정석훈;한우석;서용무;이현실
    • 한국산학기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.1424-1432
    • /
    • 2009
  • 충수돌기염 환자의 LoS(Length of Stay)를 예측하는 것은 병상의 운영에 적지 않은 영향을 준다. 본 논문에서는 Neural Networks와 Decision Tree를 이용하여 LoS와 연관이 높은 입력변수들을 찾아 그 의미를 분석하며, 찾아낸 입력변수들을 이용하여 다양한 LoS 예측 모형을 개발하고 그 성능을 비교하였다. 모형의 예측 정확성을 높이기 위하여 Bagging과 Boosting 등의 Ensemble 기법도 적용하였다. 실험 결과, Decision Tree 모형이 Neural Networks 모형보다 좀 더 적은 수의 속성을 가지고도 거의 통일한 예측력을 보였으며, Ensemble 기법 중에서는 Bagging 기법이 Boosting 기법보다 좋은 결과를 보여주었다. 의사결정나무 기법은 Neural Networks 기법에 비해 설명력이 있으며, 충수돌기염의 LoS 예측에 매우 효과적이었고, 중요 입력 변수의 선정에도 좋은 결과를 보여줌에 따라 향후 적극적인 기법의 도입이 필요하다고 할 수 있다.

불확실성을 고려한 미래 잣나무의 서식 적지 분포 예측 - 종 분포 모형과 RCP시나리오를 중심으로 - (Estimating Korean Pine(Pinus koraiensis) Habitat Distribution Considering Climate Change Uncertainty - Using Species Distribution Models and RCP Scenarios -)

  • 안윤정;이동근;김호걸;박찬;김지연;김재욱
    • 한국환경복원기술학회지
    • /
    • 제18권3호
    • /
    • pp.51-64
    • /
    • 2015
  • Climate change will make significant impact on species distribution in forest. Pinus koraiensis which is commonly called as Korean Pine is normally distributed in frigid zones. Climate change which causes severe heat could affect distribution of Korean pine. Therefore, this study predicted the distribution of Korean Pine and the suitable habitat area with consideration on uncertainty by applying climate change scenarios on an ensemble model. First of all, a site index was considered when selecting present and absent points and a stratified method was used to select the points. Secondly, environmental and climate variables were chosen by literature review and then confirmed with experts. Those variables were used as input data of BIOMOD2. Thirdly, the present distribution model was made. The result was validated with ROC. Lastly, RCP scenarios were applied on the models to create the future distribution model. As a results, each individual model shows quite big differences in the results but generally most models and ensemble models estimated that the suitable habitat area would be decreased in midterm future(40s) as well as long term future(90s).

Uncertainty Analysis based on LENS-GRM

  • Lee, Sang Hyup;Seong, Yeon Jeong;Park, KiDoo;Jung, Young Hun
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.208-208
    • /
    • 2022
  • Recently, the frequency of abnormal weather due to complex factors such as global warming is increasing frequently. From the past rainfall patterns, it is evident that climate change is causing irregular rainfall patterns. This phenomenon causes difficulty in predicting rainfall and makes it difficult to prevent and cope with natural disasters, casuing human and property damages. Therefore, accurate rainfall estimation and rainfall occurrence time prediction could be one of the ways to prevent and mitigate damage caused by flood and drought disasters. However, rainfall prediction has a lot of uncertainty, so it is necessary to understand and reduce this uncertainty. In addition, when accurate rainfall prediction is applied to the rainfall-runoff model, the accuracy of the runoff prediction can be improved. In this regard, this study aims to increase the reliability of rainfall prediction by analyzing the uncertainty of the Korean rainfall ensemble prediction data and the outflow analysis model using the Limited Area ENsemble (LENS) and the Grid based Rainfall-runoff Model (GRM) models. First, the possibility of improving rainfall prediction ability is reviewed using the QM (Quantile Mapping) technique among the bias correction techniques. Then, the GRM parameter calibration was performed twice, and the likelihood-parameter applicability evaluation and uncertainty analysis were performed using R2, NSE, PBIAS, and Log-normal. The rainfall prediction data were applied to the rainfall-runoff model and evaluated before and after calibration. It is expected that more reliable flood prediction will be possible by reducing uncertainty in rainfall ensemble data when applying to the runoff model in selecting behavioral models for user uncertainty analysis. Also, it can be used as a basis of flood prediction research by integrating other parameters such as geological characteristics and rainfall events.

  • PDF

경향성 변화에 대응하는 딥러닝 기반 초미세먼지 중기 예측 모델 개발 (Development of a Deep Learning-based Midterm PM2.5 Prediction Model Adapting to Trend Changes)

  • 민동준;김혜림;이상근
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.251-259
    • /
    • 2024
  • 초미세먼지, 특히 지름이 2.5㎛ 이하인 PM2.5는 인체 건강과 경제에 큰 피해를 주는 오염물질이다. 본 연구는 대한민국 서울 지역을 중심으로, 2017년부터 2022년까지 자료를 수집하여 PM2.5 데이터 분석 및 데이터 경향성 변화 추이를 분석하고, PM2.5 중기 예측 모델을 개발하는 것을 목표로 한다. 수집, 생산된 대기질 및 기상 데이터, 재분석 데이터, 수치모델 예측 데이터를 바탕으로, 모델을 학습하고 이를 통합한 경향성 변화에도 대응할 수 있는 앙상블 기법을 제안한다. 본 연구에서 제안하는 앙상블 기법은 PM2.5 농도 예측 성능 면에서 기존 모델 대비 미래 D+3~D+6 예측일 F1 Score 기준 평균 2019년 약 42.16%, 2021년 약 58.92%, 2022년 약 34.79% 높은 성능을 보였다. 제안한 모델은 변화하는 환경 조건에도 성능을 유지함으로써 안정적인 예측을 가능하게 하며, 기존 딥러닝 기반 PM2.5 단기 예측보다 먼 예측을 수행하는 중기 예측 모델을 제시한다.

데이터 증강 및 앙상블 기법을 이용한 딥러닝 기반 GPR 공동 탐지 모델 성능 향상 연구 (Improving the Performance of Deep-Learning-Based Ground-Penetrating Radar Cavity Detection Model using Data Augmentation and Ensemble Techniques)

  • 최용욱;서상진;장한길로;윤대웅
    • 지구물리와물리탐사
    • /
    • 제26권4호
    • /
    • pp.211-228
    • /
    • 2023
  • 방조제의 모니터링에는 지구물리학적 비파괴 검사인 GPR (Ground Penetrating Radar) 탐사가 주로 이용된다. GPR 반응은 상황에 따라 복잡한 양상을 보이므로 자료의 처리와 해석은 전문가의 주관적 판단에 의존하며, 이는 오 탐지의 가능성을 불러옴과 동시에 시간이 오래 걸린다는 단점이 있다. 따라서 딥 러닝을 이용하여 GPR 탐사자료의 공동을 탐지하는 다양한 연구들이 수행되고 있다. 딥 러닝 기반 방법은 데이터 기반 방법으로써 풍부한 자료가 필요하나 GPR 탐사의 경우 비용 등의 이유로 학습에 이용할 현장 자료가 부족하다. 따라서 본 논문에서는 데이터 증강 전략을 이용하여 딥 러닝 기반 방조제 GPR 탐사자료 공동 탐지 모델을 개발하였다. 다년간 동일한 방조제에서 탐사 자료를 사용하여 데이터 세트를 구축하였으며, 컴퓨터 비전 분야의 객체 탐지 모델 중 YOLO (You Look Only Once) 모델을 이용하였다. 데이터 증강 전략을 비교 및 분석함으로써 최적의 데이터 증강 전략을 도출하였고, 초기 모델 개발 후 앵커 박스 클러스터링, 전이 학습, 자체 앙상블, 모델 앙상블 기법을 단계적으로 적용하여 최종 모델 도출 후 성능을 평가하였다.

일강우 내삽을 이용한 일유량 시뮬레이션 및 앙상블 유량 발생 (Ensemble Daily Streamflow Forecast Using Two-step Daily Precipitation Interpolation)

  • 황연상;허준행;정영훈
    • 한국수자원학회논문집
    • /
    • 제44권3호
    • /
    • pp.209-220
    • /
    • 2011
  • 입력자료의 불확실성은 강우-유출 모의에서 중요한 불확실성 요소 중의 하나이다. 본 연구에서는 먼저 세 가지의 서로 다른 내삽 기법을 통해 계산된 강수 입력 자료 (관측값을 각 소유역의 중심점으로 내삽하여 추정한 입력자료임)들이 강우-유출 모형에 미치는 영향을 분포형 수문모형 (PRMS)을 이용하여 분석하였으며, 내삽오차를 바탕으로 발생한 입력자료를 앙상블 유량 예측에 이용하는 과정을 수문학적으로 서로 다른 두개 하천 유역에 적용하였다. 또한 Monte Carlo기법을 이용하여 수문 모형의 매개변수가 서로 다른 입력자료의 특성에 따라 변화하는 양상을 구분하여 보았다. 본 연구에서 제시된 앙상블 유량 예측방법은 기상 예측 및 기상 모형의 결과물 등의 입력자료를 이용함으로써 중/장기 유량 예측에 활용될 수 있을 것으로 판단된다.

소셜 텍스트의 주요 정보 추출을 위한 로지스틱 회귀 앙상블 기법 (Logistic Regression Ensemble Method for Extracting Significant Information from Social Texts)

  • 김소현;김한준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권5호
    • /
    • pp.279-284
    • /
    • 2017
  • 빅데이터 시대를 맞이하여 텍스트마이닝과 오피니언마이닝의 활용도가 커지고 있는 시점에서 소셜 네트워크 서비스로부터 유용한 정보를 추출하는 작업은 매우 중요한 연구 주제 중 하나이다. 이에 본 논문은 블로그 HTML 문서에서 주요 본문을 찾는 로지스틱 회귀 앙상블 기법을 제안한다. 먼저, 블로그 HTML 태그에서 구조적 특징, 텍스트 특징을 추출한다. 그 다음, 블로그 HTML 문서에서 추출한 태그 특징에 로지스틱 회귀 및 앙상블 기법을 적용하여 본문을 포함하는 태그를 분류하는 모델을 구성한다. 본 연구의 중요한 발견 중 하나는 태그의 깊이 특징을 이용하여 주요 본문을 찾을 수 있다는 점이다. 다양한 주제의 국내 블로그 데이터를 이용한 실험에서 태그 분류 정확도가 99%, 본문을 찾아낸 문서의 비율이 80.5%로 평가되었다.

오차 계산 방식에 따른 사료용 벼 품종의 품종모수 추정치 불확도 비교 (Comparison between Uncertainties of Cultivar Parameter Estimates Obtained Using Error Calculation Methods for Forage Rice Cultivars)

  • 조영상;현신우;김광수
    • 한국농림기상학회지
    • /
    • 제25권3호
    • /
    • pp.129-141
    • /
    • 2023
  • 작물 모형은 작물의 유전적 특성을 나타내는 품종모수를 요구하며, 품종모수는 작물의 개별 품종별로 추정되어야 한다. 품종모수의 추정에는 고품질의 많은 생육 자료가 요구되지만, 자료의 생산에 상당한 비용이 필요하다. 비교적 낮은 품질의 가용성이 높은 자료를 활용하는 대신, 대량의 랜덤 모수를 생성하고 이를 평가하여 품종모수를 추정할 수 있다. 본 연구에서는 SIMPLE 작물 모델의 불확도를 최소화하기 위해 품종모수 추정 방식을 비교하고, 두 앙상블 방식과 대한 비교를 하였다. 모수 추정을 위한 Metropolis-Hastings (MH) 알고리즘에 대한 목적함수로 로그 가능도(log-likelihood: LL)와 generic composite similarity measure (GCSM)를 사용하였다. 또한 품종모수의 평균값을 사용한 예측(Epm)과 개별 모수들로부터 얻어진 추정값의 평균값(Eem)의 일치도를 분석하여 앙상블 방식에 따른 불확도 변화를 파악하였다. 국내에서 재배되는 사료용 벼 품종인 조우 벼와 영우 벼를 대상으로 품종모수를 추정하였다. 2013년, 2014년, 2016년에 대한 수원, 전주, 나주, 익산에 위치한 실험포장에서 얻은 수량 관측 자료를 사용하였다. 또한 2016년부터 2018년까지 수원에서 보고된 별도의 수량 관측 자료를 사용하였다. 목적함수에 따라 추정된 품종모수의 분포에 차이가 있었다. LL을 통해 얻은 품종모수는 GCSM으로 얻은 품종모수보다 좁은 범위에 분포하였다. 두 가지 앙상블 접근법은 통계적으로 유의한 차이가 나타나지 않음을 확인하였다. GCSM의 상대적으로 높은 불확도는 수용확률을 조정하여 낮출 수 있다고 사료되고, Epm의 결과는 기존과 다른 앙상블 방식을 통해 적은 연산을 통해 불확도를 낮출 수 있음을 보인다.

원격상관을 이용한 동아시아 6월 강수의 예측 (A Prediction of Precipitation Over East Asia for June Using Simultaneous and Lagged Teleconnection)

  • 이강진;권민호
    • 대기
    • /
    • 제26권4호
    • /
    • pp.711-716
    • /
    • 2016
  • The dynamical model forecasts using state-of-art general circulation models (GCMs) have some limitations to simulate the real climate system since they do not depend on the past history. One of the alternative methods to correct model errors is to use the canonical correlation analysis (CCA) correction method. CCA forecasts at the present time show better skill than dynamical model forecasts especially over the midlatitudes. Model outputs are adjusted based on the CCA modes between the model forecasts and the observations. This study builds a canonical correlation prediction model for subseasonal (June) precipitation. The predictors are circulation fields over western North Pacific from the Global Seasonal Forecasting System version 5 (GloSea5) and observed snow cover extent over Eurasia continent from Climate Data Record (CDR). The former is based on simultaneous teleconnection between the western North Pacific and the East Asia, and the latter on lagged teleconnection between the Eurasia continent and the East Asia. In addition, we suggest a technique for improving forecast skill by applying the ensemble canonical correlation (ECC) to individual canonical correlation predictions.