• 제목/요약/키워드: 앙상블예측

검색결과 319건 처리시간 0.033초

A Jittering-based Neural Network Ensemble Approach for Regionalized Low-flow Frequency Analysis

  • Ahn, Kuk-Hyun
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.382-382
    • /
    • 2020
  • 과거 많은 연구에서 다수의 모형의 결과를 이용한 앙상블 방법론은 인공지능 모형 (artificial neural network)의 예측 능력에 향상을 갖고 온다 논하였다. 본 연구에서는 미계측유역의 저수량(low flow)의 예측을 위하여 Jittering을 기반으로 한 인공지능 모형을 제시하고자 한다. 기본적인 방법론은 설명변수들에게 백색 잡음(white noise)를 삽입하여 훈련되는 자료를 증가시키는 것이다. Jittering을 기반으로 한 인공지능 모형에 대한 효과를 검증하기 위하여 본 연구에서는 Multi-output neural network model을 기반으로 모형을 구축하였다. 다음으로 Jittering을 기반으로 한 앙상블 모형을 variable importance measuring algorithm과 결합시켜서 유역특성치와 예측되는 저수량의 특성치들의 관계를 추론하였다. 본 연구에서 사용되는 방법론들의 효용성을 평가하기 위해서 미동북부에 위치하고 있는 총 207개의 유역을 사용하였다. 결과적으로 본 연구에서 제시한 Jittering을 기반으로 한 인공지능 앙상블 모형은 단일예측모형 (single modeling approach)을 정확도 측면에서 우수한 것으로 확인되었다. 또한, 적은 숫자의 앙상블 모형에서도 그 정확성이 단일예측모형보다 우수한 것을 확인하였다. 마지막으로 본 연구에서는 유역특성치들의 효과가 살펴보고자 하는 저수량의 특성치들에 따라서 일관적으로 영향을 미치거나 그 중요도가 변화하는 것을 확인하였다.

  • PDF

저수관리를 위한 댐의 월유입량 예측 (Forecasting Monthly Inflow for the Storage Management of Small Dams)

  • 지용근;김선주;김필식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.85-89
    • /
    • 2005
  • 도시발달과 인구증가로 인해 오늘날의 수자원 관리와 계획은 복잡하고 그 중요성은 더욱더 커지고 있으며, 인구와 재산의 집중현상으로 인하여 사소한 수문재해로 인해 막대한 인명과 재산피해를 초래될 수 있다. 이런 이유들로 인해 정확한 수문예측과 이를 통한 적절한 수자원 관리는 그 어느 때보다 중요한 인자로 인식되고 있다. 본 연구에서는 수문예측을 통한 소규모 댐으로의 정확한 월유입량 예측을 실시하여 실측유입량과 비교$\cdot$분석함으로서 수자원관리의 효율성을 향상시키고자 하였다. 수문예측을 위해서 확률론적 예측이 가능한 앙상블 예측기법(Ensemble Prediction Method)을 적용하였으며 과거 1968-1997년까지의 강우데이터와 수정 TANK모형을 이용하여 1998부터 2002년까지의 성주댐의 월유입량 앙상블을 생성하였다. 수문예측뿐만 아니라 유입량예측의 정확성을 향상시키기 위해 수정 TANK모형의 매개변수를 최적화기법 중의 하나인 유전자알고리즘을 이용하여 매개변수를 최적화하였으며 평창강유역과 보청천유역의 실측데이터를 이용하여 모형의 검증을 실시하였다. 또한 강우발생시 과소하게 유출량이 산정되는 것을 보완하기 위해 매개변수를 평수기와 홍수기의 구분하여 모형을 적용하였다. 본 연구에서 제시된 앙상블 예측기법과 최적화된 수정 TANK모형을 이용하여 댐의 수자원을 관리한다면 효율적인 관리가 이루어 질 것으로 판단된다.

  • PDF

앙상블 유량예측 시스템의 사전 및 사후처리에 관한 연구 (Pre- and Post-Processors of Ensemble Streamflow Prediction System)

  • 강태호;김영오;홍일표
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.264-268
    • /
    • 2008
  • 미래 발생 가능한 수문 및 기상현상의 예측과정은 지식의 부족과 자연현상의 다양성으로 인해 불확실성을 포함하게 된다. 하지만 많은 예측들은 아직까지 확정적으로 제공되고 있으며, 결과적으로 예측결과의 불확실성 정도를 제공하지 못하고 있다. 앙상블 유량예측(ESP, Ensemble Streamflow Prediction)은 이러한 불확실성을 고려하여 수자원시스템의 의사결정에 있어 중요한 요소 중 하나인 유량예측을 수행할 수 있는 방법이다. 하지만 ESP의 결과는 기상자료, 유역 초기조건, 수문모형의 매개변수, 단순화된 수문모형에 의해 비교적 큰 불확실성을 포함하게 되며, 따라서 실제적인 현업에서의 사용을 위해서는 불확실성 정도를 줄이기 위한 사전 및 사후처리 과정이 요구된다. 본 연구에서는 국내에서 활용 가능한 기후 예보자료를 사용하여 앙상블 유량예측에 적용할 수 있는 사전처리 방안들을 검토하고, 국내에서 사후처리를 위해 적용되었던 최적선형 보정기법에 더해 다양한 기법들을 강우유출모형인 TANK모형의 모의결과 보정에 적용하였다. 사전 및 사후처리를 적용한 결과 기상자료와 유량예측과정에 존재하는 불확실성을 저감시키는 것이 가능하였다. 특히 사전 및 사후 처리가 동시에 적용되었을 경우 그 향상 정도가 단순히 각각의 방법에 의한 향상 정도를 합한 것보다 높게 나타날 수 있음이 확인되었다. 사전 및 사후처리를 동시에 적용한 경우 이수기에는 RPS(Ranked Probability Score) 평가방법 내에서 54%를, 홍수기에는 8%를 향상시키는 것이 가능하였다.

  • PDF

SVM 앙상블을 이용한 심혈관질환 질환단계 예측 (Prediction of Cardiovascular Disease Steps using Support Vector Machine Ensemble)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.76-78
    • /
    • 2006
  • 현재 심혈관 질환은 암 다음으로 높은 사망 원인으로 기록되고 있어 심혈관 질환에 대한 초기 진단은 질환의 치료에 매우 중요한 문제로 대두되고 있다. 본 논문에서는 SVM을 이용하여 심혈관질환 환자의 질환 단계를 예측하였다. 일반적으로 이진분류에 사용되는 SVM을 이용하여 정상 및 질환 $1{\sim}3$기의 총 4가지 분류가 필요한 다분류 분류문제를 처리하기 위해서 논문에서는 독립적 학습된 단일 SVM 분류기들을 결합하여 분류를 수행하는 SVM 앙상블 방법을 사용하였다. 단일 분류기의 결합은 Majority voting, 최소자승에러기반 가중치 부여, 2단계층 결합 등의 방법으로 수행하여 심혈관 질환 분류에 적합한 앙상블의 구성을 시도하였다. 실험 데이터는 (주)제노프라의 압타머 칩 데이터를 사용하였다. 서로 다른 데이터를 이용하여 학습된 이종의 SVM들을 결합한 결과 질환단계 예측에 있어서 단일 SVM을 이용하여 질환 단계를 예측하는 경우 보다 향상된 질환단계 예측 성능을 관찰할 수 있었으며, 심혈관 질환의 예측에 대해서는 단일 SVM 분류기의 2단 계층 결합법이 가장 좋은 성능을 보임을 확인하였다.

  • PDF

거리척도와 앙상블 기법을 활용한 지가 추정 (Estimating Farmland Prices Using Distance Metrics and an Ensemble Technique)

  • 이창로;박기호
    • 지적과 국토정보
    • /
    • 제46권2호
    • /
    • pp.43-55
    • /
    • 2016
  • 본 연구는 사례 기반 학습(instance-based learning)의 논리를 활용하여 지가를 추정하였다. 다양한 사례 기반 학습 기법 중 k-최근린법을 이용하였으며, k-최근린법 적용시 유사성을 측정하는 거리척도는 유클리디안 거리를 비롯해 문헌에 비교적 자주 등장하는 10개의 거리척도를 사용하였다. 본 연구에서는 k-최근린법에 의한 10 종류의 예측값 중 가장 우수한 성능을 보이는 1개의 예측값을 최종 가격으로 선택하는 대신, 이들 예측값들을 병합하는 앙상블(ensemble) 기법의 논리를 적용하여 최종 예측값을 결정하였다. 앙상블 기법 중 일종의 잔차 적합 모형인 경사 부스팅 앨고리듬을 적용하여 최종 가격을 정하였다. 본 연구에서는 이러한 사례 기반 학습과 앙상블 기법의 이점을 실증적으로 제시하기 위해 전라남도 해남군 소재 농지를 사례로 하여 가격을 추정하였으며, k-최근린법에 의한 10 종류의 예측값보다 앙상블 기법에 의한 가격이 보다 정확한 것을 확인할 수 있었다.

부도 예측을 위한 앙상블 분류기 개발 (Developing an Ensemble Classifier for Bankruptcy Prediction)

  • 민성환
    • 한국산업정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.139-148
    • /
    • 2012
  • 분류기의 앙상블 학습은 여러 개의 서로 다른 분류기들의 조합을 통해 만들어진다. 앙상블 학습은 기계학습 분야에서 많은 관심을 끌고 있는 중요한 연구주제이며 대부분의 경우에 있어서 앙상블 모형은 개별 기저 분류기보다 더 좋은 성과를 내는 것으로 알려져 있다. 본 연구는 부도 예측 모형의 성능개선에 관한 연구이다. 이를 위해 본 연구에서는 단일 모형으로 그 우수성을 인정받고 있는 SVM을 기저 분류기로 사용하는 앙상블 모형에 대해 고찰하였다. SVM 모형의 성능 개선을 위해 bagging과 random subspace 모형을 부도 예측 문제에 적용해 보았으며 bagging 모형과 random subspace 모형의 성과 개선을 위해 bagging과 random subspace의 통합 모형을 제안하였다. 제안한 모형의 성과를 검증하기 위해 실제 기업의 부도 예측 데이터를 사용하여 실험하였고, 실험 결과 본 연구에서 제안한 새로운 형태의 통합 모형이 가장 좋은 성과를 보임을 알 수 있었다.

앙상블 SVM 모형을 이용한 기업 부도 예측 (Bankruptcy prediction using ensemble SVM model)

  • 최하나;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1113-1125
    • /
    • 2013
  • 기업의 부도를 예측하는 것은 회계나 재무 분야에서 중요한 연구주제이다. 지금까지 기업 부도예측을 위해 여러 가지 데이터마이닝 기법들이 적용되었으나 주로 단일 모형을 사용함으로서 복잡한 분류 문제에의 적용에 한계를 갖고 있었다. 본 논문에서는 최근에 각광받고 있는 SVM (support vector machine) 모형들을 결합한 앙상블 SVM 모형 (ensemble SVM model)을 부도예측에 사용하고자 한다. 제안된 앙상블 모형은 v-조각 교차 타당성 (v-fold cross-validation)에 의해 얻어진 여러 가지 모형 중에서 성능이 좋은 상위 k개의 단일 모형으로 구성하고 과반수 투표 방식 (majority voting)을 사용하여 미지의 클래스를 분류한다. 본 논문에서 제안된 앙상블 SVM 모형의 성능을 평가하기 위해 실제 기업의 재무비율 자료와 모의실험자료를 가지고 실험하였고, 실험결과 제안된 앙상블 모형이 여러 가지 평가척도 하에서 단일 SVM 모형들보다 좋은 성능을 보임을 알 수 있었다.

부트스트랩 샘플링 최적화를 통한 앙상블 모형의 성능 개선 (Improving an Ensemble Model by Optimizing Bootstrap Sampling)

  • 민성환
    • 인터넷정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.49-57
    • /
    • 2016
  • 앙상블 학습 기법은 개별 모형보다 더 좋은 예측 성과를 얻기 위해 다수의 분류기를 결합하는 것으로 예측 성과를 향상시키는데에 매우 유용한 것으로 알려져 있다. 배깅은 단일 분류기의 예측 성과를 향상시키는 대표적인 앙상블 기법중의 하나이다. 배깅은 원 학습 데이터로부터 부트스트랩 샘플링 방법을 통해 서로 다른 학습 데이터를 추출하고, 각각의 부트스트랩 샘플에 대해 학습 알고리즘을 적용하여 서로 다른 다수의 기저 분류기들을 생성시키게 되며, 최종적으로 서로 다른 분류기로부터 나온 결과를 결합하게 된다. 배깅에서 부트스트랩 샘플은 원 학습 데이터로부터 램덤하게 추출한 샘플로 각각의 부트스트랩 샘플이 동일한 정보를 가지고 있지는 않으며 이로 인해 배깅 모형의 성과는 편차가 발생하게 된다. 본 논문에서는 이와 같은 부트스트랩 샘플을 최적화함으로써 표준 배깅 앙상블의 성과를 개선시키는 새로운 방법을 제안하였다. 제안한 모형에서는 앙상블 모형의 성과를 개선시키기 위해 부트스트랩 샘플링을 최적화하였으며 이를 위해 유전자 알고리즘이 활용되었다. 본 논문에서는 제안한 모형을 국내 부도 예측 문제에 적용해 보았으며, 실험 결과 제안한 모형이 우수한 성과를 보였다.

최적선형보정을 이용한 앙상블 유량예측 시스템의 개선 (Improvement of the Ensemble Streamflow Prediction System Using Optimal Linear Correction)

  • 정대일;이재경;김영오
    • 한국수자원학회논문집
    • /
    • 제38권6호
    • /
    • pp.471-483
    • /
    • 2005
  • 일단위 강우-유출모형인 SSARR모형을 이용하여 한강, 낙동강, 섬진강유역에 월 앙상블 유량예측 시스템을 구축하였다. 우선 SSARR모형의 월 평균 유출량에 대한 모의정확성을 평가한 결과 한강과 낙동강유역에서는 과소추정하는 경향이 뚜렷하였으며, 섬진강유역에서는 모의오차의 분산이 커 정확성 개선이 필요하였다. 최적선형 보정기법을 적용하여 SSARR모형의 모의유량을 보정한 결과, 섬진강을 제외한 한강과 낙동강유역의 검증지점에서는 모의 정확성이 크게 개선되었다. 또한 1998년부터 2003년까지 월 앙상블 유량예측을 실시하여 예측 정확성을 평가하였다. 한강과 낙동강유역에서 최적선형 보정기법을 이용할 경우 앙상블 유량예측 정확성이 크게 개선되었으나, 섬진강유역은 개선효과가 미비하였다.

베이지안 기법을 통한 유량예측 정확도 개선 (Improvement of streamflow forecast using a Bayesian inference approach)

  • 서승범;김영오;강신욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.303-303
    • /
    • 2018
  • 안정적인 수자원 운용을 위해서는 정확한 유량예측 기술이 필요하다. 본 연구에서는 유량예측 정확도의 개선을 위해 베이지안 추론(Bayesian inference) 기법과 앙상블 유량 예측(Ensemble Streamflow Prediction, ESP) 기법의 결합을 통한 새로운 유량예측 기법(Bayesian ESP)을 제안하였다. ESP를 통한 유량 예보 앙상블은 베이지안 추론의 사전정보로 활용되며, 관측 유량과 ESP 전망 결과의 선형관계를 통해 우도함수가 추정된다. 우도함수는 관측 유량이 존재하는 과거 기간에 대한 ESP를 수행한 후 예보 시점의 관측 유량(concurrent observed flow)과 선행 관측 유량(lagged observed flow)과의 다중선형회귀 모형을 통해 추정된다. 사전정보와 우도함수는 정규분포로 가정되며, 따라서 최종 유량예측인 사후정보 역시 정규분포함수로 산정되게 된다. Bayesian ESP은 ESP에서 발생하는 강우-유출모형 오차의 개선을 통해 수문예측의 정확도를 개선하게 되며 정규분포함수로 최종 결과가 산정되므로 확률예보 형태의 수문 전망도 가능하다. 본 기법을 전국 35개 댐 유역에 시범적용을 한 결과, 모든 유역에서 기존 ESP 기법 대비 수문예측 정확도의 개선을 가져왔으며, 우도함수 추정에 있어 선행 유량의 포함 여부가 수문 예측 정확도의 추가적인 개선을 가져왔다. 본 기법은 주간 예보부터 계절 예보까지 탄력적으로 구축이 가능하며 적용 결과 리드 타임이 길어질수록 예측 능력이 감소되었지만 전체 구간에 있어서 Bayesian ESP 기법이 가장 우수한 예측 정확도를 보여주었다.

  • PDF