• 제목/요약/키워드: Multi-Model Ensemble 기법

검색결과 22건 처리시간 0.031초

효율적인 의료진단을 위한 앙상블 분류 기법 (Ensemble Classification Method for Efficient Medical Diagnostic)

  • 정용규;허고은
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.97-102
    • /
    • 2010
  • 의료 데이터 마이닝의 목적은 효율적인 알고리즘 및 기법을 통하여 각종 질병을 예측 분류하고 신뢰도를 높이는데 있다. 기존의 연구로 단일모델을 기반으로 하는 알고리즘이 존재하며 나아가 모델의 더 좋은 예측과 분류 정확도를 위하여 다중모델을 기반으로 하는 앙상블 기법을 적용한 연구도 진행되고 있다. 본 논문에서는 의료데이터의 보다 높은 예측의 신뢰도를 위하여 기존의 앙상블 기법에 사분위간 범위를 적용한 I-ENSEMBLE을 제안한다. 갑상선 기능 저하증 진단을 위한 데이터를 통해 실험 적용한 결과 앙상블의 대표적인 기법인 Bagging, Boosting, Stacking기법 모두 기존에 비해 현저하게 향상된 정확도를 나타내었다. 또한 기존 단일모델 기법과 비교하여 다중모델인 앙상블 기법에 사분위간 범위를 적용했을 때 더 뚜렷한 효과를 나타냄을 확인하였다.

기후변화 영향평가의 불확실성 저감연구 (Reducing Uncertainties in Climate Change Assessment)

  • 이재경;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.345-351
    • /
    • 2008
  • 미래의 기후변화 영향평가에 있어 전지구모형(General Circulation Model)은 가장 중요한 자료 중 하나이다. 즉, 온실가스 방출(emission) 시나리오에 기초한 전지구모형의 모의결과를 이용하면 미래 수자원에 대한 정보를 얻을 수 있다. 하지만 미래 수자원은 방출 시나리오, 상세화(downscaling) 기법, 강우-유출모형, 전지구모형의 종류에 따라 크게 달라질 수 있어 매우 큰 불확실성(uncertainty)을 포함하고 있다. 이러한 불확실성을 줄이는 방법 중 하나로 전지구모형의 모의능력에 따라 가중치(weight)를 부여하고 결합(combining)하는 multi-model 앙상블(ensemble) 기법이 선진국을 중심으로 활발히 연구되고 있다. 본 연구에서는 우선 기후변화 영향평가를 위하여 국내에서 사용가능한 전지구모형을 조사하고 그 중CCSM3, CSRIO, ECHAM4, GFDL, MIRCO를 선택하였다. 한강 충주댐 유역에 대하여 과거($1980{\sim}1999$년)와 미래($2030{\sim}2049$년) 기간에 대하여 전지구모형의 기후정보를 간단한 선형보간법을 이용하여 상세화하였다. 다음으로 multi-model 앙상블 기법을 조사하였다. 본 연구에서는 Giorgi et al.(2002)이 제안한 Reliability Ensemble Average(REA) 기법을 적용하여 선형보간법으로 상세화한 전지구모형의 모의결과에 가중치를 주어 불확실성을 줄이는 연구를 수행하였다. 특히 REA를 구성하는 식 중 모형의 편차(bias) 뿐만 아니라 분산(variance)까지 고려함으로서 이를 개선하는 Modified-REA를 제안하였다. 제안한 방안을 이용하여 결합한 전지구모형의 모의결과가 기존 REA의 결과보다 기후정보의 불확실성을 더 줄일 수 있는 것으로 나타났다.

  • PDF

여름강수량의 단기예측을 위한 Multi-Ensemble GCMs 기반 시공간적 Downscaling 기법 개발 (Development of Multi-Ensemble GCMs Based Spatio-Temporal Downscaling Scheme for Short-term Prediction)

  • 권현한;민영미
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1142-1146
    • /
    • 2009
  • A rainfall simulation and forecasting technique that can generate daily rainfall sequences conditional on multi-model ensemble GCMs is developed and applied to data in Korea for the major rainy season. The GCM forecasts are provided by APEC climate center. A Weather State Based Downscaling Model (WSDM) is used to map teleconnections from ocean-atmosphere data or key state variables from numerical integrations of Ocean-Atmosphere General Circulation Models to simulate daily sequences at multiple rain gauges. The method presented is general and is applied to the wet season which is JJA(June-July-August) data in Korea. The sequences of weather states identified by the EM algorithm are shown to correspond to dominant synoptic-scale features of rainfall generating mechanisms. Application of the methodology to seasonal rainfall forecasts using empirical teleconnections and GCM derived climate forecast are discussed.

  • PDF

MME(Multi-Model Ensemble)를 활용한 국가 수자원 기후변화 영향평가 (Climate Change Impact Assessments on Korean Water Reseources using Multi-Model Ensemble)

  • 배덕효;정일원;이병주;전태현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.198-202
    • /
    • 2009
  • 기후변화는 강수와 기온을 변화시켜 수자원에 지대한 영향을 미칠 것으로 알려져 있다. 따라서 이에 대한 안정적인 수자원 관리를 위해서는 기후변화 영향을 정량적으로 평가하는 것이 필요하다. 기본적으로 기후변화에 대한 수자원의 영향을 연구할 때 '온실가스 배출시나리오, GCMs을 통한 기후모의, 시공간적 편차보정을 위한 상세화, 유출모형 적용을 통한 유출시나리오 생산'의 과정을 거친다. 그러나 유출시나리오를 얻기까지 과정에는 각각 불확실성을 가지고 있기 때문에 최종결과의 불확실성은 각 과정을 거치면서 매우 커진다고 할 수 있다. 다양한 배출시나리오, GCM 결과, 유출모형에 대해 단순평균 혹은 가중치를 주는 multi-model ensemble 기법은 각 경우에 따른 값의 범위를 제시할 수있다는 점 때문에 불확실성 평가에서 주로 이용되고 있다. 본 연구에서는 우리나라 5대강 유역 109개 중권역에 대해 multi-model ensemble을 적용하여 기후변화에 의한 수자원 영향을 평가하였다. 1971년에서 2100년까지 120년 기간에 대해 3개의 온실가스 배출시나리오, 13개의 GCMs 결과들을 수집하여 총 39개의 기후시나리오를 이용하였고, 이를 8개의 유출모형에 적용하여 총 312개의 유출시나리오를 생산하였다. 생산된 유출시나리오를 기준시간(1971${\sim}$2000)에 대한 미래의 세 기간(2020s, 2050s, 2080s)으로 나누어 변화율을 분석한 결과 여름철 유출량과 겨울철 유출량이 증가될것으로 나타났으나 겨울철 유출량 전망은 여름철에 비해 불확실성이 큰 것으로 나타났다. 공간적으로는 한강유역이 위치한 북쪽유역이 남쪽에 비해 불확실성이 큰 것으로 나타났다. 결과적으로 유출의 시공간적 편차에 의해 우리나라 수자원은 홍수피해 증가가 예상되었으며, 월별유출량의 변화로 인해 용수확보와 관리에 어려움이 증가할 것으로 전망되었다.

  • PDF

다중 기상모델 앙상블을 활용한 다지점 강우시나리오 상세화 기법 개발 (Development of Multisite Spatio-Temporal Downscaling Model for Rainfall Using GCM Multi Model Ensemble)

  • 김태정;김기영;권현한
    • 대한토목학회논문집
    • /
    • 제35권2호
    • /
    • pp.327-340
    • /
    • 2015
  • 기후모형으로 가장 널리 사용되는 GCM의 불확실성 및 시공간적 편의로 인하여 GCM으로부터 생산된 기상정보를 응용수문분야에서 직접적으로 이용하기 위해서는 상세화 과정이 필수적으로 요구된다. 본 연구에서는 선행연구에서 개발된 비정상성 은닉 마코프 모형(Non-stationary Hidden Markov Chain Model, NHMM)을 기반으로 다지점 공간상관성을 고려할 수 있는 Chow-Liu Tree 알고리즘과 결합하여 유역단위 강우시나리오 상세화 기법(CLT-NHMM)으로 확장하였으며, 낙동강 유역에 적용하여 적용성을 평가하였다. 상관행렬(correlation matrix)을 통한 강우네트워크의 공간상관성 평가결과 유역상관성이 우수하게 모의하는 것을 확인하였으며, 강수의 빈도 및 양적 관점에서 효과적인 모의가 가능하였다. 본 연구에서 제시한 CLT-NHMM 모형은 수자원뿐만 아니라 수문자료를 입력 자료로 하는 농업, 보건, 환경 및 에너지 등 다양한 응용기상분야에 핵심 기술로 활용이 전망된다.

기후변화에 따른 국내 홍수 취약성 평가 (Korean Flood Vulnerability Assessment on Climate Change)

  • 이문환;정일원;배덕효
    • 한국수자원학회논문집
    • /
    • 제44권8호
    • /
    • pp.653-666
    • /
    • 2011
  • 본 연구에서는 기후변화에 따른 홍수 취약성 평가기법을 제안하고 국내 5대강 유역에 적용 및 평가하고자 하였다. 특히 Multi-Model Ensemble 시나리오를 이용하여 평가 시 발생하는 불확실성을 제시하고자 하였다. 취약성 평가를 위해 우선 유역의 기상, 수문 자료를 비롯한 지형, 인문 사회 정보를 수집, 지표를 산정하여 현재 기후상태 하에서의 홍수 취약성을 평가하였다. 또한 기후변화에 따른 미래 홍수 취약성을 평가하기 위해 기존에 3개 온실가스 배출시나리오, 13개 GCMs (Global Climate Models), 3개 수문모형(2~3개 증발산량 산정방법)으로 생산된 39개 미래 기후시나리오 및 312개 미래 수문시나리오를 이용하여 기준 S0 (1971~2000년) 기간 대비 미래 S1 (2010~2039년), S2 (2040~2069년), S3 (2070~2099년)기간의 홍수 취약성의 시공간적 변화 및 불확실성을 평가하였다. 평가 결과 현재 기후상황에서 홍수에 취약한 지역은 한강, 섬진강, 영산강 하류 지역으로 나타났으며, 미래 기후변화 시나리오를 고려한 결과 낙동강, 금강, 한강 권역에서의 민감도가 가장 크게 변할 것으로 분석되었으나, 기본적으로 섬진강 유역의 적응능력이 낮기 때문에 미래에도 섬진강 유역이 홍수에 가장 취약할 것으로 분석되었다.

레이더 강우 앙상블과 유출 블랜딩 기법을 이용한 최적 유출 수문곡선 산정 (Estimation of optimal runoff hydrograph using radar rainfall ensemble and blending technique of rainfall-runoff models)

  • 이명진;강나래;김종성;김형수
    • 한국수자원학회논문집
    • /
    • 제51권3호
    • /
    • pp.221-233
    • /
    • 2018
  • 최근 기후변화로 인한 국지성 호우 및 태풍 피해가 자주 발생하고 있다. 이와 같은 피해를 저감하기 위해서는 정확한 강우의 예측과 홍수량 산정이 필요하다. 그러나 지점 및 레이더 강우 시 공간적 오차를 포함하고 있고, 유출 모형에 의한 유출수문곡선 역시 보정을 실시하더라도 관측유량과 오차를 가지고 있어 불확실성이 존재한다. 따라서 본 연구에서는 확률론적 강우 앙상블을 생성하여 강우의 불확실성을 확인하였다. 또한 유출 결과를 통해 수문 모형의 불확실성을 확인하였고, 블랜딩 기법을 이용하여 하나의 통합된 유출 수문곡선을 제시하였다. 생성된 강우앙상블은 강우강도 및 지형적인 영향으로 레이더가 과소 관측이 될 때, 강우 앙상블의 불확실성이 큰 것을 확인하였고, 블랜딩 기법을 적용하여 산정된 최적 유출 수문곡선은 유출모형의 불확실성을 크게 줄이는 것으로 나타났다. 본 연구 결과를 활용한다면, 정확한 홍수량 산정 및 예측을 통해 집중호우로 인한 피해를 줄일 수 있을 것으로 판단된다.

레이더 강우 앙상블과 다양한 유출모형의 블랜딩을 활용한 최적 유출곡선 산정 (Simulation of Optimal Runoff Hydrograph Using Ensemble of Radar Rainfall and Blending of RunoffsBasin)

  • 이명진;주홍준;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.135-135
    • /
    • 2017
  • 최근 강우-유출 모형은 물리적 현상에 근거한 확정론적 모의 모형과 물리적 성분으로 설명할 수 없는 내용에 대해 통계적으로 접근하는 추계학적 모의 모형 등이 계속 연구되고 있어 자연현상에 가까운 결과를 기대할 수 있게 되었다. 하지만 우리나라의 경우 많은 연구에도 불구하고 돌발성 집중호우, 여름철 집중되는 강우 등으로 인해 재난이 반복적으로 발생하고 있어 모형의 정확성에 대한 논의가 지속되고 있다. 동일한 유역에 동일한 입력자료를 사용하더라도 사용하는 모형에 따라 유출 분석결과는 상이하며 이는 유출 해석에 대한 불확실성으로 작용한다. 본 연구에서는 앙상블 및 블랜딩 기법을 사용하여 각 강우-유출 모형의 불확실성을 고려하여 최적 유출량을 산정하고자 한다. 대상 유역으로는 한강 수계에 있는 중랑천 유역을 선정하였으며, Distributed 모형인 Vflo 모형과 Lumped 모형인 저류함수 모형, SSARR모형, TANK 모형을 이용하여 유출 분석을 실시하였다. 그 후, Multi-Model Super Ensemble(MMSE), Simple Model Average(SMA), Mean Square Error(MSE) 방법 등의 blending 기법을 이용하여 하나의 통합된 형태의 유출 분석 결과를 제시하였으며, 최적 유출량 산정을 위한 blending 기법을 선정하였다. 본 연구를 통해 동일한 강우 시나리오에 대한 여러 강우-유출 모형에 대한 정확도를 확인하였으며, 앙상블 및 블랜딩 기법을 사용하여 유출 분석에 대한 정확도를 향상시킬 수 있을 것으로 판단된다.

  • PDF

스태킹 앙상블 모델을 이용한 시간별 지상 오존 공간내삽 정확도 향상 (Improved Estimation of Hourly Surface Ozone Concentrations using Stacking Ensemble-based Spatial Interpolation)

  • 김예진;강은진;조동진;이시우;임정호
    • 한국지리정보학회지
    • /
    • 제25권3호
    • /
    • pp.74-99
    • /
    • 2022
  • 지상 오존은 차량 및 산업 현장에서 배출된 질소화합물(Nitrogen oxides; NOx)과 휘발성 유기화합물(Volatile Organic Compounds; VOCs)의 광화학 반응을 통해 생성되어 식생 및 인체에 악영향을 끼친다. 국내에서는 실시간 오존 모니터링을 수행하고 있지만 관측소 기반으로, 미관측 지역의 공간 분포 분석에 어려움이 있다. 본 연구에서는 스태킹 앙상블 기법을 활용하여 매시간 남한 지역의 지상 오존 농도를 1.5km의 공간해상도로 공간내삽하였고, 5-fold 교차검증을 수행하였다. 스태킹 앙상블의 베이스 모델로는 코크리깅(Cokriging), 다중 선형 회귀(Multi-Linear Regression; MLR), 랜덤 포레스트(Random Forest; RF), 서포트 벡터 회귀(Support Vector Regression; SVR)를 사용하였다. 각 모델의 정확도 비교 평가 결과, 스태킹 앙상블 모델이 연구 기간 내 시간별 평균 R 및 RMSE이 0.76, 0.0065ppm으로 가장 높은 성능을 보여주었다. 스태킹 앙상블 모델의 지상 오존 농도 지도는 복잡한 지형 및 도시화 변수의 특징이 잘 드러나며 더 넓은 농도 범위를 보여주었다. 개발된 모델은 매시간 공간적으로 연속적인 공간 지도를 산출할 수 있을 뿐만 아니라 8시간 평균치 산출 및 시계열 분석에 있어서도 활용 가능성이 클 것으로 기대된다.

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.