• 제목/요약/키워드: Model Ensemble

검색결과 638건 처리시간 0.022초

앙상블 기법을 이용한 안동댐 유입량 예측 (Prediction of Andong Reservoir Inflow Using Ensemble Technique)

  • 강민석;유명수;이재응
    • 대한토목학회논문집
    • /
    • 제34권3호
    • /
    • pp.795-804
    • /
    • 2014
  • 본 연구에서는 앙상블유량예측기법과 SWAT 모형을 이용하여 안동댐의 2011년 7월~9월의 각 댐유입량 예측을 실행하였으며 월별 및 순별 분석을 수행하였다. 또한 정확한 분석을 위해 기상청의 월별 및 순별 강우예보자료를 이용한 가중값 부여방법을 사용하였다. 분석 결과 기상청에서 발표한 강우 예측 구간이 실제 강우 구간과 동일하면 PDF-Ratio 가중값 부여방법이 가장 높은 정확성을 보이며, 과거 강우발생 구간 통계 중 높은 구간이 실제 강우 구간과 동일하다면 수정 PDF-Ratio 가중값 부여방법이 가장 높은 정확성을 보였다. 이는 기상청 예측이 맞지 않은 경우에도 과거 강우발생 구간의 빈도에 따라 정확성을 높일 수 있을 것으로 판단된다. 반대로 기상청의 예측이 실제와 다르면서 과거 강우발생 구간 통계에서도 낮은 구간의 강우가 발생하면 균일 가중값 부여방법의 정확성이 가장 높게 분석되었다.

서식처 적합모형을 적용한 고산지역 분비나무의 기후변화 영향평가 (Climate Change Impact Assessment of Abies nephrolepis (Trautv.) Maxim. in Subalpine Ecosystem using Ensemble Habitat Suitability Modeling)

  • 최재용;이상혁
    • 한국환경복원기술학회지
    • /
    • 제21권1호
    • /
    • pp.103-118
    • /
    • 2018
  • Ecosystems in subalpine regions are recognized as areas vulnerable to climatic changes because rainfall and the possibility of flora migration are very low due to the characteristics of topography in the regions. In this context, habitat niche was formulated for representative species of arbors in subalpine regions in order to understand the effects of climatic changes on alpine arbor ecosystems. The current potential habitats were modeled as future change areas according to the climatic change scenarios. Based on the growth conditions and environmental characteristics of the habitats, the study was conducted to identify direct and indirect causes affecting the habitat reduction of Abies nephrolepis. Diverse model algorithms for explanation of the relationship between the emergence of biological species and habitat environments were reviewed to construct the environmental data suitable for the six models(GLM, GAM, RF, MaxEnt, ANN, and SVM). Weights determined through TSS were applied to the six models for ensemble in an attempt to minimize the uncertainty of the models. Based on the current climate determined by averaging the climates over the past 30years(1981~2010) and the HadGEM-RA model was applied to fabricate bioclimatic variables for scenarios RCP 4.5 and 8.5 on the near and far future. The results of models of the alpine region tree species studied were put together and evaluated and the results indicated that a total of eight national parks such as Mt. Seorak, Odaesan, and Hallasan would be mainly affected by climatic changes. Changes in the Baekdudaegan reserves were analyzed and in the results, A. nephrolepis was predicted to be affected the most in the RCP8.5. The results of analysis as such are expected to be finally utilizable in the survey of biological species in the Korean peninsula, restoration and conservation strategies considering climatic changes as the analysis identified the degrees of impacts of climatic changes on subalpine region trees in Korean peninsula with very high conservation values.

기상예보를 고려한 ESP 유출 확률 산정 (Estimation of ESP Probability considering Weather Outlook)

  • 안정민;이상진;김정곤;김주철;맹승진;우동현
    • 한국물환경학회지
    • /
    • 제27권3호
    • /
    • pp.264-272
    • /
    • 2011
  • The objective of this study was to develop a model for predicting long-term runoff in a basin using the ensemble streamflow prediction (ESP) technique and review its reliability. To achieve the objective, this study improved not only the ESP technique based on the ensemble scenario analysis of historical rainfall data but also conventional ESP techniques used in conjunction with qualitative climate forecasting information, and analyzed and assessed their improvement effects. The model was applied to the Geum River basin. To undertake runoff forecasting, this study tried three cases (case 1: Climate Outlook + ESP, case 2: ESP probability through monthly measured discharge, case 3: Season ESP probability of case 2) according to techniques used to calculate ESP probabilities. As a result, the mean absolute error of runoff forecasts for case 1 proposed by this study was calculated as 295.8 MCM. This suggests that case 1 showed higher reliability in runoff forecasting than case 2 (324 MCM) and case 3 (473.1 MCM). In a discrepancy-ratio accuracy analysis, the Climate Outlook + ESP technique displayed 50.0%. This suggests that runoff forecasting using the Climate Outlook +ESP technique with the lowest absolute error was more reliable than other two cases.

XGboost 기반의 WiFi 신호를 이용한 실내 측위 기법 (Indoor positioning method using WiFi signal based on XGboost)

  • 황치곤;윤창표;김대진
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.70-75
    • /
    • 2022
  • 위치를 정확하게 측정하는 것은 다양한 서비스를 제공하는 데 필요하다. 실내 측위를 위한 데이터는 스마트 폰의 앱을 통해 WiFi 장치로부터 RSSI 값을 측정한다. 이렇게 측정된 데이터는 기계학습의 원시 데이터가 된다. 특징 데이터는 측정된 RSSI 값이고, 레이블은 측정한 위치에 대한 공간의 이름으로 한다. 이를 위한 기계학습 기법은 분류에 효율적인 기법을 적용하여 WiFi 신호만으로 정확한 위치를 예측하는 기법을 연구하고자 한다. 앙상블은 하나의 모델보다 다양한 모델을 통하여 더 정확한 예측값을 구하는 기법으로, bagging과 boosting이 있다. 이 중 Boosting은 샘플링한 데이터를 바탕으로 모델링한 결과를 통해 모델의 가중치를 조정하는 기법으로, 다양한 알고리즘이 있다. 본 연구는 위 기법 중 XGboost를 이용하고, 다른 앙상블 기법과 이용한 수행결과를 바탕으로 성능을 평가한다.

기후변화에 따른 강수 특성 변화 분석을 위한 대규모 기후 앙상블 모의자료 적용 (Application of the Large-scale Climate Ensemble Simulations to Analysis on Changes of Precipitation Trend Caused by Global Climate Change)

  • 김영규;손민우
    • 대기
    • /
    • 제32권1호
    • /
    • pp.1-15
    • /
    • 2022
  • Recently, Japan's Meteorological Research Institute presented the d4PDF database (Database for Policy Decision-Making for Future Climate Change, d4PDF) through large-scale climate ensemble simulations to overcome uncertainty arising from variability when the general circulation model represents extreme-scale precipitation. In this study, the change of precipitation characteristics between the historical and future climate conditions in the Yongdam-dam basin was analyzed using the d4PDF data. The result shows that annual mean precipitation and seasonal mean precipitation increased by more than 10% in future climate conditions. This study also performed an analysis on the change of the return period rainfall. The annual maximum daily rainfall was extracted for each climatic condition, and the rainfall with each return period was estimated. In this process, we represent the extreme-scale rainfall corresponding to a very long return period without any statistical model and method as the d4PDF provides rainfall data during 3,000 years for historical climate conditions and during 5,400 years for future climate conditions. The rainfall with a 50-year return period under future climate conditions exceeded the rainfall with a 100-year return period under historical climate conditions. Consequently, in future climate conditions, the magnitude of rainfall increased at the same return period and, the return period decreased at the same magnitude of rainfall. In this study, by using the d4PDF data, it was possible to analyze the change in extreme magnitude of rainfall.

아스팔트 혼합물의 골재 간극률 예측을 위한 기계학습 프레임워크 (Machine Learning Framework for Predicting Voids in the Mineral Aggregation in Asphalt Mixtures)

  • 박혜민;나일호;김현환;지봉준
    • 한국지반신소재학회논문집
    • /
    • 제23권1호
    • /
    • pp.17-25
    • /
    • 2024
  • 골재 간극률은 구조적 강도, 내구성, 배수 및 투수성 등 다양한 아스팔트의 특성에 직접적인 영향을 미친다. 따라서 아스팔트 포장이 사용되는 위치, 기후, 환경 등에 적절하도록 골재 간극률이 설계되어야한다. 하지만 골재 간극률은 다양한 요인들에 의해 영향을 받으므로 그 설계가 쉽지 않다. 예를 들어 골재 입자의 크기 분포, 구성이나 아스팔트 바인더의 양, 다짐 수준 등 다양한 영향인자가 존재한다. 본 연구에서는 골재 간극률에 영향을 미치는 요인들로부터 골재 간극률을 예측하고자 하였다. 이를 위해 다양한 기계학습 모델 방법을 적용하였고 단일 기계학습 모델을 적용했을 때보다 높은 정확도로 골재 간극률을 예측할 수 있음을 보였다. 본 연구의 결과는 경험과 노동집약적인 실험에 의존하는 골재 간극률 예측에 데이터 기반의 접근방법을 적용할 수 있음을 보였으며 향후 최적 골재 간극률 설계 등에 활용 가능할 것으로 기대된다.

Missing Value Imputation Technique for Water Quality Dataset

  • Jin-Young Jun;Youn-A Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.39-46
    • /
    • 2024
  • 많은 연구자들이 다양한 모델을 이용하여 물의 수질을 평가하기 위해 노력하고 있다. 평가 모델에는 결측값이 없는 데이터셋이 필요하지만, 관측 데이터셋에는 결측값이 다수 포함되는 것이 현실이다. 단순히 결측값을 삭제하는 방법은 경우에 따라 기저 데이터의 분포를 왜곡시키고 모델의 예측성능에도 편의(bias)를 불러올 위험성이 있다. 본 연구에서는 수질 데이터의 결측값 처리에 적합한 기법을 탐색하기 위해, 기존의 KNN과 MICE Imputation, 그리고 생성형 신경망 모델인 Autoencoder와 Denoising Autoencoder를 기반으로 몇 가지 대치 기법을 실험하였다. 실험 결과, KNN과 MICE Imputation의 결과를 평균한 Combined Imputation이 실측치에 가장 가깝게 값을 추정하였으며, 이 기법을 적용하여 결측값을 처리한 관측 데이터셋을 support vector machine과 ensemble 기반의 분류 모델로 평가한 결과, 결측값을 삭제했을 때에 비해 Accuracy, F1 score, ROC-AUC score, 그리고 MCC(Mathews Correlation Coefficient) 지표가 향상되었다.

머신러닝을 이용한 공연문화예술 개인화 장르 추천 시스템 (A Personalized Recommendation System Using Machine Learning for Performing Arts Genre)

  • 김형수;박예린;이정민
    • 경영정보학연구
    • /
    • 제21권4호
    • /
    • pp.31-45
    • /
    • 2019
  • 공연문화예술 시장의 확대에도 불구하고, 중소규모 공연장은 소비자의 정보 접근성이 좋지 않아 어려움을 겪고 있다. 본 연구는 중소규모 공연장의 마케팅 역량을 강화할 수 있는 하나의 대안으로써 머신러닝 기반의 장르 추천 시스템을 제시하고자 한다. 국내 한 공연장의 고객 마스터 DB와 거래이력 DB를 활용하여 고객당 3개의 장르를 추천하는 5개의 추천 시스템을 개발하였다. 추천시점 이후 1년 동안의 실제 공연구매 이력을 바탕으로 추천 시스템의 성능을 비교하여 최적의 추천시스템을 제안하였다. 분석 결과, 단일 예측모형보다는 앙상블 모형 기반의 추천시스템이 우수한 성능을 보이는 것으로 나타났다. 본 연구는 공연문화예술 분야에는 일천했던 개인화 추천 기법을 적용했고, 분석 결과 공연문화예술 분야에서도 충분히 활용할 만한 가치가 있음을 시사하고 있다.

GCM과 수문모형의 불확실성을 고려한 기후변화에 따른 한반도 미래 수자원 전망 (Future Korean Water Resources Projection Considering Uncertainty of GCMs and Hydrological Models)

  • 배덕효;정일원;이병주;이문환
    • 한국수자원학회논문집
    • /
    • 제44권5호
    • /
    • pp.389-406
    • /
    • 2011
  • 본 연구에서는 GCM 및 유출모형의 불확실성을 고려하여 기후변화에 따른 미래 한반도 수자원의 변화를 전망하고, 그 결과에서 나타나는 불확실성을 평가하고자 하였다. 온실가스 배출시나리오와 GCMs의 불확실성을 고려하기 위해 IPCC AR4에 적용되었던 3개 시나리오(A2, A1B, B1)에 대한 13 GCMs 결과를 이용하였으며, 유출모형 구조 및 증발산량 산정방법에 따른 영향을 고려하기 위해 PRMS, SWAT, SLURP 모형을 선정하였고 각 모형별로 2~3개의 증발산량 방법을 고려하였다. 결과적으로 우리나라 109개 중권역 유역에 대해 312개의 결과가 제시되었으며, 이를 이용하여Gaussian kernel density function을 산정함으로써 평가결과의 앙상블 평균과 불확실성을 동시에 제시하였다. 분석 결과 여름철과 겨울철 유출량은 증가, 봄철은 감소할 것으로 전망되었다. 연평균유출량은 전체유역에서 증가할 것으로 전망되었으며, 공간적으로는 한강유역이 위치한 북쪽유역이 남쪽유역에 비해연 유출량이 더 크게 증가할 것으로 전망되었다. 연평균유출량의 증가는 여름철 유출량 증가에 따른 결과로, 기후변화의 영향은 한국에서 유출량의 계절편중을 심화시켜 수자원 관리를 더욱 어렵게 할 것으로 전망되었다. 평가결과에서 나타난 불확실성은 겨울철 유출량에서 가장 크고 여름철 유출량에서 가장 적은 것으로 나타났다.

설명 가능한 정기예금 가입 여부 예측을 위한 앙상블 학습 기반 분류 모델들의 비교 분석 (A Comparative Analysis of Ensemble Learning-Based Classification Models for Explainable Term Deposit Subscription Forecasting)

  • 신지안;문지훈;노승민
    • 한국전자거래학회지
    • /
    • 제26권3호
    • /
    • pp.97-117
    • /
    • 2021
  • 정기예금 가입 여부 예측은 은행의 대표적인 금융 마케팅 중 하나로, 은행은 다양한 고객 정보를 활용하여 예측 모델을 구성할 수 있다. 정기예금 가입 여부의 분류 정확도를 향상하기 위해, 많은 연구에서 기계학습 기법들을 이용하여 분류 모델들을 개발하였다. 하지만, 이러한 모델들이 만족스러운 성능을 보일지라도 모델의 의사결정 과정에 대한 근거가 적절하게 설명되지 않는다면 산업에서 활용하기가 쉽지 않다. 이러한 문제점을 해결하기 위해, 본 논문은 설명 가능한 정기예금 가입 여부 예측 기법을 제안한다. 먼저, 테이블 형식에서 우수한 성능을 도출하는 의사결정 나무 기반 앙상블 학습 기법인 랜덤 포레스트, GBM, XGBoost, LightGBM을 이용하여 분류 모델들을 개발하고, 10겹 교차검증을 통해 모델들의 분류 성능을 심층 분석한다. 다음으로, 가장 우수한 성능을 도출하는 모델에 설명 가능한 인공지능 기법인 SHAP을 적용하여 고객 정보의 영향도와 의사결정 과정 등을 해석할 수 있는 근거를 제공한다. 제안한 기법의 실용성과 타당성을 입증하기 위해, Kaggle에서 제공한 은행 마케팅 데이터 셋을 대상으로 모의실험을 진행하였으며, 데이터 셋 구성에 따라 GBM과 LightGBM 모델에 SHAP을 각기 적용하여 설명 가능한 정기예금 가입 여부를 위한 분석 및 시각화를 수행하였다.