• 제목/요약/키워드: Model Ensemble

검색결과 638건 처리시간 0.023초

기계학습법을 통한 압축 벤토나이트의 열전도도 추정 모델 평가 (Evaluation of a Thermal Conductivity Prediction Model for Compacted Clay Based on a Machine Learning Method)

  • 윤석;방현태;김건영;전해민
    • 대한토목학회논문집
    • /
    • 제41권2호
    • /
    • pp.123-131
    • /
    • 2021
  • 완충재는 고준위 방사성 폐기물을 처분하기 위한 공학적 방벽 시스템에서 중요한 구성요소 중 하나이며 사용 후 핵연료가 담긴 처분용기와 암반사이에 채워지는 물질이기 때문에 지하수 유입으로부터 처분용기를 보호하고, 방사성 핵종 유출을 저지하는 중요한 역할을 수행한다. 따라서 공학적 방벽 시스템의 처분용기로부터 발생하는 고온의 열량은 완충재를 통하여 전파되기에 완충재의 열전도도는 처분시스템의 안전성 평가에 매우 중요하다. 본 연구에서는 국내에서 생산되는 압축 벤토나이트 완충재의 열전도도 예측을 위한 경험적 회귀 모델의 정합성을 검증하고 정확도를 높이기 위해 예측모델의 구축에 기계학습법을 적용해 보았다. 벤토나이트의 건조밀도, 함수비 및 온도 값을 바탕으로 열전도도를 예측하고자 하였으며, 이때 다항 회귀, 결정 트리, 서포트 벡터 머신, 앙상블, 가우시안 프로세스 회귀, 인공신경망, 심층 신뢰 신경망, 유전 프로그래밍과 같은 기계학습 기법을 적용하였다. 기계학습 기법을 이용하여 예측한 결과, 부스팅 기반의 앙상블 기법, 유전 프로그래밍, 3차 함수 기반의 SVM, 가우시안 프로세스 회귀의 기계학습기법을 활용한 모델이 선형 회귀 분석 기법에 비해 좋은 성능을 보였으며, 특히 앙상블의 부스팅 기법과 가우시안 프로세스 회귀 기법을 사용한 모델들이 가장 좋은 성능을 보였다.

관측자료 동화기법과 댐운영을 고려한 실시간 댐 수문량 예측모형 개발 (Development of Realtime Dam's Hydrologic Variables Prediction Model using Observed Data Assimilation and Reservoir Operation Techniques)

  • 이병주;정일원;정현숙;배덕효
    • 한국수자원학회논문집
    • /
    • 제46권7호
    • /
    • pp.755-765
    • /
    • 2013
  • 본 연구의 목적은 앙상블 칼만필터링 기법과 연속형 강우-유출모형을 연계한 SURF 모형과Auto ROM을 결합한 실시간 댐 수문량 예측모형(DHVPM)을 개발하고 그 적용성을 평가하는데 있다. 대상유역은 충주댐 상류유역을 선정하였으며 2006~2009년 동안 연최대 유입량이 발생한 4개 사례를 선정하였다. 관측유량 자료동화 적용에 따른 선행시간 1시간 유입량에 대한 첨두유량 상대오차, 평균제곱근오차, 모형효율성계수를 산정한 결과, 2007년 첨두유량 상대오차 결과를 제외한 모든 사례에서 자료동화기법을 적용한 결과가 우수한 것으로 나타났다. 현시점으로 가정한 가상시점에서 예측 선행시간 10시간에 대해 유입량을 예측한 결과에서, 유역평균 강우량의 오차가 큰 경우에 대해 자료동화기법을 적용함으로써 예측 유입량의 오차가 줄어드는 것을 확인하였다. 이상의 결과로부터 실시간 예측유입량의 정확도를 향상시키기 위해서는 관측유입량의 실시간 활용이 가능한 환경에서 자료동화기법을 연계한 유입량 예측모형을 이용하는 것이 바람직할 것으로 판단된다.

Hadley Circulation Strength Change in Response to Global Warming: Statistics of Good Models

  • Son, Jun-Hyeok;Seo, Kyong-Hwan
    • 대기
    • /
    • 제26권4호
    • /
    • pp.665-672
    • /
    • 2016
  • In this study, we examine future changes in the Hadley cell (HC) strength using CMIP5 climate change simulations. The current study is an extension of a previous study by Seo et al. that used all 30 available models. Here, we select 18-23 well-performing models based on their significant internal sensitivity of the interannual HC strength variation to the latitudinal temperature gradient variation. The model projections along with simple scaling analysis show that the inter-model variability in the HC strength change is a result of the inter-model spread in the meridional temperature gradient across the subtropics for both DJF and JJA, not by the tropopause height or gross static stability change. The HC strength is expected to weaken significantly during DJF, while little change is expected in the JJA HC strength. Compared to the calculations with all model members, selected model statistics increase the linear correlation between the changes in HC strength and meridional temperature gradient by 13~23%, confirming the robust sensitivity of the HC strength to the meridional temperature gradient. Two scaling equations for the selected models predict changes in HC strength better than all-member predictions. In particular, the prediction improvement in DJF is as high as 30%. The simple scaling relations successfully predict both the ensemble-mean changes and model-to-model variations in the HC strength for both seasons.

Production of Fine-resolution Agrometeorological Data Using Climate Model

  • Ahn, Joong-Bae;Shim, Kyo-Moon;Lee, Deog-Bae;Kang, Su-Chul;Hur, Jina
    • 한국농림기상학회:학술대회논문집
    • /
    • 한국농림기상학회 2011년도 학술발표회
    • /
    • pp.20-27
    • /
    • 2011
  • A system for fine-resolution long-range weather forecast is introduced in this study. The system is basically consisted of a global-scale coupled general circulation model (CGCM) and Weather Research and Forecast (WRF) regional model. The system makes use of a data assimilation method in order to reduce the initial shock or drift that occurs at the beginning of coupling due to imbalance between model dynamics and observed initial condition. The long-range predictions are produced in the system based on a non-linear ensemble method. At the same time, the model bias are eliminated by estimating the difference between hindcast model climate and observation. In this research, the predictability of the forecast system is studied, and it is illustrated that the system can be effectively used for the high resolution long-term weather prediction. Also, using the system, fine-resolution climatological data has been produced with high degree of accuracy. It is proved that the production of agrometeorological variables that are not intensively observed are also possible.

  • PDF

기후변화시나리오 다중모형 앙상블에 따른 논 질소 유출 부하량 변동 및 불확실성 평가 (Evaluating Changes and Uncertainty of Nitrogen Load from Rice Paddy according to the Climate Change Scenario Multi-Model Ensemble)

  • 최순군;정재학;엽소진;김민욱;김진호;김민경
    • 한국농공학회논문집
    • /
    • 제62권5호
    • /
    • pp.47-62
    • /
    • 2020
  • Rice paddy accounts for approximately 52.5% of all farmlands in South Korea, and it is closely related to the water environment. Climate change is expected to affect not only agricultural productivity also the water and the nutrient circulation. Therefore this study was aimed to evaluate changes of nitrogen load from rice paddy considering climate change scenario uncertainty. APEX-Paddy model which reflect rice paddy environment by modifying APEX (Agricultural Policy and Environmental eXtender) model was used. Using the AIMS (APCC Integrated Modeling Solution) offered by the APEC Climate Center, bias correction was conducted for 9 GCMs using non-parametric quantile mapping. Bias corrected climate change scenarios were applied to the APEX-Paddy model. The changes and uncertainty in runoff and nitrogen load were evaluated using multi-model ensemble. Paddy runoff showed a change of 23.1% for RCP4.5 scenario and 45.5% for RCP8.5 scenario compared the 2085s (2071 to 2100) against the base period (1976 to 2005). The nitrogen load was found to be increased as 43.9% for RCP4.5 scenario and 76.0% for RCP8.5 scenario. The uncertainty analysis showed that the annual standard deviation of nitrogen loads increased in the future, and the maximum entropy indicated an increasing tendency. And Duncan's analysis showed significant differences among GCMs as the future progressed. The result of this study seems to be used as a basis for mid- and long-term policies for water resources and water system environment considering climate change.

비정상성 빈도해석을 위한 기상인자 선정 및 확률강우량 산정 (Selection of Climate Indices for Nonstationary Frequency Analysis and Estimation of Rainfall Quantile)

  • 정태호;김한빈;김현식;허준행
    • 대한토목학회논문집
    • /
    • 제39권1호
    • /
    • pp.165-174
    • /
    • 2019
  • 수문관측자료에서 비정상성(nonstationarity)이 관측됨에 따라 수공구조물 설계에서 비정상성 빈도해석에 대한 연구가 활발히 진행되고 있다. 대기-해양 시스템에 내재된 기후 변동성은 비정상성 현상과 관련이 있는 것으로 알려져 있지만, 비정상성 빈도해석은 일반적으로 선형적 추세를 기반으로 이루어지고 있다. 본 연구에서는 우리나라의 기후 변동성과 극치 강우 사상의 장기 경향성을 고려하기 위하여 기상인자를 활용한 비정상성 빈도해석을 수행하였다. 먼저, 경향성이 나타나는 11개 기상관측지점의 연 최대치 강우자료에 대하여 통계적 분해 방법인 앙상블 경험적 모드분해법을 활용해 자료에 내재된 장기 경향성을 추출하였으며, 계절에 따른 다양한 기상인자와의 상관성 분석을 수행하였다. 그 결과, 연 최대 강우 발생년도를 기준으로 전년도 가을철 AMM과 전년도 가을철 AMO, 그리고 전년도 여름철 NINO4가 10개 이상의 지점에서 연 최대치 강우자료의 장기 경향성에 유의한 영향을 미치는 것으로 나타났다. 선정된 기상인자를 일반 극치(generalized extreme value, GEV) 분포모형에 적용하여 비정상성 GEV (NS-GEV) 모형을 구축하고 기존의 선형적 추세를 고려한 NS-GEV 모형과의 AIC값을 비교하여 최적모형을 선정하였다. 선정된 모형과 기존의 선형적 추세를 고려한 NS-GEV 모형에 대한 성능 평가를 통해 기상인자를 활용한 NS-GEV 모형이 극치강우사상을 반영하여 확률강우량의 과소산정 문제를 보완할 수 있음을 확인하였다.

머신러닝 기반 KOSDAQ 시장의 관리종목 지정 예측 연구: 재무적 데이터를 중심으로 (Study on Predicting the Designation of Administrative Issue in the KOSDAQ Market Based on Machine Learning Based on Financial Data)

  • 윤양현;김태경;김수영
    • 벤처창업연구
    • /
    • 제17권1호
    • /
    • pp.229-249
    • /
    • 2022
  • 본 연구는 다양한 머신러닝 기법을 통해 코스닥(KOSDAQ) 시장 내 관리종목 지정을 예측할 수 있는 모델에 대해 연구하였다. 증권시장 내 기업이 관리종목으로 지정이 되면 시장에서는 이를 부정적인 정보로 인식하여 해당 기업과 투자자에게 손실을 가져오게 된다. 본 연구를 통해 기업의 재무적 데이터를 바탕으로 조기에 관리종목 지정을 예측하고, 투자자들의 포트폴리오 리스크 관리에 도움을 주기 위한 머신러닝 접근이 타당한지 살펴본다. 본 연구를 위해 활용한 독립변수는 수익성, 안정성, 활동성, 성장성을 나타내는 21개의 재무비율을 활용하였으며, K-IFRS가 적용된 2011년부터 2020년까지 관리종목과 비관리종목의 기업의 재무 데이터를 표본으로 추출하였다. 로지스틱 회귀분석, 의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, LightGBM을 활용하여 관리종목 지정 예측 연구를 수행하였다. 연구결과는 분류 정확도가 82.73%인 LightGBM이 가장 우수한 예측 모형이었으며 분류 정확도가 가장 낮은 예측 모형은 정확도가 71.94%인 의사결정나무였다. 의사결정나무 기반 학습 모형의 변수 중요도의 상위 3개 변수를 확인한 결과 각 모형에서 공통적으로 나온 재무변수는 ROE(당기순이익), 자본금회전율(Capital stock turnover ratio)로 해당 재무변수가 관리종목 지정에 있어 상대적으로 중요한 변수임을 확인하였다. 대체적으로 앙상블을 이용한 학습 모형이 단일 학습 모형보다 예측 성능이 높은 것을 확인하였다. 기존 선행연구가 K-IFRS에 대한 고려를 하지 않았고, 다소 제한된 머신러닝에 의존하였다. 따라서 본 연구의 필요성과 함께 현실적 요구를 충족시키는 결과를 제시하였음을 알 수 있으며, 시장참여자들에게 있어 관리종목 지정에 대한 사전 예측을 확인할 수 있도록 기여했다고 볼 수 있다.

기상장의 종류와 해상도에 따른 HY-SPLIT 모델의 결과 비교 (Comparison of Model Results for Variation and Resolution of Meteorological Field Using HY-SPLIT)

  • 이종범;박상진;김재철;장윤정
    • 환경영향평가
    • /
    • 제19권3호
    • /
    • pp.223-230
    • /
    • 2010
  • Trajectory dispersion models are used for the dispersion calculations in air quality assessments, Yellow-sand modeling, environmental planning and the emergency response. Meso-scale forcing and coastal circulations are calculated by trajectory model in the East Asia region. In this study the meteorological fields (GDAS and MM5) coupled to the trajectory model (HY-SPLIT) are applied to simulate the transport and the dispersion. Seoul is selected as a starting point of the HY-SPLIT. The sensitivity studies are performed by conducting an ensemble of simulations using the GDAS and the MM5 model for the same dispersion cases. The results in this study show a significant difference depending on the resolution of meteorological models. Additionally, in most cases of the compared tionally,results from MM5 and GDAS, the absolute and relative distance, shows significant difference and the difference increased with the increasing distance of HY-SPLIT. Therefore, for the case of small domai for twi d field distefbution over complex terrai, should be used only high model temporal or spatial resolution to improve the HY-SPLIT model results.

로지스틱 회귀모형과 머신러닝 모형을 활용한 주요산업의 부산 지역총생산 및 고용 효과 예측 (Prediction on Busan's Gross Product and Employment of Major Industry with Logistic Regression and Machine Learning Model)

  • 이재득
    • 무역학회지
    • /
    • 제47권2호
    • /
    • pp.69-88
    • /
    • 2022
  • This paper aims to predict Busan's regional product and employment using the logistic regression models and machine learning models. The following are the main findings of the empirical analysis. First, the OLS regression model shows that the main industries such as electricity and electronics, machine and transport, and finance and insurance affect the Busan's income positively. Second, the binomial logistic regression models show that the Busan's strategic industries such as the future transport machinery, life-care, and smart marine industries contribute on the Busan's income in large order. Third, the multinomial logistic regression models show that the Korea's main industries such as the precise machinery, transport equipment, and machinery influence the Busan's economy positively. And Korea's exports and the depreciation can affect Busan's economy more positively at the higher employment level. Fourth, the voting ensemble model show the higher predictive power than artificial neural network model and support vector machine models. Furthermore, the gradient boosting model and the random forest show the higher predictive power than the voting model in large order.

Uncertainty decomposition in climate-change impact assessments: a Bayesian perspective

  • Ohn, Ilsang;Seo, Seung Beom;Kim, Seonghyeon;Kim, Young-Oh;Kim, Yongdai
    • Communications for Statistical Applications and Methods
    • /
    • 제27권1호
    • /
    • pp.109-128
    • /
    • 2020
  • A climate-impact projection usually consists of several stages, and the uncertainty of the projection is known to be quite large. It is necessary to assess how much each stage contributed to the uncertainty. We call an uncertainty quantification method in which relative contribution of each stage can be evaluated as uncertainty decomposition. We propose a new Bayesian model for uncertainty decomposition in climate change impact assessments. The proposed Bayesian model can incorporate uncertainty of natural variability and utilize data in control period. We provide a simple and efficient Gibbs sampling algorithm using the auxiliary variable technique. We compare the proposed method with other existing uncertainty decomposition methods by analyzing streamflow data for Yongdam Dam basin located at Geum River in South Korea.