• 제목/요약/키워드: Model Ensemble

검색결과 638건 처리시간 0.024초

이중 입도 분포를 가진 현탁액의 침강 속도 예측 (Prediction of Hindered Settling Velocity of Bidisperse Suspensions)

  • 구상균
    • 공업화학
    • /
    • 제19권6호
    • /
    • pp.609-616
    • /
    • 2008
  • 본 연구는 크기가 다른 두 종류의 입자를 가진 비(非)콜로이드성 현탁액의 평균 침강 속도를 예측하는 수치적 방법을 제공한다. 이 방법은 무수히 많은 입자들이 유체에 불규칙적으로 분포된 현탁액 시스템의 유체 속도, 온도 등의 물리량을 앙상블 평균의 개념을 사용해서 표현하는 유효 매체 이론에 기초한다. 본 연구에서는 Acrivos와 Chang[1]이 단일(單一) 입도 현탁액에 대해 제안한 모델을 이중(二重) 입도 현탁액에 응용한다. 구체적으로 방사 분포 함수(radial distribution function)에 대한 계산과 stream function을 이용하여 침강 속도를 계산하고 그 결과를 Davis와 Birdsell[2]과 Cheung 등[3]의 실험 결과와 비교하였다. 그 결과 본 연구의 모델에 의한 예측이 실험 결과와 일치하는 것으로 나타났다.

레이더 강우 앙상블과 다양한 유출모형의 블랜딩을 활용한 최적 유출곡선 산정 (Simulation of Optimal Runoff Hydrograph Using Ensemble of Radar Rainfall and Blending of RunoffsBasin)

  • 이명진;주홍준;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.135-135
    • /
    • 2017
  • 최근 강우-유출 모형은 물리적 현상에 근거한 확정론적 모의 모형과 물리적 성분으로 설명할 수 없는 내용에 대해 통계적으로 접근하는 추계학적 모의 모형 등이 계속 연구되고 있어 자연현상에 가까운 결과를 기대할 수 있게 되었다. 하지만 우리나라의 경우 많은 연구에도 불구하고 돌발성 집중호우, 여름철 집중되는 강우 등으로 인해 재난이 반복적으로 발생하고 있어 모형의 정확성에 대한 논의가 지속되고 있다. 동일한 유역에 동일한 입력자료를 사용하더라도 사용하는 모형에 따라 유출 분석결과는 상이하며 이는 유출 해석에 대한 불확실성으로 작용한다. 본 연구에서는 앙상블 및 블랜딩 기법을 사용하여 각 강우-유출 모형의 불확실성을 고려하여 최적 유출량을 산정하고자 한다. 대상 유역으로는 한강 수계에 있는 중랑천 유역을 선정하였으며, Distributed 모형인 Vflo 모형과 Lumped 모형인 저류함수 모형, SSARR모형, TANK 모형을 이용하여 유출 분석을 실시하였다. 그 후, Multi-Model Super Ensemble(MMSE), Simple Model Average(SMA), Mean Square Error(MSE) 방법 등의 blending 기법을 이용하여 하나의 통합된 형태의 유출 분석 결과를 제시하였으며, 최적 유출량 산정을 위한 blending 기법을 선정하였다. 본 연구를 통해 동일한 강우 시나리오에 대한 여러 강우-유출 모형에 대한 정확도를 확인하였으며, 앙상블 및 블랜딩 기법을 사용하여 유출 분석에 대한 정확도를 향상시킬 수 있을 것으로 판단된다.

  • PDF

선형변수 기계학습 기법을 활용한 저속비대선의 잉여저항계수 추정 (Prediction of Residual Resistance Coefficient of Low-Speed Full Ships Using Hull Form Variables and Machine Learning Approaches)

  • 김유철;양경규;김명수;이영연;김광수
    • 대한조선학회논문집
    • /
    • 제57권6호
    • /
    • pp.312-321
    • /
    • 2020
  • In this study, machine learning techniques were applied to predict the residual resistance coefficient (Cr) of low-speed full ships. The used machine learning methods are Ridge regression, support vector regression, random forest, neural network and their ensemble model. 19 hull form variables were used as input variables for machine learning methods. The hull form variables and Cr data obtained from 139 hull forms of KRISO database were used in analysis. 80 % of the total data were used as training models and the rest as validation. Some non-linear models showed the overfitted results and the ensemble model showed better results than others.

북서태평양 태풍 강도 가이던스 모델 성능평가 (Validations of Typhoon Intensity Guidance Models in the Western North Pacific)

  • 오유정;문일주;김성훈;이우정;강기룡
    • 대기
    • /
    • 제26권1호
    • /
    • pp.1-18
    • /
    • 2016
  • Eleven Tropical Cyclone (TC) intensity guidance models in the western North Pacific have been validated over 2008~2014 based on various analysis methods according to the lead time of forecast, year, month, intensity, rapid intensity change, track, and geographical area with an additional focus on TCs that influenced the Korean peninsula. From the evaluation using mean absolute error and correlation coefficients for maximum wind speed forecasts up to 72 h, we found that the Hurricane Weather Research and Forecasting model (HWRF) outperforms all others overall although the Global Forecast System (GFS), the Typhoon Ensemble Prediction System of Japan Meteorological Agency (TEPS), and the Korean version of Weather and Weather Research and Forecasting model (KWRF) also shows a good performance in some lead times of forecast. In particular, HWRF shows the highest performance in predicting the intensity of strong TCs above Category 3, which may be attributed to its highest spatial resolution (~3 km). The Navy Operational Global Prediction Model (NOGAPS) and GFS were the most improved model during 2008~2014. For initial intensity error, two Japanese models, Japan Meteorological Agency Global Spectral Model (JGSM) and TEPS, had the smallest error. In track forecast, the European Centre for Medium-Range Weather Forecasts (ECMWF) and recent GFS model outperformed others. The present results has significant implications for providing basic information for operational forecasters as well as developing ensemble or consensus prediction systems.

SVM 방법을 이용한 hERG 이온 채널 저해제 예측모델 개발 (Development of Classification Model for hERG Ion Channel Inhibitors Using SVM Method)

  • 강신문;김한조;오원석;김선영;노경태;남기엽
    • 대한화학회지
    • /
    • 제53권6호
    • /
    • pp.653-662
    • /
    • 2009
  • 흡수, 분포, 대사, 배설 특성 및 독성을 예측하기 위한 효과적인 툴을 개발하는 것은 신약개발의 초기단계에서 NCE(new chemical entity)에 대한 가장 중요한 업무 중의 하나이다. 최근에 이런 시도중의 하나로서 ADME/T(absorption, distribution, metabolism, excretion, toxicity)관련 성질들의 예측에 support vector machine(SVM)을 이용하고 있다. 그리고 SVM은 ADME/T 성질들을 정확하게 예측하는데 많이 사용 되고 있다. 그러나 SVM 모델링에 두 가지 문제가 있다. 특성 선택(feature selection) 과 매개변수 설정(parameter setting)은 여전히 해결해야 할 과제이다. 이 두 가지 문제들은 SVM 분류의 효율성과 정확도에 결정적인 영향을 끼친다. 특히 특성 선택과 최적화된 SVM 변수의 설정은 서로 영향을 주기 때문에 동시에 다루어져야 한다. 여기서 우리는 genetic algorithm(GA) – 특성 선택에 사용 – 과 grid search(GS) method– 변수최적화에 사용 – 두 가지를 통합하는 효과적인 해결책을 제시하였다. ADME/T관련 성질 중 하나인 심장부정맥을 야기시키는 hERG 이온채널 저해제 분류 모델이 여기서 제안된 GA-GS-SVM을 위해 할당되고 테스트 되었다. 1891개의 화합물을 가지는 트레이닝 셋으로 단일 모델 3개, 앙상블 모델 3개, 총 6개의 모델을 만들었고 175개의 외부 데이터를 테스트 셋으로 사용하여 검증하였다. 데이터의 불균형 문제를 해결하기 위하여 GA-GS-SVM 단일 모델에 의한 예측 정확도와 GA-GS-SVM 앙상블 모델 예측 정확도를 비교하였으며, 앙상블모델을 사용하여 예측의 정확도를 높일 수 있었다.

비주석 재귀신경망 앙상블 모델을 기반으로 한 조위관측소 해수위의 준실시간 이상값 탐지 (A Non-annotated Recurrent Neural Network Ensemble-based Model for Near-real Time Detection of Erroneous Sea Level Anomaly in Coastal Tide Gauge Observation)

  • 이은주;김영택;김송학;주호정;박재훈
    • 한국해양학회지:바다
    • /
    • 제26권4호
    • /
    • pp.307-326
    • /
    • 2021
  • 상시 관측되는 조위관측소 해수위 자료는 결측값과 오측값을 포함하고 있으며, 그 중 오측 값은 이상값으로 분류되는 전처리 대상이다. 이러한 오측을 제거하기 위해 대표적으로 3𝜎 (three standard deviations) 규칙이 적용되어왔으나, 기상이변 등에 의한 극값이 존재하거나 3𝜎 범위 안에서도 오측이 존재하는 해수위 자료에는 그 적용이 어렵다. 본 연구에서 설계된 모델은 오측에 대한 사전 정보가 필요하지 않은 비주석 학습으로 구성되며, 재귀신경망과 앙상블 기법을 이용함으로써 실시간으로 수집되는 해수위 자료가 오측일 가능성을 발생한지 20분 이내로 제시한다. 검증이 완료된 모델은 평시 및 기상이변시의 정상값과 오측값을 잘 분리하며, 학습이 이뤄지지 않은 연도의 해수위 자료에서도 이상값 탐지가 가능함을 확인하였다. 본 연구의 관측 이상치 탐지 알고리즘은 조위관측소 해수위에 국한되지 않고 다양한 해양 및 대기자료의 이상치 탐지 인공신경망 모델에 확장 적용할 수 있다.

앙상블 기반 모델을 이용한 서울시 PM2.5 농도 예측 및 분석 (Prediction and Analysis of PM2.5 Concentration in Seoul Using Ensemble-based Model)

  • 류민지;손상훈;김진수
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1191-1205
    • /
    • 2022
  • 복잡하고 광범위한 원인을 가진 대기오염물질 중 particulate matter (PM)은 입자의 크기에 따라 분류된다. 그 중 PM2.5는 그 크기가 매우 작아 사람이 흡입하면 인간의 호흡기나 심혈관에 질병을 유발할 수 있다. 이러한 위험에 대비하기 위해서는 국가 중심의 관리와 사전에 예방할 수 있는 모니터링 및 예측이 중요하다. 본 연구는 고농도 미세먼지의 발생이 잦은 서울시의 PM2.5를 local data assimilation and prediction system (LDAPS) 기상 관련 인자 15가지와 aerosol optical depth (AOD), 화학인자 4가지를 독립변수로 하여 앙상블 모델 두 가지 random forest (RF)와 extreme gradient boosting (XGB)로 예측하고자 하였다. 예측에 사용된 두 모델의 성능 평가와 인자 중요도 평가를 수행하였으며, 계절별 모델 분석도 수행하였다. 예측 정확도 결과, RF가 R2 = 0.85, XGB가 R2 = 0.91의 높은 예측 정확도를 보이며 XGB가 RF보다 PM2.5 예측에 적합한 모델임을 확인하였다. 계절별 모델 분석 결과, 봄에 농도가 높은 관측 값과 비교하여 예측 수행이 잘 되었다고 할 수 있다. 본 연구는 다양한 인자를 이용하여 서울시의 PM2.5를 예측하였고, 좋은 성능을 보이는 앙상블 기반의 PM2.5 예측 모델을 구축하였다.

U-Net과 cWGAN을 이용한 탄성파 탐사 자료 보간 성능 평가 (Comparison of Seismic Data Interpolation Performance using U-Net and cWGAN)

  • 유지윤;윤대웅
    • 지구물리와물리탐사
    • /
    • 제25권3호
    • /
    • pp.140-161
    • /
    • 2022
  • 탄성파 탐사 자료 획득 시 자료의 일부가 손실되는 문제가 발생할 수 있으며 이를 위해 자료 보간이 필수적으로 수행된다. 최근 기계학습 기반 탄성파 자료 보간법 연구가 활발히 진행되고 있으며, 특히 영상처리 분야에서 이미지 초해상화에 활용되고 있는 CNN (Convolutional Neural Network) 기반 알고리즘과 GAN (Generative Adversarial Network) 기반 알고리즘이 탄성파 탐사 자료 보간법으로도 활용되고 있다. 본 연구에서는 손실된 탄성파 탐사 자료를 높은 정확도로 복구하는 보간법을 찾기 위해 CNN 기반 알고리즘인 U-Net과 GAN 기반 알고리즘인 cWGAN (conditional Wasserstein Generative Adversarial Network)을 탄성파 탐사 자료 보간 모델로 사용하여 성능 평가 및 결과 비교를 진행하였다. 이때 예측 과정을 Case I과 Case II로 나누어 모델 학습 및 성능 평가를 진행하였다. Case I에서는 규칙적으로 50% 트레이스가 손실된 자료만을 사용하여 모델을 학습하였고, 생성된 모델을 규칙/불규칙 및 샘플링 비율의 조합으로 구성된 총 6가지 테스트 자료 세트에 적용하여 모델 성능을 평가하였다. Case II에서는 6가지 테스트 자료와 동일한 형식으로 샘플링된 자료를 이용하여 해당 자료별 모델을 생성하였고, 이를 Case I과 동일한 테스트 자료 세트에 적용하여 결과를 비교하였다. 결과적으로 cWGAN이 U-Net에 비해 높은 정확도의 예측 성능을 보였으며, 정량적 평가지수인 PSNR과 SSIM에서도 cWGAN이 높은 값이 나타나는 것을 확인하였다. 하지만 cWGAN의 경우 예측 결과에서 추가적인 잡음이 생성되었으며, 잡음을 제거하고 정확도를 개선하기 위해 앙상블 작업을 수행하였다. Case II에서 생성된 cWGAN 모델들을 이용하여 앙상블을 수행한 결과, 성공적으로 잡음이 제거되었으며 PSNR과 SSIM 또한 기존의 개별 모델 보다 향상된 결과를 나타내었다.

Improving the Classification of Population and Housing Census with AI: An Industry and Job Code Study

  • Byung-Il Yun;Dahye Kim;Young-Jin Kim;Medard Edmund Mswahili;Young-Seob Jeong
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.21-29
    • /
    • 2023
  • 본 논문에서는 인구 조사에서 산업 및 직업 코드를 자동 분류하기 위한 인공지능 기반 시스템을 제안한다. 산업 및 직업 코드의 정확한 분류는 정책 결정, 자원 할당 및 연구를 위해 매우 중요하지만, 기존의 방식은 사람이 작성한 사례 사전에 의존하는 규칙 기반 방식으로 규칙 생성에 필요한 시간과 자원이 많이 소요되며 오류 발생 가능성이 높다. 우리는 본 논문에서 통계 기관에서 사용하는 기존의 규칙 기반 시스템을 대체하기 위해 사용자가 입력한 데이터를 이용하는 인공지능 기반 시스템을 제안하였다. 이 논문에서는 여러 모델을 학습하고 평가하여 산업에서 86.76%의 일치율, 직업에서 81.84%의 일치율을 달성한 앙상블 모델을 개발하였다. 또한, 분류 확률 결과를 기반으로 프로세스 개선 작업도 제안하였다. 우리가 제안한 방법은 전이 학습 기술을 활용하여 사전 학습된 모델과 결합하는 앙상블 모델을 사용하였으며, 개별 모델과 비교하여 앙상블 모델의 성능이 더 높아짐을 보였다. 본 논문에서는 인공지능 기반 시스템이 인구 조사 데이터 분류의 정확성과 효율성을 향상시키는 잠재력을 보여주며, 인공지능으로 이러한 프로세스를 자동화함으로써 더 정확하고 일관된 결과를 달성하며 기관 직원의 작업 부담을 줄일 수 있다는 점을 보여준다.

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.