• 제목/요약/키워드: model ensemble

Search Result 647, Processing Time 0.027 seconds

계층적 베이지안을 활용한 개념적 강우-유출모형 앙상블 모델 구축 (Development of a conceptual rainfall-runoff ensemble model using hierarchical Bayesian method)

  • 유재웅;김민지;오세청;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.181-181
    • /
    • 2021
  • 유역 내의 물순환 평가를 위하여 적합한 강우-유출모형을 선정하고 적용하는 것은 수문학적 관점에서 주된 과제이다. 장기적인 관점의 수자원 관리를 위해서는 직접적인 계측을 통해 장기간의 유출자료를 취득하는 방법이 있으나, 국내의 주요지점을 제외한 대다수의 중소규모의 지점에 계측기를 설치하는 것은 현실적으로 어려우므로, 자료취득이 비교적 용이하고 신뢰성이 높은 장기간 강우 자료를 강우-유출모형의 입력자료로 활용하여 미계측 유역으로의 모형을 확장하는 방안이 적절하다는 평가를 받고 있다. 본 연구는 국내외 주요 연속강우-유출모형의 특성을 파악하기 위하여 비교적 신뢰성 있는 자료를 보유하고 있는 소양강댐 유역에 다수의 연속강우-유출모형을 적용하였다. 모델링 결과로 산출된 유황곡선(flow duration curve)을 소양강댐 유입량과 비교하여 각 모형의 특징을 파악하고 유량에 따른 적합성 평가를 진행하였다. 또한, 향후 미계측유역으로 모형을 확장하기 위하여 매개변수 개수 및 재현능력을 동시에 평가하였다. 다수의 모형 중 적합성이 높은 모형들을 선별하였으며, 선별된 모형들의 불확실성을 고려함과 동시에 계층적 베이지안 기법을 활용하여 최종적으로 앙상블모형을 제시하였다. 앙상블모형을 단일 모형과 비교한 결과 단일 모형보다 개선된 성능을 확인하였다.

  • PDF

Automated Phase Identification in Shingle Installation Operation Using Machine Learning

  • Dutta, Amrita;Breloff, Scott P.;Dai, Fei;Sinsel, Erik W.;Warren, Christopher M.;Wu, John Z.
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.728-735
    • /
    • 2022
  • Roofers get exposed to increased risk of knee musculoskeletal disorders (MSDs) at different phases of a sloped shingle installation task. As different phases are associated with different risk levels, this study explored the application of machine learning for automated classification of seven phases in a shingle installation task using knee kinematics and roof slope information. An optical motion capture system was used to collect knee kinematics data from nine subjects who mimicked shingle installation on a slope-adjustable wooden platform. Four features were used in building a phase classification model. They were three knee joint rotation angles (i.e., flexion, abduction-adduction, and internal-external rotation) of the subjects, and the roof slope at which they operated. Three ensemble machine learning algorithms (i.e., random forests, decision trees, and k-nearest neighbors) were used for training and prediction. The simulations indicate that the k-nearest neighbor classifier provided the best performance, with an overall accuracy of 92.62%, demonstrating the considerable potential of machine learning methods in detecting shingle installation phases from workers knee joint rotation and roof slope information. This knowledge, with further investigation, may facilitate knee MSD risk identification among roofers and intervention development.

  • PDF

Text Classification with Heterogeneous Data Using Multiple Self-Training Classifiers

  • William Xiu Shun Wong;Donghoon Lee;Namgyu Kim
    • Asia pacific journal of information systems
    • /
    • 제29권4호
    • /
    • pp.789-816
    • /
    • 2019
  • Text classification is a challenging task, especially when dealing with a huge amount of text data. The performance of a classification model can be varied depending on what type of words contained in the document corpus and what type of features generated for classification. Aside from proposing a new modified version of the existing algorithm or creating a new algorithm, we attempt to modify the use of data. The classifier performance is usually affected by the quality of learning data as the classifier is built based on these training data. We assume that the data from different domains might have different characteristics of noise, which can be utilized in the process of learning the classifier. Therefore, we attempt to enhance the robustness of the classifier by injecting the heterogeneous data artificially into the learning process in order to improve the classification accuracy. Semi-supervised approach was applied for utilizing the heterogeneous data in the process of learning the document classifier. However, the performance of document classifier might be degraded by the unlabeled data. Therefore, we further proposed an algorithm to extract only the documents that contribute to the accuracy improvement of the classifier.

Random Forests 기법을 이용한 백내장 예측모형 - 일개 대학병원 건강검진 수검자료에서 - (A Prediction Model for the Development of Cataract Using Random Forests)

  • 한은정;송기준;김동건
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.771-780
    • /
    • 2009
  • 백내장 질환은 노령인구가 증가하고 있는 시점에서 사회, 경제적으로 심각한 문제로 부각되고 있는 질병으로 조기 진단이 이루어진다면 발병률을 크게 줄일 수 있는 질병이다. 본 연구에서는 백내장을 조기 진단하기 위한 예측 모형을 구축하고자 1994년부터 2001년까지 연세대학병원에서 2회 이상 건강검진을 받고 의사진단을 통해 백내장 여부를 확인할 수 있는 30세 이상 남 녀 3,237명에 대한 건강검진 수검 자료를 활용하여 백내장 발생 위험 예측모형을 개발하였다. 모형개발에는 데이터마이닝 기법인 Random Forests를 사용하였고, 기존의 로지스틱 회귀분석, 판별분석, 의사결정나무 모형(Decision tree), 나이브베이즈(Naive Bayes), 앙상블 모형인 배깅(Bagging)과 아킹(Arcing)을 이용하여 그 성능을 비교 분석하였다. Random Forests를 통해 개발한 백내장 발생 예측모형은 정확도가 67.16%, 민감도가 72.28%였고, 주요 영향요인은 연령, 혈당, 백혈구수치(WBC), 혈소판수치(platelet), 중성지질(triglyceride), BMI였다. 이 결과는 의사의 안과검진 정보 없이 건강검진 수검 자료만으로 백내장 질환 유 무에 관한 정보를 70% 정도 예측할 수 있음을 보여주는 것으로, 백내장의 조기 진단에 많은 기여를 할 것으로 판단된다.

인공지능을 이용한 급성 뇌졸중 환자의 재원일수 예측모형 개발 (Development of Predictive Model for Length of Stay(LOS) in Acute Stroke Patients using Artificial Intelligence)

  • 최병관;함승우;김촉환;서정숙;박명화;강성홍
    • 디지털융복합연구
    • /
    • 제16권1호
    • /
    • pp.231-242
    • /
    • 2018
  • 병원 재원일수의 효율적 관리는 병원의 수익과 환자의 진료비 절감을 위해 매우 중요한 요소이다. 이러한 재원일수의 효율적 관리를 위해서는 병원들이 재원일수에 대해서 벤치마킹을 할 수 있도록 지원이 필요하고 재원일수 절감의 구체적인 방향을 제시해 줄 수 있는 재원일수 예측모형의 개발이 필요하다. 본 연구에서는 2013년과 2014년도 퇴원손상환자자료 중 급성뇌졸중 환자를 추출하여 분석용 자료를 만들고 인공지능을 이용하여 급성뇌졸중 환자의 재원일수 예측모형을 개발하였다. 분석용 자료는 훈련용 60%, 평가용 40%로 분류하였다. 모형개발은 전통적 통계기법인 다중회귀분석기법과 인공지능기법인 대화식 의사결정나무기법, 신경망 기법, 그리고 이들을 모두 통합한 앙상블기법을 이용하였다. 모형평가는 Root ASE(Absolute error) 지표를 이용하였는데, 다중회귀분석은 23.7, 대화식결정나무 23.7, 신경망 분석은 22.7, 앙상블은 22.7로 나타났고 이를 통하여 재원일수 예측모형 개발에 인공지능기법의 유용성이 입증되었다. 앞으로 재원일수 예측모형개발에 인공지능 기법을 보다 효율적으로 활용할 수 있는 방안에 대해서 계속적인 연구가 이루어 질 필요가 있다.

GloSea5 모델의 자료처리 시스템 구축 및 시·공간적 재현성평가 (Data processing system and spatial-temporal reproducibility assessment of GloSea5 model)

  • 문수진;한수희;최광순;송정현
    • 한국수자원학회논문집
    • /
    • 제49권9호
    • /
    • pp.761-771
    • /
    • 2016
  • 기상청에서 운영하고 제공하는 전지구 계절예측시스템 GloSea5 (Global Seasonal forecasting system version 5)자료를 활용하여 용담댐유역에 적용하고자 하였다. GloSea5는 예측자료(Forecast; 이하 FCST)와 과거재현자료(Hindcast; 이하 HCST)로 제공되며 공간 수평해상도는 N216 ($0.83^{\circ}{\times}0.56^{\circ}$)으로 중위도에서 약 60km이다. 이를 유역단위 물관리에 활용하기 위해서는 시 공간적인 상세화가 필요하므로 통계적 상세화 기법을 수행하여 변수가 갖는 계통적인 지역 오차를 보정함으로써 자료의 신뢰도를 향상시키고자 하였다. HCST자료는 앙상블 형태로 주어지며 용담댐 유역의 앙상블 평균에 대한 6번 격자의 통계적인 상관성($R^2=0.60$, RMSE=88.92, NSE=0.57)이 가장 높게 나타났다. 또한 계절분석시 여름철의 경우 원시 GloSea5 강우량이 600.1mm로 관측값인 816.1mm 대비 -26.5%로 가장 많은 차이를 보였으며 상세화 후 GloSea5 강우량은 -3.1%의 오차율을 보였다. 대부분의 과소 모의된 결과가 여름철 홍수기에 해당되는 강우로 상세화 이후 강우가 회복되는 매우 중요한 결과를 보였다. 계절별 Moran's I 지수를 이용한 공간적 자기상관분석 결과 역시 통계적으로 유의성 있는 공간적인 분포를 나타냄으로써 자료의 불확실성을 개선하고 시 공간적인 정확도와 타당성을 입증하였다. HCST기간에 대한 GloSea5의 앙상블 강우에 대한 신뢰도를 향상시킴으로써 수문학적인 영향을 평가하기 위한 자료로서의 충분한 가능성을 확보하였으며 이러한 시 공간적인 재현성에 대한 평가결과는 향후 유역단위 물관리를 위한 기초자료로서 매우 중요한 역할을 할 것이다.

머신러닝을 활용한 자동차 시트용 폴리우레탄 발포공정의 불량 예측 모델 개발 (A Development of Defeat Prediction Model Using Machine Learning in Polyurethane Foaming Process for Automotive Seat)

  • 최낙훈;오종석;안종록;김기선
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.36-42
    • /
    • 2021
  • 최근 4차 산업혁명으로 인해 제조업계에서는 제조업의 인공지능을 접목시켜 효율성을 극대화하는 스마트 팩토리 붐이 일어나고 있다. 특히 자동차 부품 제조 및 생산에 널리 적용되어 불량을 낮추는 연구들이 활발히 진행되고 있다. 이에 본 연구에서는 머신러닝을 통한 불량예측을 시트 폼 발포공정에 접목시켜 발포공정의 효율성을 극대화하는 연구를 진행하였다. 자동차 시트폼 에서 주로 사용되는 폴리우레탄 폼(polyurethane foam)은 폴리올(polyol, 이하 POL)과 이소시아네이트(isocyanate, 이하 ISO)를 혼합 및 발포하는 공정으로 제조되며, 각 원료의 혼합비율과 온도의 변화에 따라 제품의 특성이 변화한다. 이에 본 연구에서는 발포공정에서 수집되는 인자별 데이터값을 머신러닝에 적용하여 불량을 예측하고자 한다. 머신러닝에 사용되는 알고리즘으로는 의사결정트리, kNN, 앙상블 알고리즘을 사용하였으며 학습은 5,147개의 데이터를 사용하였으며, 학습된 결과를 1,000개의 검증용 데이터에 적용한 결과, 세 알고리즘 중 앙상블 알고리즘에서 최대 98.5 %의 정확도를 확인할 수 있었다. 이러한 결과를 통해 발포공정에서 실시간으로 수집되는 데이터를 통해 현재 생산되는 부품의 불량 여부를 확인할 수 있으며, 나아가 각 인자를 조절하여 불량률을 개선할 수 있음을 짐작할 수 있다고 사료된다.

BRDF 앙상블 모델을 이용한 고해상도 Sentinel-2 영상 보정 (High-Resolution Sentinel-2 Imagery Correction Using BRDF Ensemble Model)

  • 문현동;김보경;김경민;최수빈;조은이;안호용;류재현;최성원;조재일
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1427-1435
    • /
    • 2023
  • 농업의 새로운 패러다임인 디지털 농업에서는 원격탐사 기법을 활용하여 작물 생육을 지속적으로 감시하며 해당 정보를 신속하게 디지털화 하고 있다. 이를 위해 선택적 파장 반사도 변화를 기반으로 한 식생지수가 널리 활용되고 있다. 그러나 식생 표면의 분광 산란·반사는 이방성을 보이기 때문에 광원인 태양의 위치와 관측 방향에 따라 반사도가 달라진다. 이는 식생지수 값이 작물의 실제 상태를 정확하게 반영하지 못하고 왜곡될 수 있다. 본 연구에서는 이방성 반사 특성 보정을 위해 bidirectional reflectance distribution function (BRDF) 앙상블 모델을 고해상도 Sentinel-2 위성 영상에 적용하고, normalized difference vegetation index (NDVI)와 2-band enhanced vegetation index (EVI2)를 산출하였다. BRDF 보정에 따라 산림에서 Red와 near-infrared (NIR) 밴드의 반사도가 대체로 증가하고, 농촌마을 및 농경지에서는 감소했다. 식생지수는 BRDF 보정 후에 산림지역 내에서의 지형 구분이 뚜렷해지고 논은 수확 유무에 따른 공간적 차이가 상승했다. 이는 EVI2보다 NDVI에서 그 차이가 컸다. 이러한 결과는 앞으로의 고해상도 위성 영상에서의 BRDF 모델 개발과 개선에 기여할 것으로 기대된다.

Transfer Learning based DNN-SVM Hybrid Model for Breast Cancer Classification

  • Gui Rae Jo;Beomsu Baek;Young Soon Kim;Dong Hoon Lim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.1-11
    • /
    • 2023
  • 유방암은 전 세계적으로 여성들 대다수에게 가장 두려워하는 질환이다. 오늘날 데이터의 증가와 컴퓨팅 기술의 향상으로 머신러닝(machine learning)의 효율성이 증대되어 암 검출 및 진단 등에 중요한 역할을 하고 있다. 딥러닝(deep learning)은 인공신경망(artificial neural network, ANN)을 기반으로 하는 머신러닝 기술의 한 분야로 최근 여러 분야에서 성능이 급속도로 개선되어 활용 범위가 확대되고 있다. 본 연구에서는 유방암 분류를 위해 전이학습(transfer learning) 기반 DNN(Deep Neural Network)과 SVM(support vector machine)의 구조를 결합한 DNN-SVM Hybrid 모형을 제안한다. 전이학습 기반 제안된 모형은 적은 학습 데이터에도 효과적이고, 학습 속도도 빠르며, 단일모형, 즉 DNN과 SVM이 가지는 장점을 모두 활용 가능토록 결합함으로써 모형 성능이 개선되었다. 제안된 DNN-SVM Hybrid 모형의 성능평가를 위해 UCI 머신러닝 저장소에서 제공하는 WOBC와 WDBC 유방암 자료를 가지고 성능실험 결과, 제안된 모형은 여러 가지 성능 척도 면에서 단일모형인 로지스틱회귀 모형, DNN, SVM 그리고 앙상블 모형인 랜덤 포레스트보다 우수함을 보였다.

강우 및 강우-유출 모형의 불확실성을 고려한 홍수빈도곡선 유도 (Derivation of Flood Frequency Curve with Uncertainty of Rainfall and Rainfall-Runoff Model)

  • 권현한;김장경;박세훈
    • 한국수자원학회논문집
    • /
    • 제46권1호
    • /
    • pp.59-71
    • /
    • 2013
  • 신뢰성 있는 홍수빈도해석을 수행하기 위해서는 충분한 홍수량 및 강우자료가 필요하다. 강우자료의 경우 우리나라 대부분 지역에서 30년 이상의 극치자료가 활용이 가능한 반면 홍수량 자료는 상대적으로 충분한 자료가 확보되지 않아 신뢰성 있는 빈도해석이 어려운 실정이다. 이에 따라 강우모의 기법에 근거한 홍수빈도곡선 유도방안연구가 몇몇 연구에서 제안된 바 있으나, 기본적으로 입력된 강우의 빈도와 홍수의 빈도가 동일하다고 가정함으로 인하여 발생하는 불확실성이 상당부분 내포되어 있다. 이러한 점에서 본 연구의 목적은 강우모의기법과 불확실성 분석이 고려된 홍수빈도곡선 유도방법을 개발하는 것으로 홍수빈도곡선을 유도하는데 있어서의 핵심은 미래에 발생 가능한 극치강수량을 효과적으로 재현할 수 있는 강수량 모의발생 기법과 강우-유출관계의 불확실성 분석에 있다. 본 연구에서는 극치강수량 모의를 위해 불연속 Kernel Pareto 분포를이용한 다지점 강수모의기법과 Bayesian HEC-1 (BHEC-1) 모형을 연계하여 본연구의 대상유역인 대청댐 유역의 강우-유출 관계의 불확실성을 고려한 홍수빈도곡선을 개발하고 모형의 적합성을 평가하였다. 최종적으로 기존 홍수빈도결정방법과 비교를 통해서 모형의 적합성을 확인하였다.