• Title/Summary/Keyword: 앙상블모델

Search Result 301, Processing Time 0.028 seconds

H-PaDiM : Anomaly Segmentation Performance Analysis Based on PaDiM-Based Homogeneous Ensemble Method (H-PaDiM : PaDiM 기반 동종 앙상블 기법에 따른 이상 탐지성능 분석)

  • Kim, InKi;Gwak, Jeonghwan
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.95-97
    • /
    • 2022
  • 본 논문에서는 산업 현장에서 발생하는 불량품 탐지 분야에서 효율적으로 생산품의 불량을 탐지할 수 있는 PaDiM 구조의 Backbone 모델을 단일 Wide-ResNet 대신 두 개의 Wide-ResNet을 사용함으로써, 단일 모델에서 추출된 저차원의 Feature를 앙상블을 통해 성능 향상을 일으킬 수 있는 것을 증명하였다. 단일 Wide-ResNet 환경에서는 MVTec 데이터셋에서 생성된 다변량 가우시안 분포가 데이터셋의 적은 샘플수로 인하여 각 클래스 간 불균형이 발생하는 문제를 동종 앙상블을 통해 해결할 수 있었다. 따라서 본 논문에서는 제안하는 동종 모델의 앙상블을 사용함으로써 기존의 One-class classification 환경에서 불량품 탐지환경에서 적은 수의 데이터 샘플 환경에서 성능 향상을 나타낼 수 있음을 입증하였다.

  • PDF

Impact of Ensemble Member Size on Confidence-based Selection in Bankruptcy Prediction (부도예측을 위한 확신 기반의 선택 접근법에서 앙상블 멤버 사이즈의 영향에 관한 연구)

  • Kim, Na-Ra;Shin, Kyung-Shik;Ahn, Hyunchul
    • Journal of Intelligence and Information Systems
    • /
    • v.19 no.2
    • /
    • pp.55-71
    • /
    • 2013
  • The prediction model is the main factor affecting the performance of a knowledge-based system for bankruptcy prediction. Earlier studies on prediction modeling have focused on the building of a single best model using statistical and artificial intelligence techniques. However, since the mid-1980s, integration of multiple techniques (hybrid techniques) and, by extension, combinations of the outputs of several models (ensemble techniques) have, according to the experimental results, generally outperformed individual models. An ensemble is a technique that constructs a set of multiple models, combines their outputs, and produces one final prediction. The way in which the outputs of ensemble members are combined is one of the important issues affecting prediction accuracy. A variety of combination schemes have been proposed in order to improve prediction performance in ensembles. Each combination scheme has advantages and limitations, and can be influenced by domain and circumstance. Accordingly, decisions on the most appropriate combination scheme in a given domain and contingency are very difficult. This paper proposes a confidence-based selection approach as part of an ensemble bankruptcy-prediction scheme that can measure unified confidence, even if ensemble members produce different types of continuous-valued outputs. The present experimental results show that when varying the number of models to combine, according to the creation type of ensemble members, the proposed combination method offers the best performance in the ensemble having the largest number of models, even when compared with the methods most often employed in bankruptcy prediction.

Ensemble trading algorithm Using Dirichlet distribution-based model contribution prediction (디리클레 분포 기반 모델 기여도 예측을 이용한 앙상블 트레이딩 알고리즘)

  • Jeong, Jae Yong;Lee, Ju Hong;Choi, Bum Ghi;Song, Jae Won
    • Smart Media Journal
    • /
    • v.11 no.3
    • /
    • pp.9-17
    • /
    • 2022
  • Algorithmic trading, which uses algorithms to trade financial products, has a problem in that the results are not stable due to many factors in the market. To alleviate this problem, ensemble techniques that combine trading algorithms have been proposed. However, there are several problems with this ensemble method. First, the trading algorithm may not be selected so as to satisfy the minimum performance requirement (more than random) of the algorithm included in the ensemble, which is a necessary requirement of the ensemble. Second, there is no guarantee that an ensemble model that performed well in the past will perform well in the future. In order to solve these problems, a method for selecting trading algorithms included in the ensemble model is proposed as follows. Based on past data, we measure the contribution of the trading algorithms included in the ensemble models with high performance. However, for contributions based only on this historical data, since there are not enough past data and the uncertainty of the past data is not reflected, the contribution distribution is approximated using the Dirichlet distribution, and the contribution values are sampled from the contribution distribution to reflect the uncertainty. Based on the contribution distribution of the trading algorithm obtained from the past data, the Transformer is trained to predict the future contribution. Trading algorithms with high predicted future contribution are selected and included in the ensemble model. Through experiments, it was proved that the proposed ensemble method showed superior performance compared to the existing ensemble methods.

Value of the SMILEs for research on water-related compound hazards under climate change impact (기후변화 및 물 관련 복합재해 연구를 위한 SMILE 활용의 가치)

  • Wooyoung, Na
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.348-348
    • /
    • 2023
  • 최근 전세계 곳곳에서는 다양한 유형의 물 관련 복합재해가 발생하고 있다. 일례로 미국 캘리포니아 지역은 2014년부터 2017년까지 극심한 가뭄에 시달리다가 대기강(atmospheric river)의 영향으로 인하여 대규모의 홍수가 잇달아 발생하였다. 유럽에서는 2021년 전례 없는 홍수 직후 500년 빈도의 가뭄이 발생하면서 심각한 인명 및 재산피해가 발생하였다. 짧은 시간 동안 양극단의수재해가 연속적으로 발생하거나, 가뭄과 폭염, 홍수와 산사태의 결합, 또는 동시에 여러 지역에서 홍수나 가뭄이 발생하는 현상 등도 복합재해에 해당한다. 즉, 복합재해는 서로 다른 특성의 독립적인 수재해가 결합되어 나타나는 재해의 한 형태로써, 발생 빈도는 적으나 유발되는 피해는 매우 크다. 더욱이 복합재해는 미래에 더욱 빈번하게, 극심하게 발생할 것으로 예상되고 있다. Single Model Initial-condition Large Ensemble (SMILE)은 복합재해의 분석에 적합한 자료로 최근 활용사례가 증가하고 있다. 기존의 기후변화 관련 연구는 여러 기후모델에서 생산한 단일 모의자료를 앙상블의 형태로 이용하여 기후요소 및 기후재해의 미래 전망이나 거동을 분석하는 과정에 기반해왔다. 이 기후모델 앙상블은 모델 간 불확실성은 고려할 수 있으나 기온 상승 시나리오의 불확실성 및 기후 시스템 내부의 변동성은 고려하지 못하는 한계가 있다. 이에 미국의 National Center for Atmospheric Research에서는 자연 자체의 변동에 의한 불확실성을 모의할 수 있는 SMILE을 개발하였다. SMILE은 단일 기후모델에서 N개의 다중 모의자료 앙상블을 출력한다. 기존의 기후모델과 유사한 과정으로 모의를 수행하되, 미세한 섭동을 부여함으로써 자연적으로 발생하는 기후시스템 내부의 변동성을 고려한다. 이러한 실험 설정은 카오스 이론에 근거한다. 여러 기후모델에 대해 SMILE 기반 모의를 수행하면 앙상블의 앙상블 개념(large ensemble)이므로 방대한 양의 기후모의 자료가 확보되어 다양한 목적의 연구에 활용할 수 있다. SMILE은 기존의 다중 기후모델 앙상블이 고려할 수 없었던 종류의 불확실성을 추가적으로 고려함으로써 인간의 활동과 자연적 변동성이 복합재해에 미치는 상대적 영향을 정량적으로 평가할 수 있게 한다. 복합재해 연구에 필수적인 표본 수 부족의 한계를 극복할 수 있기 때문에 최근 기후변화 및 수자원 관련 연구에서 적극적으로 활용되고 있다. 또한, 미래 기후를 모의하기 때문에 복합재해 발생의 특성 및 거동을 전망할 수 있고, 충분한 수의 표본은 통계분석 결과에 신뢰성을 부여할 수 있다. 이러한 SMILE의 장점은 향후 더욱 다양한 연구의 기회를 제공할 것이다.

  • PDF

Ensemble Classification Method for Efficient Medical Diagnostic (효율적인 의료진단을 위한 앙상블 분류 기법)

  • Jung, Yong-Gyu;Heo, Go-Eun
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.10 no.3
    • /
    • pp.97-102
    • /
    • 2010
  • The purpose of medical data mining for efficient algorithms and techniques throughout the various diseases is to increase the reliability of estimates to classify. Previous studies, an algorithm based on a single model, and even the existence of the model to better predict the classification accuracy of multi-model ensemble-based research techniques are being applied. In this paper, the higher the medical data to predict the reliability of the existing scope of the ensemble technique applied to the I-ENSEMBLE offers. Data for the diagnosis of hypothyroidism is the result of applying the experimental technique, a representative ensemble Bagging, Boosting, Stacking technique significantly improved accuracy compared to all existing, respectively. In addition, compared to traditional single-model techniques and ensemble techniques Multi modeling when applied to represent the effects were more pronounced.

Ensemble Design of Machine Learning Technigues: Experimental Verification by Prediction of Drifter Trajectory (앙상블을 이용한 기계학습 기법의 설계: 뜰개 이동경로 예측을 통한 실험적 검증)

  • Lee, Chan-Jae;Kim, Yong-Hyuk
    • Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology
    • /
    • v.8 no.3
    • /
    • pp.57-67
    • /
    • 2018
  • The ensemble is a unified approach used for getting better performance by using multiple algorithms in machine learning. In this paper, we introduce boosting and bagging, which have been widely used in ensemble techniques, and design a method using support vector regression, radial basis function network, Gaussian process, and multilayer perceptron. In addition, our experiment was performed by adding a recurrent neural network and MOHID numerical model. The drifter data used for our experimental verification consist of 683 observations in seven regions. The performance of our ensemble technique is verified by comparison with four algorithms each. As verification, mean absolute error was adapted. The presented methods are based on ensemble models using bagging, boosting, and machine learning. The error rate was calculated by assigning the equal weight value and different weight value to each unit model in ensemble. The ensemble model using machine learning showed 61.7% improvement compared to the average of four machine learning technique.

Development and Evaluation of an Ensemble Forecasting System for the Regional Ocean Wave of Korea (앙상블 지역 파랑예측시스템 구축 및 검증)

  • Park, JongSook;Kang, KiRyong;Kang, Hyun-Suk
    • Journal of Korean Society of Coastal and Ocean Engineers
    • /
    • v.30 no.2
    • /
    • pp.84-94
    • /
    • 2018
  • In order to overcome the limitation of deterministic forecast, an ensemble forecasting system for regional ocean wave is developed. This system predicts ocean wind waves based on the meteorological forcing from the Ensemble Prediction System for Global of the Korea Meteorological Administration, which is consisted of 24 ensemble members. The ensemble wave forecasting system is evaluated by using the moored buoy data around Korea. The root mean squared error (RMSE) of ensemble mean showed the better performance than the deterministic forecast system after 2 days, especially RMSE of ensemble mean is improved by 15% compared with the deterministic forecast for 3-day lead time. It means that the ensemble method could reduce the uncertainty of the deterministic prediction system. The Relative Operating Characteristic as an evaluation scheme of probability prediction was bigger than 0.9 showing high predictability, meaning that the ensemble wave forecast could be usefully applied.

Uncertainty assessment of ensemble streamflow prediction method (앙상블 유량예측기법의 불확실성 평가)

  • Kim, Seon-Ho;Kang, Shin-Uk;Bae, Deg-Hyo
    • Journal of Korea Water Resources Association
    • /
    • v.51 no.6
    • /
    • pp.523-533
    • /
    • 2018
  • The objective of this study is to analyze uncertainties of ensemble-based streamflow prediction method for model parameters and input data. ESP (Ensemble Streamflow Prediction) and BAYES-ESP (Bayesian-ESP) based on ABCD rainfall-runoff model were selected as streamflow prediction method. GLUE (Generalized Likelihood Uncertainty Estimation) was applied for the analysis of parameter uncertainty. The analysis of input uncertainty was performed according to the duration of meteorological scenarios for ESP. The result showed that parameter uncertainty was much more significant than input uncertainty for the ensemble-based streamflow prediction. It also indicated that the duration of observed meteorological data was appropriate to using more than 20 years. And the BAYES-ESP was effective to reduce uncertainty of ESP method. It is concluded that this analysis is meaningful for elaborating characteristics of ESP method and error factors of ensemble-based streamflow prediction method.

Korean Dependency Parsing Using Various Ensemble Models (다양한 앙상블 알고리즘을 이용한 한국어 의존 구문 분석)

  • Jo, Gyeong-Cheol;Kim, Ju-Wan;Kim, Gyun-Yeop;Park, Seong-Jin;Gang, Sang-U
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.543-545
    • /
    • 2019
  • 본 논문은 최신 한국어 의존 구문 분석 모델(Korean dependency parsing model)들과 다양한 앙상블 모델(ensemble model)들을 결합하여 그 성능을 분석한다. 단어 표현은 미리 학습된 워드 임베딩 모델(word embedding model)과 ELMo(Embedding from Language Model), Bert(Bidirectional Encoder Representations from Transformer) 그리고 다양한 추가 자질들을 사용한다. 또한 사용된 의존 구문 분석 모델로는 Stack Pointer Network Model, Deep Biaffine Attention Parser와 Left to Right Pointer Parser를 이용한다. 최종적으로 각 모델의 분석 결과를 앙상블 모델인 Bagging 기법과 XGBoost(Extreme Gradient Boosting) 이용하여 최적의 모델을 제안한다.

  • PDF

Automatic Multi-layer Stacking Ensemble Generation Technique for Predicting Diabetes Mellitus Incidence (당뇨병 발생 예측을 위한 다층 스태킹 앙상블 모델 구축 기법)

  • Ayeong Seong;Sohyun Yun;Suyeon Kang;Gun-Woo Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.426-427
    • /
    • 2023
  • 최근 현대인의 식습관 및 고령화로 인해 당뇨병 환자의 수가 연간 증가하고 있다. 따라서 현재는 아직 당뇨병이 발생하지 않았더라도 미래에 발생할 가능성 예측의 중요성이 커지고 있다. 기존의 당뇨병 발생 여부 진단 연구는 회귀 분석과 같은 단일 모델을 사용하여 수행된다. 그러나 당뇨병에 영향을 미치는 변수들은 복잡하게 얽혀있어 단일 모델만으로는 패턴을 충분히 학습하기 어렵다. 본 논문에서는 데이터에 적합하게 자동으로 다층 스태킹 앙상블 모델을 구성하는 알고리즘을 이용한 다층 스태킹 앙상블 모델을 제안한다. 제안하는 방법은 성능이 높은 모델들을 기준으로 층을 쌓으며 모델을 구성하며 실험 결과 다른 자동 기계학습 라이브러리와 비교해 F1 score 기준으로 최대 12.89%p의 성능 향상을 보였다.