• 제목/요약/키워드: Model Ensemble

검색결과 638건 처리시간 0.025초

흉부 CT 영상에서 비소세포폐암 환자의 재발 예측을 위한 종양 내외부 영상 패치 기반 앙상블 학습 (Ensemble Learning Based on Tumor Internal and External Imaging Patch to Predict the Recurrence of Non-small Cell Lung Cancer Patients in Chest CT Image)

  • 이예슬;조아현;홍헬렌
    • 한국멀티미디어학회논문지
    • /
    • 제24권3호
    • /
    • pp.373-381
    • /
    • 2021
  • In this paper, we propose a classification model based on convolutional neural network(CNN) for predicting 2-year recurrence in non-small cell lung cancer(NSCLC) patients using preoperative chest CT images. Based on the region of interest(ROI) defined as the tumor internal and external area, the input images consist of an intratumoral patch, a peritumoral patch and a peritumoral texture patch focusing on the texture information of the peritumoral patch. Each patch is trained through AlexNet pretrained on ImageNet to explore the usefulness and performance of various patches. Additionally, ensemble learning of network trained with each patch analyzes the performance of different patch combination. Compared with all results, the ensemble model with intratumoral and peritumoral patches achieved the best performance (ACC=98.28%, Sensitivity=100%, NPV=100%).

The Characteristics of Signal versus Noise SST Variability in the North Pacific and the Tropical Pacific Ocean

  • Yeh, Sang-Wook;Kirtman, Ben P.
    • Ocean Science Journal
    • /
    • 제41권1호
    • /
    • pp.1-10
    • /
    • 2006
  • Total sea surface temperature (SST) in a coupled GCM is diagnosed by separating the variability into signal variance and noise variance. The signal and the noise is calculated from multi-decadal simulations from the COLA anomaly coupled GCM and the interactive ensemble model by assuming both simulations have a similar signal variance. The interactive ensemble model is a new coupling strategy that is designed to increase signal to noise ratio by using an ensemble of atmospheric realizations coupled to a single ocean model. The procedure for separating the signal and the noise variability presented here does not rely on any ad hoc temporal or spatial filter. Based on these simulations, we find that the signal versus the noise of SST variability in the North Pacific is significantly different from that in the equatorial Pacific. The noise SST variability explains the majority of the total variability in the North Pacific, whereas the signal dominates in the deep tropics. It is also found that the spatial characteristics of the signal and the noise are also distinct in the North Pacific and equatorial Pacific.

뇌파의 중첩 분할에 기반한 CNN 앙상블 모델을 이용한 뇌전증 발작 검출 (Epileptic Seizure Detection Using CNN Ensemble Models Based on Overlapping Segments of EEG Signals)

  • 김민기
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권12호
    • /
    • pp.587-594
    • /
    • 2021
  • 뇌파(electroencephalogram, EEG)를 이용한 진단이 확대되면서 EEG 신호를 자동으로 분류하기 위한 다양한 연구가 활발히 이루어지고 있다. 본 논문은 일반인과 뇌전증 환자에게서 추출한 EEG 신호를 효과적으로 식별할 수 있는 CNN 모델을 제안한다. CNN의 학습에 필요한 데이터를 확장하기 위하여 EEG 신호를 낮은 차원의 신호로 분할하고, 이것을 다시 여러 개의 세그먼트로 중첩 분할하여 CNN 학습에 이용한다. 이와 더불어 CNN의 성능을 개선하기 위하여 CNN 앙상블 전략을 제안한다. 공개된 Bonn 데이터세트로 실험을 수행한 결과 뇌전증 발작을 99.0% 이상의 정확도로 검출하였고, 앙상블 방식에 의해 3-클래스와 5-클래스의 EEG 분류에서 정확도가 향상되었다.

PNU CGCM 앙상블 예보 시스템의 겨울철 남한 기온 예측 성능 평가 (Evaluation of PNU CGCM Ensemble Forecast System for Boreal Winter Temperature over South Korea)

  • 안중배;이준리;조세라
    • 대기
    • /
    • 제28권4호
    • /
    • pp.509-520
    • /
    • 2018
  • The performance of the newly designed Pusan National University Coupled General Circulation Model (PNU CGCM) Ensemble Forecast System which produce 40 ensemble members for 12-month lead prediction is evaluated and analyzed in terms of boreal winter temperature over South Korea (S. Korea). The influence of ensemble size on prediction skill is examined with 40 ensemble members and the result shows that spreads of predictability are larger when the size of ensemble member is smaller. Moreover, it is suggested that more than 20 ensemble members are required for better prediction of statistically significant inter-annual variability of wintertime temperature over S. Korea. As for the ensemble average (ENS), it shows superior forecast skill compared to each ensemble member and has significant temporal correlation with Automated Surface Observing System (ASOS) temperature at 99% confidence level. In addition to forecast skill for inter-annual variability of wintertime temperature over S. Korea, winter climatology around East Asia and synoptic characteristics of warm (above normal) and cold (below normal) winters are reasonably captured by PNU CGCM. For the categorical forecast with $3{\times}3$ contingency table, the deterministic forecast generally shows better performance than probabilistic forecast except for warm winter (hit rate of probabilistic forecast: 71%). It is also found that, in case of concentrated distribution of 40 ensemble members to one category out of the three, the probabilistic forecast tends to have relatively high predictability. Meanwhile, in the case when the ensemble members distribute evenly throughout the categories, the predictability becomes lower in the probabilistic forecast.

MME(Multi-Model Ensemble)를 활용한 국가 수자원 기후변화 영향평가 (Climate Change Impact Assessments on Korean Water Reseources using Multi-Model Ensemble)

  • 배덕효;정일원;이병주;전태현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.198-202
    • /
    • 2009
  • 기후변화는 강수와 기온을 변화시켜 수자원에 지대한 영향을 미칠 것으로 알려져 있다. 따라서 이에 대한 안정적인 수자원 관리를 위해서는 기후변화 영향을 정량적으로 평가하는 것이 필요하다. 기본적으로 기후변화에 대한 수자원의 영향을 연구할 때 '온실가스 배출시나리오, GCMs을 통한 기후모의, 시공간적 편차보정을 위한 상세화, 유출모형 적용을 통한 유출시나리오 생산'의 과정을 거친다. 그러나 유출시나리오를 얻기까지 과정에는 각각 불확실성을 가지고 있기 때문에 최종결과의 불확실성은 각 과정을 거치면서 매우 커진다고 할 수 있다. 다양한 배출시나리오, GCM 결과, 유출모형에 대해 단순평균 혹은 가중치를 주는 multi-model ensemble 기법은 각 경우에 따른 값의 범위를 제시할 수있다는 점 때문에 불확실성 평가에서 주로 이용되고 있다. 본 연구에서는 우리나라 5대강 유역 109개 중권역에 대해 multi-model ensemble을 적용하여 기후변화에 의한 수자원 영향을 평가하였다. 1971년에서 2100년까지 120년 기간에 대해 3개의 온실가스 배출시나리오, 13개의 GCMs 결과들을 수집하여 총 39개의 기후시나리오를 이용하였고, 이를 8개의 유출모형에 적용하여 총 312개의 유출시나리오를 생산하였다. 생산된 유출시나리오를 기준시간(1971${\sim}$2000)에 대한 미래의 세 기간(2020s, 2050s, 2080s)으로 나누어 변화율을 분석한 결과 여름철 유출량과 겨울철 유출량이 증가될것으로 나타났으나 겨울철 유출량 전망은 여름철에 비해 불확실성이 큰 것으로 나타났다. 공간적으로는 한강유역이 위치한 북쪽유역이 남쪽에 비해 불확실성이 큰 것으로 나타났다. 결과적으로 유출의 시공간적 편차에 의해 우리나라 수자원은 홍수피해 증가가 예상되었으며, 월별유출량의 변화로 인해 용수확보와 관리에 어려움이 증가할 것으로 전망되었다.

  • PDF

미세먼지, 악취 농도 예측을 위한 앙상블 방법 (Ensemble Method for Predicting Particulate Matter and Odor Intensity)

  • 이종영;최명진;주영인;양재경
    • 산업경영시스템학회지
    • /
    • 제42권4호
    • /
    • pp.203-210
    • /
    • 2019
  • Recently, a number of researchers have produced research and reports in order to forecast more exactly air quality such as particulate matter and odor. However, such research mainly focuses on the atmospheric diffusion models that have been used for the air quality prediction in environmental engineering area. Even though it has various merits, it has some limitation in that it uses very limited spatial attributes such as geographical attributes. Thus, we propose the new approach to forecast an air quality using a deep learning based ensemble model combining temporal and spatial predictor. The temporal predictor employs the RNN LSTM and the spatial predictor is based on the geographically weighted regression model. The ensemble model also uses the RNN LSTM that combines two models with stacking structure. The ensemble model is capable of inferring the air quality of the areas without air quality monitoring station, and even forecasting future air quality. We installed the IoT sensors measuring PM2.5, PM10, H2S, NH3, VOC at the 8 stations in Jeonju in order to gather air quality data. The numerical results showed that our new model has very exact prediction capability with comparison to the real measured data. It implies that the spatial attributes should be considered to more exact air quality prediction.

Uncertainty investigation and mitigation in flood forecasting

  • Nguyen, Hoang-Minh;Bae, Deg-Hyo
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.155-155
    • /
    • 2018
  • Uncertainty in flood forecasting using a coupled meteorological and hydrological model is arisen from various sources, especially the uncertainty comes from the inaccuracy of Quantitative Precipitation Forecasts (QPFs). In order to improve the capability of flood forecast, the uncertainty estimation and mitigation are required to perform. This study is conducted to investigate and reduce such uncertainty. First, ensemble QPFs are generated by using Monte - Carlo simulation, then each ensemble member is forced as input for a hydrological model to obtain ensemble streamflow prediction. Likelihood measures are evaluated to identify feasible member. These members are retained to define upper and lower limits of the uncertainty interval and assess the uncertainty. To mitigate the uncertainty for very short lead time, a blending method, which merges the ensemble QPFs with radar-based rainfall prediction considering both qualitative and quantitative skills, is proposed. Finally, blending bias ratios, which are estimated from previous time step, are used to update the members over total lead time. The proposed method is verified for the two flood events in 2013 and 2016 in the Yeonguol and Soyang watersheds that are located in the Han River basin, South Korea. The uncertainty in flood forecasting using a coupled Local Data Assimilation and Prediction System (LDAPS) and Sejong University Rainfall - Runoff (SURR) model is investigated and then mitigated by blending the generated ensemble LDAPS members with radar-based rainfall prediction that uses McGill algorithm for precipitation nowcasting by Lagrangian extrapolation (MAPLE). The results show that the uncertainty of flood forecasting using the coupled model increases when the lead time is longer. The mitigation method indicates its effectiveness for mitigating the uncertainty with the increases of the percentage of feasible member (POFM) and the ratio of the number of observations that fall into the uncertainty interval (p-factor).

  • PDF

신용카드 불법현금융통 적발을 위한 축소된 앙상블 모형 (Illegal Cash Accommodation Detection Modeling Using Ensemble Size Reduction)

  • 이화경;한상범;지원철
    • 지능정보연구
    • /
    • 제16권1호
    • /
    • pp.93-116
    • /
    • 2010
  • 불법현금융통 적발모형 개발에 앙상블 접근방법을 사용하였다. 불법현금융통은 국내 신용카드사의 손익에 영향을 미치며 최근 국제화되고 있음에도 불구하고 학문적인 접근이 이루어지지 않았다. 부정행위 적발모형(Fraud Detection Model, FDM)은 데이터 불균형 문제로 인하여 좋은 성능을 얻기 어려운데, 다수의 모형을 결합하는 앙상블이 대안으로 제시되어 왔다. 앙상블에 포함된 모형들의 다양성이 보장된다면 단일모형에 비해 더 좋은 성능을 보인다는 점은 이미 인정되고 있으며, 최근 연구 결과는 학습된 모든 기본모형들을 사용하는 것보다 적절한 기본모형들만 선택하여 앙상블에 포함시키는 것이 바람직하다는 것이다. 본 논문에서는 효과적인 불법현금융통 적발을 위하여 축소된 앙상블 기법을 사용하는데, 정확성과 다양성 척도를 사용하여 앙상블에 참여할 기본모형을 선택하는 것이다. 다양성은 앙상블을 구성하는 기본모형들 사이의 불일치 (Disagreement or Ambiguity)를 의미하는데, FDM에 내재된 데이터 불균형문제를 고려하여 두 가지 측면에 중점을 두었다. 첫째, 학습 자료의 추출 과정에서 다양성을 확보하기 위한 소수 범주의 과잉추출 방법과 적절한 훈련 방법에 대해 설명하였다. 둘째, 소수범주에 초점을 맞추어 기존의 다양성 척도를 효과적인 척도로 변형시키고, 전진추가법과 후진소거법의 동적 다양성 계산법을 도입하여 앙상블에 참여할 기본모형을 평가하였다. 실험에 사용된 학습 알고리즘은 신경망, 의사결정수와 로짓 회귀분석이었으며, 동질적 앙상블과 이질적 앙상블을 구성하여 성능평가를 하였다. 실험결과 불법현금융통 적발모형에 있어 축소된 앙상블은 모든 기본모형이 포함된 앙상블과 성능 차이가 없었다. 축소된 앙상블은 앙상블 구성의 복잡성을 감소시키고 구현을 용이하게 한다는 점에서 FDM에서도 유력한 모형 수립 접근방법이 될 수 있음을 보였다.

외재적 변수를 이용한 딥러닝 예측 기반의 도시가스 인수량 예측 (Deep Learning Forecast model for City-Gas Acceptance Using Extranoues variable)

  • 김지현;김지은;박상준;박운학
    • 한국가스학회지
    • /
    • 제23권5호
    • /
    • pp.52-58
    • /
    • 2019
  • 본 연구에서는 국내 도시가스 인수량에 대한 예측 모델을 개발하였다. 국내의 도시가스 회사는 KOGAS에 차년도 수요를 예측하여 보고해야 하므로 도시가스 인수량 예측은 도시가스 회사에 중요한 사안이다. 도시가스 사용량에 영향을 미치는 요인은 용도구분에 따라 다소 상이하나, 인수량 데이터는 용도별 구분이 어렵기 때문에 특정 용도에 관계없이 영향을 주는 요인으로 외기온도를 고려하여 모델개발을 실시하였다.실험 및 검증은 JB주식회사의 2008년부터 2018년까지 총 11년 치 도시가스 인수량 데이터를 사용하였으며, 전통적인 시계열 분석 중 하나인 ARIMA(Auto-Regressive Integrated Moving Average)와 딥러닝 기법인 LSTM(Long Short-Term Memory)을 이용하여 각각 예측 모델을 구축하고 두 방법의 단점을 최소화하기 위하여 다양한 앙상블(Ensemble) 기법을 사용하였다. 본 연구에서 제안한 일별 예측의 오차율 절댓값 평균은 Ensemble LSTM 기준 0.48%, 월별 예측의 오차율 절댓값 평균은 2.46%, 1년 예측의 오차율 절댓값 평균은 5.24%임을 확인하였다.

기상청 기후예측시스템(GloSea)의 앙상블 확대를 통해 살펴본 신호대잡음의 역설적 특징(Signal-to-Noise Paradox)과 예측 스킬의 한계 (Characteristics of Signal-to-Noise Paradox and Limits of Potential Predictive Skill in the KMA's Climate Prediction System (GloSea) through Ensemble Expansion)

  • 현유경;박연희;이조한;지희숙;부경온
    • 대기
    • /
    • 제34권1호
    • /
    • pp.55-67
    • /
    • 2024
  • This paper aims to provide a detailed introduction to the concept of the Ratio of Predictable Component (RPC) and the Signal-to-Noise Paradox. Then, we derive insights from them by exploring the paradoxical features by conducting a seasonal and regional analysis through ensemble expansion in KMA's climate prediction system (GloSea). We also provide an explanation of the ensemble generation method, with a specific focus on stochastic physics. Through this study, we can provide the predictability limits of our forecasting system, and find way to enhance it. On a global scale, RPC reaches a value of 1 when the ensemble is expanded to a maximum of 56 members, underlining the significance of ensemble expansion in the climate prediction system. The feature indicating RPC paradoxically exceeding 1 becomes particularly evident in the winter North Atlantic and the summer North Pacific. In the Siberian Continent, predictability is notably low, persisting even as the ensemble size increases. This region, characterized by a low RPC, is considered challenging for making reliable predictions, highlighting the need for further improvement in the model and initialization processes related to land processes. In contrast, the tropical ocean demonstrates robust predictability while maintaining an RPC of 1. Through this study, we have brought to attention the limitations of potential predictability within the climate prediction system, emphasizing the necessity of leveraging predictable signals with high RPC values. We also underscore the importance of continuous efforts aimed at improving models and initializations to overcome these limitations.