• 제목/요약/키워드: ensemble prediction

검색결과 376건 처리시간 0.024초

Design and evaluation of artificial intelligence models for abnormal data detection and prediction

  • Hae-Jong Joo;Ho-Bin Song
    • Journal of Platform Technology
    • /
    • 제11권6호
    • /
    • pp.3-12
    • /
    • 2023
  • In today's system operation, it is difficult to detect failures and take immediate action in the case of a shortage of manpower compared to the number of equipment or failures in vulnerable time zones, which can lead to delays in failure recovery. In addition, various algorithms exist to detect abnormal symptom data, and it is important to select an appropriate algorithm for each problem. In this paper, an ensemble-based isolation forest model was used to efficiently detect multivariate point anomalies that deviated from the mean distribution in the data set generated to predict system failure and minimize service interruption. And since significant changes in memory space usage are observed together with changes in CPU usage, the problem is solved by using LSTM-Auto Encoder for a collective anomaly in which another feature exhibits an abnormal pattern according to a change in one by comparing two or more features. did In addition, evaluation indicators are set for the performance evaluation of the model presented in this study, and then AI model evaluation is performed.

  • PDF

베이지안 기법 기반의 댐 예측유입량 산정기법 개발 및 평가 (Development and evaluation of dam inflow prediction method based on Bayesian method)

  • 김선호;소재민;강신욱;배덕효
    • 한국수자원학회논문집
    • /
    • 제50권7호
    • /
    • pp.489-502
    • /
    • 2017
  • 본 연구에서는 충주댐 유역에 대해 다목적 댐 예측유입량 산정기법 BAYES-ESP를 개발하고 평가하였다. BAYES-ESP 기법은 기존 ESP (Ensemble Streamflow Prediction) 기법에 베이지안 이론을 적용하여 개발하였으며, 수문모델은 ABCD를 활용하였다. 입력자료는 기온, 강수량 자료와 댐 관측유입량 자료를 활용하였으며, 기온 및 강수량은 기상청, 국토교통부, 한국수자원공사의 지점관측자료, 댐 관측유입량은 한국수자원공사의 자료를 이용하였다. 적용성 평가방법은 시계열 분석과 Skill Score를 활용하였으며, 평가기간은 1986~2015년이다. 시계열 분석 결과 ESP 댐 예측유입량(ESP)는 매년 전망값의 큰 차이가 없었으며, 다우년 및 과우년의 예측성이 떨어지는 것으로 나타났다. BAYES-ESP 댐 예측유입량(BAYES-ESP)는 ESP가 관측유입량에 비해 과소모의하는 경향을 보정하였으며, 특히 다우년에 개선효과가 있는 것으로 나타났다. 월별 평균 댐 관측유입량과의 Skill Score 비교분석결과 ESP는 1~3월에 SS가 비교적 높은 값을 보였으며, 나머지 월에는 음의 값을 나타내었다. BAYES-ESP는 ESP와 관측 값 간의 선형적 관계를 갖는 1~3월에 ESP의 정확도를 향상시키는 것으로 나타났다. ESP 기법은 국내 강수특성상 우리나라에 적용하기에는 한계가 있었으며, 이를 개선한 BAYES-ESP 기법은 댐 유입량 예측연구에 가치가 있다고 판단된다.

FR과 LR 앙상블 모형을 이용한 산사태 취약성 지도 제작 및 검증 (Landslide Susceptibility Mapping Using Ensemble FR and LR models at the Inje Area, Korea)

  • 김진수;박소영
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.19-27
    • /
    • 2017
  • 본 연구의 목적은 인제읍을 대상으로 빈도비와 로지스틱 회귀분석 모델을 통합한 앙상블 모델을 이용하여 산사태 취약성을 분석하고, 예측 정확도를 비교하는 것이다. 산사태 위치는 산사태 발생 전 후에 촬영된 항공사진을 이용하여 추출되었다. 추출된 총 422개의 산사태는 산사태 취약성 분석을 위해 훈련용 (70%)과 검증용 (30%) 자료로 랜덤하게 분류되었다. 산사태 관련인자는 고도, 경사도, 경사향, 배수로부터의 거리, 토양수분지수, 하천강도지수, 토질, 유효토심, 영급, 경급, 밀도, 임상 등 총 12개의 인자를 이용하였다. 산사태 및 산사태 관련인자는 공간데이터베이스로 구축된 뒤 빈도비와 앙상블 모델을 이용하여 산사태와 산사태 관련 인자 간 상관관계를 분석하였다. 그 결과를 바탕으로 각 모델별 산사태 취약성 지도를 작성하였고, relative operating characteristics(ROC) 곡선을 이용하여 예측 정확도를 검증 및 비교하였다. 분석 결과, 앙상블 모델에 의해 작성된 산사태 취약성 지도는 75.2%의 예측 정확도를 보였고, 이 결과는 빈도비 모델에 의해 작성된 산사태 취약성 지도와 비교하여 예측 정확도가 약 2% 향상된 것으로 나타났다. 본 연구에서 작성된 산사태 취약성 지도는 향후 효과적인 토지이용 계획을 수립하고, 재난재해로 인한 피해를 경감시키는데 활용 가능할 것으로 판단된다.

확률론적 중장기 댐 유입량 예측 (II) 앙상블 댐 유입량 예측을 위한 GDAPS 활용 (Probabilistic Medium- and Long-Term Reservoir Inflow Forecasts (II) Use of GDAPS for Ensemble Reservoir Inflow Forecasts)

  • 김진훈;배덕효
    • 한국수자원학회논문집
    • /
    • 제39권3호
    • /
    • pp.275-288
    • /
    • 2006
  • 본 연구에서는 GDAPS(T213) 중기 기상 수치예보 자료를 활용한 ESP (Ensemble Streamflow Prediction) 기법을 개발하여 미래에 발생할 수 있는 댐 유입량의 중장기적 확률예측을 위해 초과 확률구간별 댐 유입량을 예측하고 RPSS 검증기법으로 예측결과의 정확도를 분석하였다. 개발된 ESP시스템을 적용한 결과 일단위 개념의 확률예보는 높은 불확실성을 내포할 수 있고, 중장기 확률예보에 초점을 맞추어 1, 3, 7일 등의 예측시간 해상도에 대한 ESP정확도의 민감도를 분석한 결과 예측시간 해상도 간격이 증가할수록 예측결과의 불확실성이 감소하면서 그 정확도가 전반적으로 증가함을 살펴볼 수 있었다. 이러한 결과를 바탕으로 GDAPS 자료를 활용한 1주 단위의 한달(28일)예보를 수행한 ESP 결과는 각 초과 확률구간 분포의 적절한 증가 및 감소로 인하여 그 시간적 변동성이 안정적으로 예측되고 예측결과의 불확실성을 감소시킬 수 있어 그 활용가치가 높은 것으로 나타났다. 이러한 관점에서 본 연구의 ESP 시스템은 중장기적 측면에서 GDAPS 자료의 활용가치를 높일 수 있고, 기존 ESP 결과보다 향상된 정확도로 댐 유입량을 예측할 수 있으므로 실시간 댐 유입량 예측에 적용한다면 수자원 관리 차원에서 유용한 수단이 될 수 있을 것이다.

앙상블 기상예측 자료를 활용한 도시지역의 홍수위험도 예측 방안에 관한 연구 (Research on flood risk forecast method using weather ensemble prediction system in urban region)

  • 최영제;이재응
    • 한국수자원학회논문집
    • /
    • 제52권10호
    • /
    • pp.753-761
    • /
    • 2019
  • 여름철 집중호우는 도시지역의 홍수피해를 발생시키는 주요한 원인 중 하나이다. 우리나라의 최근 재해통계에 따르면 도시홍수의 발생빈도는 점점 잦아지고 있으며, 그 규모 또한 커지고 있다. 하지만 국지성 집중호우는 예측이 어려워 실제 홍수 대응을 담당하는 지자체 공무원들의 업무에 어려움이 있다. 따라서 본 연구에서는 이러한 도시홍수 대응에 시간적 여유 확보를 통한 피해 저감을 위해 앙상블 기상예측 자료를 활용한 홍수위험 매트릭스를 구축하고, 그 적용성을 판단하고자 하였다. 홍수위험 매트릭스는 홍수위험도의 정도를 나타내는 잠재적 영향(X축), 위험 기상현상이 발생할 확률인 발생가능성(Y축)으로 구성된 2차원 매트릭스로 확률예보에 기반한 홍수위험 예측 방안이다. 이를 위해 부산 및 대구광역시 내 기초지자체 각각 1곳을 대상으로 과거 홍수피해기록과 확률강우량 자료를 활용하여 지역별 홍수위험 매트릭스를 구축하고, 과거 호우사상에 대해 기상청의 LENS 자료를 적용하여 그 적용성을 판단하였다. 그 결과 최대 3일전 홍수위험에 대한 예측이 가능한 것으로 분석되었으며 실제 활용 시 홍수 대응시간을 확보하여 피해 저감에 도움이 되리라 판단된다.

앙상블 기반의 악취 농도 다지역 통합 예측 모델 개발 (Development of an Ensemble-Based Multi-Region Integrated Odor Concentration Prediction Model)

  • 조성주;최우석;최상현
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.383-400
    • /
    • 2023
  • 전 세계적으로 대기오염 관련 질병 발병률이 상승하고, 2022년 세계보건기구의 보고에 따르면 매년 약 700만 명의 사망자가 발생하고 있다. 또한, 산업 시설 확장과 다양한 배출원 증가, 그리고 악취 물질의 무분별한 방출로 인해 대기오염 문제는 사회적으로 중요성을 띄고 있다. 한국에서도 악취를 독립적인 환경오염으로 정의하며, 지역 주민의 건강에 직접적인 영향을 미치는 문제로 간주하고 있으나 현재까지 악취 관리가 미흡하며 악취 관리 시스템의 개선이 필요하다. 본 연구에서는 악취 관리 시스템 개선을 목표로 충청북도 오창에 설치된 악취 센서에서 수집한 1,010,749개 데이터를 활용하여 앙상블 기반의 악취 농도 다지역 통합 예측 모델을 설계하고 분석하였다. 연구 결과, XGBoost 알고리즘을 사용한 모델의 RMSE가 0.0096로 가장 성능이 좋았으며, 단일 지역 모델(0.0146)과 비교하여 평균 오차 크기가 51.9% 낮았다. 이를 통해 서로 다른 지역에서 수집된 악취 농도 데이터를 표준화한 후 다지역 통합 예측 모델을 설계함으로써 데이터의 양을 늘리고 정확도를 높일 수 있으며 또한, 하나의 통합 모델로 다양한 지역에서 예측이 가능함을 확인하였다.

용수공급을 위한 댐 방류량 결정에서의 앙상블 유량 예측 효과 분석 (Analysis of ensemble streamflow prediction effect on deriving dam releases for water supply)

  • 김연주;김기주;김영오
    • 한국수자원학회논문집
    • /
    • 제56권12호
    • /
    • pp.969-980
    • /
    • 2023
  • 2000년대 이후 우리나라에 도입된 앙상블 유량 예측은 수문 예측 현업에서 성과를 보였음에도 불구하고 수자원 시스템 관리에서는 적극적으로 활용되지 못하고 있다. 따라서 본 연구에서는 용수공급을 위한 수자원 관리 측면에서 앙상블 유량 예측의 효용성을 보이고자 댐 실무자들을 위한 간단한 가상 예제를 만들고, 이를 확장하며 실제 대한민국 다목적댐에 적용하였다. 가상 예제에서는 앙상블 유량 예측의 평균은 같지만 표준편차가 다를 때, 댐 운영 비용이 상이함을 확인하였다. 그리고 이를 대한민국 다목적댐에 적용하기 위해 동일한 평균을 가지지만 표준편차가 평균과 동일한 유형W와 표준편차가 평균의 10배인 유형 P를 가정하여 용량 대비 연유입량 비율에 따라 소양강댐(CIR = 1.345)과 충주댐(CIR = 0.563)에 표본 추계학적 동적계획법으로 최적방류량을 도출하였다. 그리고 도출된 최적방류량으로 2020년부 2022년까지 모의 운영을 진행하였다. 그 결과, 충주댐에서는 표준편차가 적은 유형W에서 상대적으로 공격적인 최적방류량이 도출되었고, 모의 운영 결과 또한 양호함을 보였다. 소양강댐에서도 최적방류량에서 충주댐과 같은 결과를 보였지만, 모의 운영에서는 유형W와 P의 차이가 없었다. 결과적으로 동일한 평균을 가지더라도 앙상블 유량 예측의 표준편차에 따라 다른 최적방류량과 모의 운영 결과가 도출되었고, 특히 용량 대비 연유입량이 작을수록 이러한 불확실성에 더욱 민감하게 반응함을 보였다. 본 내용을 바탕으로 현재 단일 대푯값만을 사용하여 댐 운영을 하는 수자원 관리에 개선을 기대한다.

단백질의 세포내 소 기관별 분포 예측을 위한 서열 기반의 특징 추출 방법 (Sequence driven features for prediction of subcellular localization of proteins)

  • 김종경;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.226-228
    • /
    • 2005
  • Predicting the cellular location of an unknown protein gives valuable information for inferring the possible function of the protein. For more accurate Prediction system, we need a good feature extraction method that transforms the raw sequence data into the numerical feature vector, minimizing information loss. In this paper we propose new methods of extracting underlying features only from the sequence data by computing pairwise sequence alignment scores. In addition, we use composition based features to improve prediction accuracy. To construct an SVM ensemble from separately trained SVM classifiers, we propose specificity based weighted majority voting . The overall prediction accuracy evaluated by the 5-fold cross-validation reached $88.53\%$ for the eukaryotic animal data set. By comparing the prediction accuracy of various feature extraction methods, we could get the biological insight on the location of targeting information. Our numerical experiments confirm that our new feature extraction methods are very useful forpredicting subcellular localization of proteins.

  • PDF

LSTM과 EEMD 기반의 미세먼지 농도 예측 모델 성능 비교 (Comparison of Performance of LSTM and EEMD based PM10 Prediction Model)

  • 정용진;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.510-512
    • /
    • 2022
  • 미세먼지 예측 정확도 향상을 위해 다양한 연구가 진행되고 있다. 그러나 미세먼지 농도가 가지는 다양한 특성에 따라 예측 모델의 학습이 잘 이루이지지 않는 문제가 있다. 본 논문에서는 시계열의 특성과 불규칙적인 특성을 가지는 미세먼지 농도의 학습 및 예측을 위해 LSTM과 EEMD 기반의 미세먼지 농도 예측 모델의 성능을 비교하고자 한다. 두 모델을 통해 시계열 특성 파악 방법과 독립적인 개별 특성 파악 방법의 성능 차이를 확인한 결과, 개별 특성 파악에 강점을 가지는 EEMD 예측 모델이 LSTM 기반의 예측 모델보다 좋은 성능을 보이는 것을 확인하였다.

  • PDF

EEMD 기반의 미세먼지 농도 예측 모델 (Particular Matter Concentration Prediction Models Based on EEMD)

  • 정용진;이종성;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.345-347
    • /
    • 2021
  • 미세먼지 에측의 정확도 향상을 위해 다양한 연구가 이루어지고 있으나 미세먼지 농도에 따른 다양한 특성으로 인해 딥러닝 모델의 학습이 잘 이루이지지 않는 문제가 있다. 본 논문에서는 미세먼지 농도의 특성을 분해하여 특성을 반영하기 위한 EEMD 기반의 미세먼지 농도 예측 모델을 제안한다. 미세먼지 농도를 EEMD를 통해 분해 후, 각각 도출된 특성에 따른 예측 결과를 앙상블하여 최종 미세먼지 농도 값을 도출한다. 모델의 성능 평가 결과, 91.7%의 미세먼지 농도 예측 정확도를 확인하였다.

  • PDF