• 제목/요약/키워드: 앙상블 방법

검색결과 293건 처리시간 0.047초

앙상블 학습과 온도 변수를 이용한 A 호텔의 전력소모량 예측 (Prediction of electricity consumption in A hotel using ensemble learning with temperature)

  • 김재휘;김재희
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.319-330
    • /
    • 2019
  • 과거의 전력소모량을 분석하여 미래의 전력소모량을 예측하는 것은 에너지 계획과 정책 결정에 있어 많은 이점을 가져다준다. 기계학습은 최근 전력소모량을 예측하는 분석 방법으로 많이 사용하고 있다. 그중 앙상블 학습은 모형의 과적합 현상을 방지하고 분산을 줄여 예측의 정확성을 높이는 방법으로 알려져 있다. 하지만 일별 데이터에 앙상블 학습을 적용했을 때 분석 방법의 특성으로 인해 피크를 잘 나타내지 못하고 중심값으로 예측하는 단점을 보였다. 본 연구에서는 앙상블 학습 전에 온도 변수와의 상관성을 고려하여 선형모형으로 적합함으로써 앙상블 학습의 단점을 보완한다. 그리고 9개의 모형을 비교한 결과 온도 변수를 선형모형으로 적합하고 랜덤포레스트를 사용한 모형이 결과가 가장 좋음을 보여준다.

자연어 추론에서의 교차 검증 앙상블 기법 (Cross-Validated Ensemble Methods in Natural Language Inference)

  • 양기수;황태선;오동석;박찬준;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-11
    • /
    • 2019
  • 앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

  • PDF

A Jittering-based Neural Network Ensemble Approach for Regionalized Low-flow Frequency Analysis

  • Ahn, Kuk-Hyun
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.382-382
    • /
    • 2020
  • 과거 많은 연구에서 다수의 모형의 결과를 이용한 앙상블 방법론은 인공지능 모형 (artificial neural network)의 예측 능력에 향상을 갖고 온다 논하였다. 본 연구에서는 미계측유역의 저수량(low flow)의 예측을 위하여 Jittering을 기반으로 한 인공지능 모형을 제시하고자 한다. 기본적인 방법론은 설명변수들에게 백색 잡음(white noise)를 삽입하여 훈련되는 자료를 증가시키는 것이다. Jittering을 기반으로 한 인공지능 모형에 대한 효과를 검증하기 위하여 본 연구에서는 Multi-output neural network model을 기반으로 모형을 구축하였다. 다음으로 Jittering을 기반으로 한 앙상블 모형을 variable importance measuring algorithm과 결합시켜서 유역특성치와 예측되는 저수량의 특성치들의 관계를 추론하였다. 본 연구에서 사용되는 방법론들의 효용성을 평가하기 위해서 미동북부에 위치하고 있는 총 207개의 유역을 사용하였다. 결과적으로 본 연구에서 제시한 Jittering을 기반으로 한 인공지능 앙상블 모형은 단일예측모형 (single modeling approach)을 정확도 측면에서 우수한 것으로 확인되었다. 또한, 적은 숫자의 앙상블 모형에서도 그 정확성이 단일예측모형보다 우수한 것을 확인하였다. 마지막으로 본 연구에서는 유역특성치들의 효과가 살펴보고자 하는 저수량의 특성치들에 따라서 일관적으로 영향을 미치거나 그 중요도가 변화하는 것을 확인하였다.

  • PDF

그래프 신경망에 대한 그래디언트 부스팅 기법 (A Gradient Boosting Method for Graph Neural Networks)

  • 장은조;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.574-576
    • /
    • 2022
  • 최근 여러 분야에서 그래프 신경망(graph neural network, GNN)이 활발히 연구되고 있다. 하지만 지금까지 대부분의 GNN 연구는 단일 GNN 모델의 성능을 향상하는 데 집중되었다. 본 논문에서는 앙상블(ensemble) 기법의 대표적 기법인 그래디언트 부스팅(gradient boosting)을 이용하여 GNN의 앙상블 모델을 만드는 방법을 제안한다. 제안 방법은 앞서 만들어진 GNN의 오차를 경사 하강법(gradient descent)을 이용하여 감소시키는 방향으로 다음 GNN을 생성한다. 이 과정을 반복하여 GNN의 최종 앙상블 모델을 얻는다. 실험에서 GNN의 대표적인 모델인 그래프 합성곱 신경망(graph convolutional network, GCN)에 제안 방법을 적용하여 앙상블 모델을 생성한 결과, 단일 GCN 모델에 비해 노드 분류 정확도가 11.3%p까지 증가하였음을 확인하였다.

네트웍 앙상블을 위한 관찰 학습 알고리즘 (Observational Learning Algorithm for Network Ensemble)

  • 장민;조성준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.336-338
    • /
    • 1999
  • 본 논문에서는 사회 학습의 이론의 하나인 관찰 학습 이론에 기반한 네트웍 앙상블을 위한 관찰 학습 알고리즘을 제안한다. 하나의 네트웍이 학습할 대 함께 학습되는 다른 네트웍들을 이용하여 가상 데이터를 생성하여 학습에 이용하므로써 데이터가 부족한 경우 네트웍이 과학습 되는 것을 방지고 각 네트웍의 일반화 성능을 향상시키는 동시에 앙상블의 성능도 향상시킨다. 제안된 방법을 사인 함수의 근사 문제와 중첩된 두 정규 분포의 분류 문제에 적용하고 단일 네트웍, 네트웍 위원회, Bagging 알고리즘과 비교하여 제안된 방법의 일반화 성능의 우수성을 보였다.

  • PDF

입력공간 분담에 의한 네트워크들의 앙상블 알고리즘 (Ensemble of Specialized Networks based on Input Space Partition)

  • 신현정;이형주;조성준
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2000년도 추계학술대회 및 정기총회
    • /
    • pp.33-36
    • /
    • 2000
  • 관찰학습(OLA: Observational Learning Algorithm)은 앙상블 네트워크의 각 구성 모델들이 다른 모델들을 관찰함으로써 얻어진 가상 데이터와 초기에 bo otstrap된 실제 데이터를 학습에 함께 이용하는 방법이다. 본 논문에서는, 초기 학습 데이터 셋을 분할하고 분할된 각 데이터 셋에 대하여 앙상블의 구성 모델들을 전문화(specialize)시키는 방법을 적용하여 기존의 관찰학습 알고리즘을 개선시켰다. 제안된 알고리즘은 bagging 및 boosting과의 비교실험에 의하여, 보다 적은 수의 구성 모델로 동일 내지 보다 나은 성능을 나타냄이 실험적으로 검증되었다.

  • PDF

전문화된 네트워크들의 결합에 의한 앙상블 학습 알고리즘 (Ensemble Learning Algorithm of Specialized Networks)

  • 신현정;이형주;조성준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.308-310
    • /
    • 2000
  • 관찰학습(OLA: Observational Learning Algorithm)은 앙상블 네트워크의 각 구성 모델들이 아른 모델들을 관찰함으로써 얻어진 가상 데이터와 초기에 bootstrap된 실제 데이터를 학습에 함께 이용하는 방법이다. 본 논문에서는, 초기 학습 데이터 셋을 분할하고 분할된 각 데이터 셋에 대하여 앙상블의 구성 모델들을 전문화(specialize)시키는 방법을 적용하여 기존의 관찰학습 알고리즘을 개선시켰다. 제안된 알고리즘은 bagging 및 boosting과의 비교 실험에 의하여, 보다 적은 수의 구성 모델로 동일 내지 보다 나은 성능을 나타냄이 실험적으로 검증되었다.

  • PDF

통합실시간 물관리 운영시스템을 위한 장기유량예측 (Long-term Streamflow Prediction for Integrated Real-time Water Management System)

  • 강부식;유승엽;고익환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.1450-1454
    • /
    • 2005
  • 수자원관리에 있어서 미래시구간에 대한 유량예측은 수자원시스템운영자에게 있어서 의사결정에 결정적인 영향을 미치는 가장 중요한 요소 중의 하나이다. 효율적 물배분이나 발전 등의 이수활동을 위해서 최소 월단위 이상의 장기유량예측이 필요하며, 이를 위해서는 강우예측이 선행되어야 하는데, 본 연구에서는 통합 실시간 물관리 운영시스템을 위한 중장기 유량예측을 목표로 방법론을 제시하고자 한다. 중장기 유량예측을 수행하는 대표적인 방법 중의 하나는 앙상블 유량예측(ESP; Ensemble Streamflow Prediction) 기법이다. ESP란 현재의 유역상태를 초기조건으로 사용하고 과거의 온도나 강수 등의 시계열앙상블을 모형입력으로 이용해서 강우-유출모형을 통하여 유출량을 예측하는 기법이다. ESP는 결국 현재의 유역상태와 유역에서의 과거강우관측기록, 미래강우예측에 대한 정보를 조합하여 그에 따른 유출앙상블을 생산해 내게 된다. 유출앙상블은 각 앙상블 트레이스가 갖게 되는 가중치에 따라 확률분포를 달리 갖게 되고 경우에 따라서는 유량으로부터 2차적으로 유도되는 변수들의 확률분포로 전이되기도 한다. 기존의 ESP 이론은 미국 NWS의 범주형 확률예보를 근간으로 하고 있어, 이를 국내 환경에 그대로 적용시키기에 어려움이 있어 왔다. 따라서 본 연구에서는 국내 기상청의 월간 강수전망을 이용하고, 이러한 정보의 특성에 맞는 ESP기법을 제시하였다. 더 나아가 중장기 수자원운영을 위한 일단위 월강수시나리오 구성을 위해서 수치예보와 월강수전망을 조합하여 ESP를 사용하는 기법을 제시하였다.

  • PDF

레이더 강우 오차특성 기반의 강우 앙상블 생성 (Ensemble Generation of Rainfall Based on the Error Characteristics of Radar Rainfall)

  • 강나래;주홍준;이명진;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.247-247
    • /
    • 2017
  • 수문분석이 있어 정확한 강우량 추정 및 강우 자료의 품질은 매우 중요한 요소이다. 유출분석의 기본 입력 자료인 만큼 홍수유출 결과에도 큰 영향을 미치게 되는데, 현재 하나의 확정적인 값으로 제공되는 레이더 강우 자료는 추정과정에서 많은 오차 및 불확실성을 포함하고 있다. 강우 자료의 불확실성은 기상현상의 예측능력 한계로 인한 것으로 관측지점에서의 발생 가능한 다양한 강우시나리오의 범위를 나타낸다. 본 연구에서는 임의의 값을 추정하는데 있어 하나의 값이 아닌 가능한 값들의 범위를 정의하거나 확률분포를 표현할 수 있는 확률론적인 방법을 이용하여 레이더 강우 앙상블을 생성하고자 하였다. 2012년 남강댐 유역에 발생한 태풍 '산바', '볼라벤'을 대상으로 자료간 오차 공분산을 고려하여 강우 앙상블을 생성하였으며, 레이더 강우에 내포된 불확실성 정도를 정량적으로 제시하였다. 생성된 강우 앙상블은 레이더 강우의 전체적인 편의보정뿐만 아니라 지상강우의 패턴을 잘 모의하고 있는 것으로 나타났으며, 레이더에 의해 추정한 강우의 불확실성을 잘 표현하고 있는 것으로 확인되었다. 강우 앙상블 생성 방법은 발생 가능한 다양한 강우 시나리오를 제공할 수 있으며 홍수예경보와 같은 의사 결정에 유용한 정보를 제공할 수 있을 것으로 판단된다.

  • PDF

레이더 강우 오차특성 기반의 강우 앙상블 생성 (Ensemble Generation of Rainfall Based on the Error Characteristics of Radar Rainfall)

  • 강나래;주홍준;이명진;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.2-2
    • /
    • 2017
  • 수문분석이 있어 정확한 강우량 추정 및 강우 자료의 품질은 매우 중요한 요소이다. 유출분석의 기본 입력 자료인 만큼 홍수유출 결과에도 큰 영향을 미치게 되는데, 현재 하나의 확정적인 값으로 제공되는 레이더 강우 자료는 추정과정에서 많은 오차 및 불확실성을 포함하고 있다. 강우 자료의 불확실성은 기상현상의 예측능력 한계로 인한 것으로 관측지점에서의 발생 가능한 다양한 강우시나리오의 범위를 나타낸다. 본 연구에서는 임의의 값을 추정하는데 있어 하나의 값이 아닌 가능한 값들의 범위를 정의하거나 확률분포를 표현할 수 있는 확률론적인 방법을 이용하여 레이더 강우 앙상블을 생성하고자 하였다. 2012년 남강댐 유역에 발생한 태풍 '산바', '볼라벤'을 대상으로 자료간 오차 공분산을 고려하 2012년 남강댐 유역에 발생한 태풍 '산바', '볼라벤'을 대상으로 자료간 오차 공분산을 고려하여 강우 앙상블을 생성하였으며, 레이더 강우에 내포된 불확실성 정도를 정량적으로 제시하였다. 생성된 강우 앙상블은 레이더 강우의 전체적인 편의보정뿐만 아니라 지상강우의 패턴을 잘 모의하고 있는 것으로 나타났으며, 레이더에 의해 추정한 강우의 불확실성을 잘 표현하고 있는 것으로 확인되었다. 강우 앙상블 생성 방법은 발생 가능한 다양한 강우 시나리오를 제공할 수 있으며 홍수예경보와 같은 의사 결정에 유용한 정보를 제공할 수 있을 것으로 판단된다.

  • PDF