• 제목/요약/키워드: 스태킹 기법

검색결과 19건 처리시간 0.023초

강건한 태양광 발전량 예측을 위한 2단계 신경망 최적화 (Two-Stage Neural Network Optimization for Robust Solar Photovoltaic Forecasting)

  • 오진영;소다영;문지훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.31-34
    • /
    • 2024
  • 태양광 에너지는 탄소 중립 이행을 위한 주요 방안으로 많은 주목을 받고 있다. 태양광 발전량은 여러 환경적 요인에 따라 크게 달라질 수 있으므로, 정확한 발전량 예측은 전력 네트워크의 안정성과 효율적인 에너지 관리에 근본적으로 중요하다. 대표적인 인공지능 기술인 신경망(Neural Network)은 불안정한 환경 변수와 복잡한 상호작용을 효과적으로 학습할 수 있어 태양광 발전량 예측에서 우수한 성능을 도출하였다. 하지만, 신경망은 모델의 구조나 초매개변수(Hyperparameter)를 최적화하는 것은 복잡하고 시간이 많이 드는 작업이므로, 에너지 분야에서 실제 산업 적용에 한계가 존재한다. 본 논문은 2단계 신경망 최적화를 통한 태양광 발전량 예측 기법을 제안한다. 먼저, 태양광 발전량 데이터 셋을 훈련 집합과 평가 집합으로 분할한다. 훈련 집합에서, 각기 다른 은닉층의 개수로 구성된 여러 신경망 모델을 구성하고, 모델별로 Optuna를 적용하여 최적의 초매개변숫값을 선정한다. 다음으로, 은닉층별 최적화된 신경망 모델을 이용해 훈련과 평가 집합에서는 각각 5겹 교차검증을 적용한 발전량 추정값과 예측값을 출력한다. 마지막으로, 스태킹 앙상블 방식을 채택해 기본 초매개변숫값으로 설정해도 우수한 성능을 도출하는 랜덤 포레스트를 이용하여 추정값을 학습하고, 평가 집합의 예측값을 입력으로 받아 최종 태양광 발전량을 예측한다. 인천 지역으로 실험한 결과, 제안한 방식은 모델링이 간편할 뿐만 아니라 여러 신경망 모델보다 우수한 예측 성능을 도출하였으며, 이를 바탕으로 국내 에너지 산업에 이바지할 수 있을 것으로 기대한다.

  • PDF

위성 자료와 수치모델 자료를 활용한 스태킹 앙상블 기반 SO2 지상농도 추정 (Monitoring Ground-level SO2 Concentrations Based on a Stacking Ensemble Approach Using Satellite Data and Numerical Models)

  • 최현영;강유진;임정호;신민소;박서희;김상민
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1053-1066
    • /
    • 2020
  • 이산화황(SO2)은 대기 중 화학 반응을 통해 2차 대기오염물질을 생성하는 전구체로, 주로 산업활동이나 주거 및 교통 활동 등을 통해 배출된다. 장기간 노출 시 호흡기 질환이나 심혈관 질환 등을 유발하여 인체 건강에 부정적인 영향을 미칠 수 있기 때문에 이에 대한 지속적인 모니터링이 필요하다. 우리나라에서는 SO2에 대해 관측소 기반의 모니터링이 수행되고 있으나 이는 공간적으로 연속적인 정보를 제공하는 데에 한계가 있다. 따라서, 본 연구에서는 위성자료와 수치모델 자료를 융합하여 일별 13시를 타겟으로 하는 1 km의 고해상도로 공간적으로 연속적인 SO2 지상농도를 산출하였다. 2015년 1월부터 2019년 4월까지의 기간 동안 남한 지역에 대하여 스태킹 앙상블 기법을 이용하여 SO2 지상농도 추정 모델을 개발하였다. 스태킹 앙상블 기법이란 여러가지 기계학습 기법을 두 단계로 쌓는 방식으로 융합하여 단일 모델 대비 더 향상된 성능을 도출하는 방법이다. 본 연구에서는 베이스 모델로는 RF (Random Forest)와 XGB (eXtreme Gradient BOOSTing) 기법이, 메타 모델로는 MLR (Multiple Linear Regression) 기법이 사용되었다. 구축된 모델의 교차검증 결과 메타 모델은 상관계수(R) = 0.69와 root-mean-squared-error(RMSE) = 0.0032 ppm의 결과를 보였으며 이는 베이스 모델의 평균 대비 약 25% 향상된 안정성을 보였다. 또한 모델 구축에 사용되지 않은 기간에 대한 예측 검증을 수행하여 모델의 일반화 가능성을 평가하였다. 구축된 모델을 이용하여 남한 지역의 SO2 지상농도 공간분포를 분석한 결과 일반적인 계절성과 배출원의 변화를 잘 반영하는 패턴을 보임을 확인하였다.

쉴드 TBM 기계 데이터 및 머신러닝 기법을 이용한 암석의 일축압축강도 예측 (Prediction of Uniaxial Compressive Strength of Rock using Shield TBM Machine Data and Machine Learning Technique)

  • 김태환;고태영;박양수;김택곤;이대혁
    • 터널과지하공간
    • /
    • 제30권3호
    • /
    • pp.214-225
    • /
    • 2020
  • 쉴드 TBM(Tunnel Boring Machine) 터널 굴착 시 암반의 상태는 굴진 성능을 결정하는 중요한 요소 중 하나이다. 암석 강도는 지반조사 시 실내시험을 통해 얻을 수 있으나, 전체 TBM 굴진 구간에 대해 모두 알 수 없다. TBM 굴진 시 최적 Operation Parameter를 적용하기 위해서는 굴진 속도에 영향을 미치는 암석 강도를 파악하는 것이 매우 중요하다. 이에 본 연구에서는 TBM 굴착 중 생성되는 기계 데이터와 머신러닝(Machine Learning) 기법을 활용하여 암석 강도를 예측하고자 한다. 암석 강도를 예측하기 위해 여러 머신러닝 기법을 사용하여 비교하였고, 가장 예측 성능이 좋은 스태킹 모델을 최종 모델로 선택하였다. 암반 구간 Slurry 쉴드 TBM 굴진 사례에서 지반조사 및 시공 중 조사한 암석 강도와 강도를 획득한 위치에서의 TBM 굴착 데이터를 사용하였다. TBM 굴착 데이터는 Training과 Test용으로 8:2로 분할하였으며, 변수 선택(feature selection), 표준화(scaling), 이상치(outlier) 제거 등 전처리 과정을 수행하였다. 하이퍼파라미터 튜닝까지 마친 후, 스태킹 모델에 대해 평균 제곱근 오차(Root Mean Square Error, RMSE)와 결정 계수(R2)로 모델을 평가한 결과 각각 5.556과 0.943로 나타났으며, TBM 굴착 데이터로 암석 강도를 예측하는 모델로 유용할 것으로 판단된다.

형상 최적화를 통한 축류송풍기의 설계 (Design of An Axial Flow Fan with Shape Optimization)

  • 서성진;최승만;김광용
    • 대한기계학회논문집B
    • /
    • 제30권7호
    • /
    • pp.603-611
    • /
    • 2006
  • This paper presents the response surface optimization method using three-dimensional Wavier-Stokes analysis to optimize the blade shape of an axial flow fan. Reynolds-averaged Wavier-Stokes equations with $k-{\epsilon}$ turbulence model are discretized with finite volume approximations using the unstructured grid. Regression analysis is used for generating response surface, and it is validated by ANOVA and t-statistics. Four geometric variables, i.e., sweep and lean angles at mean and tip respectively were employed to improve the efficiency. The computational results are compared with experimental data and the comparisons show generally good agreements. As a main result of the optimization, the total efficiency was successfully improved. Also, detailed effects of sweep and lean on the axial flow fan are discussed.

설계유량을 고려한 천음속 축류압축기 동익의 삼차원 형상최적설계 (Aerodynamic Design Optimization of A Transonic Axial Compressor Rotor with Readjustment of A Design Point)

  • 고우식;김광용;고성호
    • 유체기계공업학회:학술대회논문집
    • /
    • 유체기계공업학회 2003년도 유체기계 연구개발 발표회 논문집
    • /
    • pp.639-645
    • /
    • 2003
  • Design optimization of a transonic compressor rotor (NASA rotor 37) using response surface method and three-dimensional Navier-Stokes analysis has been carried out in this work. Baldwin-Lomax turbulence model was used in the flow analysis. Two design variables were selected to optimize the stacking line of the blade, and mass flow was used as a design variable, as well, to obtain new design point at peak efficiency. Data points for response evaluations were selected by D-optimal design, and linear programming method was used for the optimization on the response surface. As a main result of the optimization, adiabatic efficiency was successfully improved, and new design mass flow that is appropriate to an improved blade was obtained. Also, it is found that the design process provides reliable design of a turbomachinery blade with reasonable computing time.

  • PDF

환자 IQR 이상치와 상관계수 기반의 머신러닝 모델을 이용한 당뇨병 예측 메커니즘 (Diabetes prediction mechanism using machine learning model based on patient IQR outlier and correlation coefficient)

  • 정주호;이나은;김수민;서가은;오하영
    • 한국정보통신학회논문지
    • /
    • 제25권10호
    • /
    • pp.1296-1301
    • /
    • 2021
  • 최근 전 세계적으로 당뇨병 유발률이 증가함에 따라 다양한 머신러닝과 딥러닝 기술을 통해 당뇨병을 예측하려고 는 연구가 이어지고 있다. 본 연구에서는 독일의 Frankfurt Hospital 데이터로 머신러닝 기법을 활용하여 당뇨병을 예측하는 모델을 제시한다. IQR(Interquartile Range) 기법을 이용한 이상치 처리와 피어슨 상관관계 분석을 적용하고 Decision Tree, Random Forest, Knn, SVM, 앙상블 기법인 XGBoost, Voting, Stacking로 모델별 당뇨병 예측 성능을 비교한다. 연구를 진행한 결과 Stacking ensemble 기법의 정확도가 98.75%로 가장 뛰어난 성능을 보였다. 따라서 해당 모델을 이용하여 현대 사회에 만연한 당뇨병을 정확히 예측하고 예방할 수 있다는 점에서 본 연구는 의의가 있다.

이기종 머신러닝 모델 기반 치매예측 모델 (Dementia Prediction Model based on Gradient Boosting)

  • 이태인;오하영
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1729-1738
    • /
    • 2021
  • 머신러닝은 인지심리, 뇌과학과 긴밀한 관계를 유지하며 함께 발전하고 있다. 본 논문은 OASIS-3 dataset을 머신러닝 기법을 이용하여 분석하고, 이를 통해 치매를 예측하는 모델을 제안한다. OASIS-3 데이터 중 각 영역의 부피를 수치화한 데이터들에 대해 PCA(Principal component analysis) 를 통한 차원 축소를 실행한 뒤, 중요한 요소(특징)들만 추출 후 이에 대해 그래디언트 부스팅, 스태킹을 포함한 다양한 머신러닝 모델들을 적용, 각각의 성능을 비교한다. 제안하는 기법은 기존 연구들과 달리 뇌 생체 데이터들은 물론 참가자의 성별 등의 기본 정보 데이터, 참여자의 의료 정보 데이터를 사용했기에 차별성이 크다. 또한, 다양한 성능평가를 통해 제안하는 기법이 다양한 수치 데이터 중 치매와 더 많은 관련성을 보이는 특징들을 찾아내어 치매를 더 잘 예측할 수 있는 모델임을 보였다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

ALOS-2 PALSAR-2 Spotlight 영상의 위성레이더 간섭기법을 활용한 킬라우에아 화산의 정밀 2차원 지표변위 매핑 (Mapping Precise Two-dimensional Surface Deformation on Kilauea Volcano, Hawaii using ALOS2 PALSAR2 Spotlight SAR Interferometry)

  • 홍성재;백원경;정형섭
    • 대한원격탐사학회지
    • /
    • 제35권6_3호
    • /
    • pp.1235-1249
    • /
    • 2019
  • 킬라우에아 화산은 지속적인 활동을 하고 있는 화산이다. 본 연구에서는 ALOS-2 PALSAR-2 위성영상을 이용해 2015년부터 2017년까지 킬라우에아 화산의 정상부근에서 발생한 지표변위를 관측했다. 지표변위의 2차원 관측을 위해 2개의 간섭쌍을 이용해 위성레이더 간섭기법과 다중개구간섭기법을 수행했다. 그리고 2차원 관측의 정밀도를 높이기 위해 다중개구간섭기법의 관측 성능에 영향을 줄 수 있는 요소인 유효 안테나 길이와 정규화된 스퀸트 값을 변경해가며 관측치 차이의 평균제곱근편차 값을 비교했다. 그리고 가장 정밀하게 변위를 관측할 수 있는 요소 값을 선정했다. 유효 안테나 길이와 정규화된 스퀸트 값을 최적의 값으로 선정한 후의 다중개구간섭기법 관측치의 평균제곱근편차 값은 4.07 cm에서 2.05 cm로 감소했다. 각 간섭영상에서 관측된 관측방향의 최대 변위는 각각 -28.6 cm, -27.3 cm이고, 비행방향의 최대 변위는 20.2 cm, 20.8 cm, 비행방향의 반대 방향으로는 -24.9 cm, -24.3 cm가 관측되었다. 두 간섭영상을 스태킹한 후 2차원 지표변위 매핑을 수행한 결과 북서 방향으로 최대 약 30.4 cm의 지표 변위가 관측되었다. 그리고 모든 방향으로 20 cm 이상의 큰 변위가 관측되었다. 관측 결과를 통해 킬라우에아 화산의 분화활동 위험성이 증가하고 있는 것을 알 수 있었다. 본 연구의 2015년부터 2017년까지의 킬라우에아 화산의 지표 변위 관측 결과는 향후 킬라우에아 화산의 분화 활동에 관한 연구에 도움을 줄 수 있을 것으로 기대된다.