• 제목/요약/키워드: 앙상블 학습 기법

검색결과 95건 처리시간 0.021초

효율적 수입식품 검사를 위한 머신러닝 기반 부적합 건강기능식품 탐지 방법 (A Method of Machine Learning-based Defective Health Functional Food Detection System for Efficient Inspection of Imported Food)

  • 이경수;박예린;신윤종;손권상;권오병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.139-159
    • /
    • 2022
  • 코로나19 이후 건강기능식품의 관심이 높아짐에 따라 수입 식품 안전성 검사의 중요성도 더욱 커지고 있다. 그러나 매년 증가하는 건강기능식품 수입량과 반대로 식품 검사에 필요한 예산과 인력은 한계점에 다다르고 있다. 따라서 본 연구의 목적은 수출입 식품 중 건강기능식품을 대상으로 데이터의 특성을 살펴보고, 판별의 정확성과 결과의 설명 가능성을 고려하여 효율적으로 부적합 식품을 탐지할 수 있는 기계학습 모델 기반 자동화 시스템 설계 방안을 제시하는 것이다. 이를 위해 첫째, 부적합 판정에 영향을 미치는 식품 검사 데이터로부터 부적합 판정에 유의한 파생변수를 생성하며, 둘째, 건강기능식품 수출입 검사 데이터에 대한 탐색적 분석을 통해 클래스 불균형과 비선형성 등을 고려하여 영향변수를 선정하며, 셋째, 다양한 머신러닝 기법을 적용하여 모델 별 성능과 해석가능성에 대해 비교를 수행하고자 한다. 성능 분석 결과, 앙상블 모델이 가장 우수하였으며, 본 연구에서 제안하는 파생변수 및 모델이 수출입 식품 검사에서 활용하고 있는 시스템에 도움이 될 수 있음을 확인하였다.

신재생 에너지 최적 활용을 위한 축열조 온도 예측 모델 연구 (A Study on the Thermal Prediction Model cf the Heat Storage Tank for the Optimal Use of Renewable Energy)

  • 오한별;장경민;오지영;이명배;박장우;조용윤;신창선
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.63-70
    • /
    • 2023
  • 최근 스마트팜 에너지 비용 중 35% 낸난방비 에너지 소비가 증가되어 에너지 소비 효율화가 요구되며, 전기료 현실화에 대한 우려로 신재생 에너지 중요성이 증가하고 있다. 신재생 에너지는 수력, 풍력, 태양광 등에 속하며, 이중 태양광 에너지는 전기에너지로 변환하는 발전기술로, 이 기술은 에너지원이 환경에 미치는 영향이 적고, 유지 보수가 간편하다는 특징을 갖고 있다. 본 연구에서는 온실 축열조, 히트펌프 데이터 기반으로 축열조 영향을 많이 미치는 요소를 선정하고 축열조 공급 온도예측 모델을 개발하고자 한다. 시계열 데이터 분석 및 예측에 효과적인 LSTM(Long Short-Term Memory)과 다른 앙상블 학습 기법보다 뛰어난 XGBoost 모델을 이용하여 예측한다. 히트펌프 축열조 온도를 예측함으로써 에너지 소비를 최적화하여 시스템 운영을 최적화할 수 있다. 또한, 태양광 활용에 따른 냉난방비 절감 및 농가의 에너지 자립도 개선 등 스마트팜 에너지 통합 운영 시스템에 연계하고자 한다. 플랫폼을 통해 폐열 에너지의 공급을 관리하고 최대 난방부하 및 계절, 시간별 작물생장에 필요한 에너지값을 도출하여 이를 기반으로 최적 에너지 운용방안을 도출하고자 한다.

초 장단기 통합 태양광 발전량 예측 기법 (Very Short- and Long-Term Prediction Method for Solar Power)

  • 윤문섭;임세령;장한승
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1143-1150
    • /
    • 2023
  • 세계적 기후 위기와 저탄소 정책 이행으로 신재생 에너지에 관한 관심이 높아지고 이와 관련된 산업이 증가하고 있다. 이 중에서 태양 에너지는 고갈되지 않고 오염 물질이나 온실가스를 배출하지 않는 대표적인 친환경 에너지로 주목받고 있으며, 이에 따라 세계적으로 태양광 발전 시설 보급이 증가하고 있다. 하지만 태양광 발전은 지리, 날씨와 같은 환경의 영향을 받기 쉬우므로 안정적인 운영과 효율적인 관리를 위해 정확한 발전량 예측이 중요하다. 하지만 변동성이 큰 태양광 발전을 수학적 통계 기술로 정확한 발전량을 예측하는 것은 불가능하다. 이를 위해서 정확하고 효과적인 예측을 위해 딥러닝 기반의 기술에 관한 연구는 필수적이다. 또한, 기존의 딥러닝을 활용한 예측 방식은 장, 단기적인 예측을 나누어 수행하기 때문에 각각의 예측 결과를 얻기 위한 시간이 길어진다는 단점이 있다. 따라서, 본 연구에서는 시계열 특성을 가진 태양광 발전량 데이터를 사용하여 장단기 통합 예측을 수행하기 위해 순환 신경망의 다대다 구조를 활용한다. 그리고 이를 다양한 딥러닝 모델들에 적용하여 학습을 수행하고 각 모델의 결과를 비교·분석한다.

부스팅 기반 기계학습기법을 이용한 지상 미세먼지 농도 산출 (Estimation of Ground-level PM10 and PM2.5 Concentrations Using Boosting-based Machine Learning from Satellite and Numerical Weather Prediction Data)

  • 박서희;김미애;임정호
    • 대한원격탐사학회지
    • /
    • 제37권2호
    • /
    • pp.321-335
    • /
    • 2021
  • 미세먼지 (PM10) 및 초미세먼지 (PM2.5)는 인체에 흡수 가능하여 호흡기 질환 및 심장 질환과 같이 인체건강에 악영향을 미치며, 심각할 경우 조기 사망에 영향을 줄 수 있다. 전 세계적으로 현장관측기반의 모니터링을 수행하고 있지만 미 관측지역에 대한 대기질 분포의 공간적인 한계점이 존재하여 보다 광범위한 지역에 대한 지속적이고 정확한 모니터링이 필요한 상황이다. 위성기반 에어로졸 정보를 사용함으로써 이러한 현장 관측자료의 한계점을 극복할 수 있다. 따라서 본 연구에서는 다양한 위성 및 모델자료를 활용하여 2019년도에 대해 한 시간 단위의 지상 PM10 및 PM2.5 농도를 추정하였다. GOCI 위성의 관측영역을 포함하는 동아시아 지역에 대해 트리 기반 앙상블 방법을 사용하는 Boosting 기법인 GBRTs (Gradient Boosted Regression Trees)와 LightGBM (Light Gradient Boosting Machine)을 활용하여 모델을 구축하였다. 또한, 기상변수 및 토지피복변수의 사용유무에 따른 모델의 성능을 비교하기 위해 두 가지 festure set으로 나누어 테스트하였다. 두 기법 모두 주요 변수인 AOD (Aerosol Optical Depth), SSA (Single Scattering Albedo), DEM (Digital Eelevation Model), DOY (Day of Year), HOD (Hour of Day)와 기상변수 및 토지피복변수를 함께 사용한 Feature set 1을 사용하였을 때 높은 정확도를 보였다. Feature set 1에 대해 GBRT 모델이 LightGBM에 비해서약 10%의 정확도 향상을 보였다. 가장 정확도가 높았던 기상 및 지표면 변수를 포함한 Feature set1을 사용한 GBRT기반 모델을 최종모델로 선정하였으며 (PM10: R2 = 0.82 nRMSE = 34.9%, PM2.5: R2 = 0.75 nRMSE = 35.6%), 계절별 및 연평균 PM10 및 PM2.5 농도에 대한 공간적인 분포를 확인해본 결과, 현장관측자료와 비슷한 공간 분포를 보였으며, 국가별 농도 분포와 계절에 따른 시계열 농도 패턴을 잘 모의하였다.

계절내-계절 기후예측의 딥러닝 기반 후보정을 위한 입력자료 전처리 기법 평가 (Investigating Data Preprocessing Algorithms of a Deep Learning Postprocessing Model for the Improvement of Sub-Seasonal to Seasonal Climate Predictions)

  • 정유란;이진영;김미애;손수진
    • 한국농림기상학회지
    • /
    • 제25권2호
    • /
    • pp.80-98
    • /
    • 2023
  • 본 연구에서는 계절내-계절(Subseasonal to seasonal, S2S) 기후예측의 주별 예측 성능을 개선하기 위해서 딥러닝 기반의 후보정(post processing) 기술을 개발하였다. 그 첫 단계로, 일 최고, 최저기온과 일 강수를 목표 변수로, 자료의 특성과 분포에 적합한 자료 변환 및 특성 공학 기법을 규명하고자 하였다. 먼저, 6개 개별 기후모델의 S2S 예측 자료를 딥러닝 모델에 입력하기 위한 훈련자료로 변환하고, 이로부터 다중모델앙상블(Multi-Model Ensemble, MME) 기반 훈련자료를 구축하였다. 참값(label)으로는 ECMWF의 ERA5 재분석 자료를 사용하였다. 자료 변환 알고리즘은 최고 및 최저 차이를 계산하여 입력자료의 범위를 변형시키는 MinMax 및 MaxAbs 변환, 표준편차를 이용하는 Standard 변환 및 분위수를 지정하여 변형하는 Robust와 Quantile 변환으로 구성된 전처리 파이프라인을 구축하였으며, 변환된 훈련자료와 예측 변수와의 상관관계를 계산하여 순위에 따라 훈련자료의 특성을 선택하는 특성 선택 기법을 추가하였다. 본 연구는 U-Net 모델에 TimeDistributed wrapper를 모든 합성곱 층(convolutional layer)에 적용하여 활용하였다. 5개 알고리즘으로부터 변환된 6개 개별 기후모델 및 MME S2S 훈련자료(일 최고 및 최저기온, 강수)에 훈련 모델을 적용한 결과와 훈련 모델을 적용하지 않은 결과를 ERA5와의 공간상관계수(spatial Pattern Correlation Coefficient)를 계산하고 그 개선율인 기술 점수(skill score)를 평가한 결과, 일 강수의 PCC 기술 점수는 Standard 및 Robust 변환으로 처리된 것에서 전체 예측선행(1~4주)에 대해 모두 높았고, 일 최고 및 최저기온에서는 예측 선행시간 3~4주에서만 높게 나타났다. 또한, 일 강수에서 특성 선택에 따른 훈련자료의 차원 감소가 예측 성능 변화에 영향을 미치지 않는 것으로 나타났다. 일 최고 및 최저기온의 경우에는 특성 선택에 의한 훈련자료의 특성 정보 감소가 오히려 예측 성능을 저하시킬 수 있는 것으로 확인되었으며, 원시자료에서 예측성이 높은 1~2주 기온 예측 개선을 위한 적합한 전처리 변환 알고리즘이나 특성 선택을 찾을 수 없었다. 후속 연구에서는 원시 예측 성능이 강수에 비해 높으나 딥러닝 훈련 모델에 의한 후보정 효과가 미미한 예측 선행 1~2주 기온 예측의 저조 원인에 대해 탐색하고, 다양한 딥러닝 훈련 모델로의 적용 및 초매개변수 조정 등 학습 과정의 최적화를 통해 S2S 기후 예측 성능을 개선하고자 한다.