• 제목/요약/키워드: Ensemble Model

검색결과 644건 처리시간 0.024초

신재생 에너지 최적 활용을 위한 축열조 온도 예측 모델 연구 (A Study on the Thermal Prediction Model cf the Heat Storage Tank for the Optimal Use of Renewable Energy)

  • 오한별;장경민;오지영;이명배;박장우;조용윤;신창선
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.63-70
    • /
    • 2023
  • 최근 스마트팜 에너지 비용 중 35% 낸난방비 에너지 소비가 증가되어 에너지 소비 효율화가 요구되며, 전기료 현실화에 대한 우려로 신재생 에너지 중요성이 증가하고 있다. 신재생 에너지는 수력, 풍력, 태양광 등에 속하며, 이중 태양광 에너지는 전기에너지로 변환하는 발전기술로, 이 기술은 에너지원이 환경에 미치는 영향이 적고, 유지 보수가 간편하다는 특징을 갖고 있다. 본 연구에서는 온실 축열조, 히트펌프 데이터 기반으로 축열조 영향을 많이 미치는 요소를 선정하고 축열조 공급 온도예측 모델을 개발하고자 한다. 시계열 데이터 분석 및 예측에 효과적인 LSTM(Long Short-Term Memory)과 다른 앙상블 학습 기법보다 뛰어난 XGBoost 모델을 이용하여 예측한다. 히트펌프 축열조 온도를 예측함으로써 에너지 소비를 최적화하여 시스템 운영을 최적화할 수 있다. 또한, 태양광 활용에 따른 냉난방비 절감 및 농가의 에너지 자립도 개선 등 스마트팜 에너지 통합 운영 시스템에 연계하고자 한다. 플랫폼을 통해 폐열 에너지의 공급을 관리하고 최대 난방부하 및 계절, 시간별 작물생장에 필요한 에너지값을 도출하여 이를 기반으로 최적 에너지 운용방안을 도출하고자 한다.

합성곱 신경망을 이용한 주가방향 예측: 상관관계 속성선택 방법을 중심으로 (Stock Price Direction Prediction Using Convolutional Neural Network: Emphasis on Correlation Feature Selection)

  • 어균선;이건창
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.21-39
    • /
    • 2020
  • 딥러닝(Deep learning) 기법은 패턴분석, 이미지분류 등 다양한 분야에서 높은 성과를 나타내고 있다. 특히, 주식시장 분석문제는 머신러닝 연구분야에서도 어려운 분야이므로 딥러닝이 많이 활용되는 영역이다. 본 연구에서는 패턴분석과 분류능력이 높은 딥러닝의 일종인 합성곱신경망(Convolutional Neural Network) 모델을 활용하여 주가방향 예측방법을 제안한다. 추가적으로 합성곱신경망 모델을 효율적으로 학습시키기 위한 속성선택(Feature Selection, FS)방법이 적용된다. 합성곱신경망 모델의 성과는 머신러닝 단일 분류기와 앙상블 분류기를 벤치마킹하여 객관적으로 검증된다. 본 연구에서 벤치마킹한 분류기는 로지스틱 회귀분석(Logistic Regression), 의사결정나무(Decision Tree), 인공신경망(Neural Network), 서포트 벡터머신(Support Vector Machine), 아다부스트(Adaboost), 배깅(Bagging), 랜덤포레스트(Random Forest)이다. 실증분석 결과, 속성선택을 적용한 합성곱신경망이 다른 벤치마킹 분류기보다 분류 성능이 상대적으로 높게 나타났다. 이러한 결과는 합성곱신경망 모델과 속성선택방법을 적용한 예측방법이 기업의 재무자료에 내포된 가치를 보다 정교하게 분석할 수 있는 가능성이 있음을 실증적으로 확인할 수 있었다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

부스팅 트리에서 적정 트리사이즈의 선택에 관한 연구 (The guideline for choosing the right-size of tree for boosting algorithm)

  • 김아현;김지현;김현중
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.949-959
    • /
    • 2012
  • 범주형 목표변수를 잘 예측하기 위한 데이터마이닝 방법 중에서 최근에는 여러 단일 분류자를 결합한 앙상블 기법이 많이 활용되고 있다. 앙상블 기법 가운데 부스팅은 재표본 시 분류하기 어려운 관찰치의 가중치를 높여 분류자가 해당 관찰치에 보다 집중할 수 있도록 함으로써 다른 앙상블 기법에 비해 오차를 효과적으로 감소시키는 방법으로 알려져 있다. 부스팅을 구성하는 분류자를 의사결정나무로 둔 부스팅 트리 모형의 경우 각 트리의 사이즈를 결정해야 하는데, 본 연구에서는 자료 별로 부스팅 트리에 가장 적합한 트리사이즈가 서로 다를수 있다고 가정하고, 주어진 자료에 맞는 트리사이즈를 추정하는 문제에 대해 논의하였다. 우선 트리사이즈가 부스팅 트리의 정확도에 중요한 영향을 미치는가를 파악하기 위하여 28개의 자료를 대상으로 실험을 수행하였으며, 그 결과 트리사이즈를 결정하는 문제가 모형 전체의 성능을 결정하는데 상당한 역할을 한다는 것을 확인할 수 있었다. 또한 그 결과를 바탕으로 최적의 트리사이즈에 영향을 미칠 것으로 판단되는 몇 가지 특성 변수를 정의하고, 해당 변수를 이용하여 부스팅 트리에서의 최적 트리사이즈를 설명하는 모형을 구성해 보았다. 자료 별로 고유한 최적의 트리사이즈는 자료의 특성에 의존적일 가능성도 있으므로 본 연구에서 제안하는 추정방법은 최적 트리사이즈를 결정하기 위한 출발점 또는 가이드라인으로 활용하는 것이 적절할 것이다. 기존에는 부스팅 트리의 사이즈에 대한 값으로 목표변수의 범주의 개수를 활용하였는데, 본 모형에서 제안하는 트리사이즈의 추정치로 부스팅 트리를 구축한 경우 기존방법에 비해 분류정확도를 유의미하게 개선하는 것을 확인할 수 있었다.

기계학습을 이용한 식품위생점검 체계의 효율성 개선 연구 (Improving Efficiency of Food Hygiene Surveillance System by Using Machine Learning-Based Approaches)

  • 조상구;조승용
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.53-67
    • /
    • 2020
  • 본 연구는 가공식품의 제조·가공 업소를 대상으로 기계학습 분야의 지도학습(Supervised Learning) 예측 모형을 적용하여 부적합이 예상되는 업체를 사전에 적발하는 단속 선별시스템을 마련하여 단속 활동의 효율성을 높이고자 하였다. 본 연구에서는 머신러닝의 예측 모델링을 위한 목적 정의, 데이터의 기초 분석과 시각화, 특성 변수 도출 및 예측 모형의 선정 및 예측 등으로 기계학습 수행의 표준적인 절차에 따라 연구를 수행하였다. 종속변수는 2014년도부터 2018년까지 과거 5년 동안 지도점검 적발 건수로 설정하였고, 목적함수는 실제 부적합업체를 사전에 판정하여 단속활동이 이루어지는 것을 최대화하는 것으로 하였다. 제조가공업소의 매출액, 영업일수, 종업원 수 등 기본속성뿐만 아니라 과거 지도점검 단속 이력 정보를 반영하여 자료를 재구성하였다. 특성 변수 추출 방법을 적용하여 부적합 판정에 영향을 미치는 업체 위험, 품목 위험, 환경 위험 및 과거 위반 이력 등을 특성 변수로 도출하여 머신러닝 알고리즘을 데이터에 적용하였다. 랜덤포레스트 모형이 식품의약품안전처 지도점검 업무 목적에 가장 적합한 것으로 나타났다. 본 연구결과를 바탕으로 식품안전 관리 국가 사무가 데이터기반의 과학적인 행정 체계로 발전할 수 있는 기반이 되기를 기대한다.

SSP 시나리오에 따른 동아시아 대기질 미래 전망 (Impact of Future Air Quality in East Asia under SSP Scenarios)

  • 심성보;서정빈;권상훈;이재희;성현민;부경온;변영화;임윤진;김연희
    • 대기
    • /
    • 제30권4호
    • /
    • pp.439-454
    • /
    • 2020
  • This study investigates the change in the fine particulate matter (PM2.5) concentration and World Health Organization (WHO) air quality index (AQI) in East Asia (EA) under Shared Socioeconomic Pathways (SSPs). AQI is an indicator of increasing levels about health concern, divided into six categories based on PM2.5 annual concentrations. Here, we utilized the ensemble results of UKESM1, the climate model operated in Met Office, UK, for the analysis of long-term variation during the historical (1950~2014) and future (2015~2100) period. The results show that the spatial distributions of simulated PM2.5 concentrations in present-day (1995~2014) are comparable to observations. It is found that most regions in EA exceeded the WHO air quality guideline except for Japan, Mongolia regions, and the far seas during the historical period. In future scenarios containing strong air quality (SSP1-2.6, SSP5-8.5) and medium air quality (SSP2-4.5) controls, PM2.5 concentrations are substantially reduced, resulting in significant improvement in AQI until the mid-21st century. On the other hand, the mild air pollution controls in SSP3-7.0 tend to lead poor AQI in China and Korea. This study also examines impact of increased in PM2.5 concentrations on downward shortwave energy at the surface. As a result, strong air pollution controls can improve air quality through reduced PM2.5 concentrations, but lead to an additional warming in both the near and mid-term future climate over EA.

TBM 데이터와 머신러닝 기법을 이용한 디스크 커터마모 예측에 관한 연구 (A Study on the Prediction of Disc Cutter Wear Using TBM Data and Machine Learning Algorithm)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제32권6호
    • /
    • pp.502-517
    • /
    • 2022
  • TBM의 활용이 증가하면서 최근 국내외에서 머신러닝 기법으로 TBM 데이터를 분석하여 디스크커터의 교환주기 예측 및 굴진율을 예측하는 연구가 증가하고 있다. 본 연구에서는 굴진 시 획득되는 기계 데이터와 지반 데이터를 기반으로 최근에 다양한 분야에서 널리 사용되고 있는 머신러닝 기법들 중 회귀 모델을 접목하여 슬러리 쉴드 TBM 현장의 디스크 커터 마모 예측을 하였다. 디스크 커터 마모 예측을 위해서 Training과 Test 데이터를 7:3으로 분할하였으며, 최적의 파라미터를 선정을 위해서 분할 교차검증을 포함하는 그리드 서치를 활용하였다. 그 결과, 앙상블 계열의 그레디언트 부스팅 모델이 결정계수가 0.852, 평균 제곱근 오차가 3.111로 좋은 성능을 보여주었고 특히 학습성능과 더불어 학습속도에서 우수한 결과를 보여주었다. 현재 도출된 결과로 볼 때, 슬러리 쉴드 TBM의 기계데이터와 지반정보가 포함된 데이터를 활용한 디스크 커터 마모 예측 모델의 적합성은 높다고 보인다. 추가적으로 지반조건의 다양성과 디스크 마모 측정 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

부가 정보를 활용한 비전 트랜스포머 기반의 추천시스템 (A Vision Transformer Based Recommender System Using Side Information)

  • 권유진;최민석;조윤호
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.119-137
    • /
    • 2022
  • 최근 추천 시스템 연구에서는 사용자와 아이템 간 상호 작용을 보다 잘 표현하고자 다양한 딥 러닝 모델을 적용하고 있다. ONCF(Outer product-based Neural Collaborative Filtering)는 사용자와 아이템의 행렬을 외적하고 합성곱 신경망을 거치는 구조로 2차원 상호작용 맵을 제작해 사용자와 아이템 간의 상호 작용을 더욱 잘 포착하고자 한 대표적인 딥러닝 기반 추천시스템이다. 하지만 합성곱 신경망을 이용하는 ONCF는 학습 데이터에 나타나지 않은 분포를 갖는 데이터의 경우 예측성능이 떨어지는 귀납적 편향을 가지는 한계가 있다. 본 연구에서는 먼저 NCF구조에 Transformer에 기반한 ViT(Vision Transformer)를 도입한 방법론을 제안한다. ViT는 NLP분야에서 주로 사용되던 트랜스포머를 이미지 분류에 적용하여 좋은 성과를 거둔 방법으로 귀납적 편향이 합성곱 신경망보다 약해 처음 보는 분포에도 robust한 특징이 있다. 다음으로, ONCF는 사용자와 아이템에 대한 단일 잠재 벡터를 사용하였지만 본 연구에서는 모델이 더욱 다채로운 표현을 학습하고 앙상블 효과도 얻기 위해 잠재 벡터를 여러 개 사용하여 채널을 구성한다. 마지막으로 ONCF와 달리 부가 정보(side information)를 추천에 반영할 수 있는 아키텍처를 제시한다. 단순한 입력 결합 방식을 활용하여 신경망에 부가 정보를 반영하는 기존 연구와 달리 본 연구에서는 독립적인 보조 분류기(auxiliary classifier)를 도입하여 추천 시스템에 부가정보를 보다 효율적으로 반영할 수 있도록 하였다. 결론적으로 본 논문에서는 ViT 의 적용, 임베딩 벡터의 채널화, 부가정보 분류기의 도입을 적용한 새로운 딥러닝 모델을 제안하였으며 실험 결과 ONCF보다 높은 성능을 보였다.

SSP-RCP 기후변화 시나리오 기반 한반도의 평균 기온 및 온량지수 변화 (Changes in Mean Temperature and Warmth Index on the Korean Peninsula under SSP-RCP Climate Change Scenarios)

  • 허지나;김용석;조세라;김응섭;강민구;심교문;홍승길
    • 대기
    • /
    • 제34권2호
    • /
    • pp.123-138
    • /
    • 2024
  • Using 18 multi-model-based a Shared Socioeconomic Pathway (SSP) and Representative Concentration Pathways (RCP) climate change scenarios, future changes in temperature and warmth index on the Korean Peninsula in the 21st century (2011~2100) were analyzed. In the analysis of the current climate (1981~2010), the ensemble averaged model results were found to reproduce the observed average values and spatial patterns of temperature and warmth index similarly well. In the future climate projections, temperature and warmth index are expected to rise in the 21st century compared to the current climate. They go further into the future and the higher carbon scenario (SSP5-8.5), the larger the increase. In the 21st century, in the low-carbon scenario (SSP1-2.6), temperature and warmth index are expected to rise by about 2.5℃ and 24.6%, respectively, compared to the present, while in the high-carbon scenario, they are expected to rise by about 6.2℃ and 63.9%, respectively. It was analyzed that reducing carbon emissions could contribute to reducing the increase in temperature and warmth index. The increase in the warmth index due to climate change can be positively analyzed to indicate that the effective heat required for plant growth on the Korean Peninsula will be stably secured. However, it is necessary to comprehensively consider negative aspects such as changes in growth conditions during the plant growth period, increase in extreme weather such as abnormally high temperatures, and decrease in plant diversity. This study can be used as basic scientific information for adapting to climate change and preparing response measures.

기계학습을 이용한 수출신용보증 사고예측 (The Prediction of Export Credit Guarantee Accident using Machine Learning)

  • 조재영;주지환;한인구
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 2021
  • 2020년 8월 정부는 한국판 뉴딜을 뒷받침하기 위한 공공기관의 역할 강화방안으로서 각 공공기관별 역량을 바탕으로 5대 분야에 걸쳐 총 20가지 과제를 선정하였다. 빅데이터(Big Data), 인공지능 등을 활용하여 대국민 서비스를 제고하고 공공기관이 보유한 양질의 데이터를 개방하는 등의 다양한 정책을 통해 한국판 뉴딜(New Deal)의 성과를 조기에 창출하고 이를 극대화하기 위한 다양한 노력을 기울이고 있다. 그중에서 한국무역보험공사(KSURE)는 정책금융 공공기관으로 국내 수출기업들을 지원하기 위해 여러 제도를 운영하고 있는데 아직까지는 본 기관이 가지고 있는 빅데이터를 적극적으로 활용하지 못하고 있는 실정이다. 본 연구는 한국무역보험공사의 수출신용보증 사고 발생을 사전에 예측하고자 공사가 보유한 내부 데이터에 기계학습 모형을 적용하였고 해당 모형 간에 예측성과를 비교하였다. 예측 모형으로는 로지스틱(Logit) 회귀모형, 랜덤 포레스트(Random Forest), XGBoost, LightGBM, 심층신경망을 사용하였고, 평가 기준으로는 전체 표본의 예측 정확도 이외에도 표본별 사고 확률을 구간으로 나누어 높은 확률로 예측된 표본과 낮은 확률로 예측된 경우의 정확도를 서로 비교하였다. 각 모형별 전체 표본의 예측 정확도는 70% 내외로 나타났고 개별 표본을 사고 확률 구간별로 세부 분석한 결과 양 극단의 확률구간(0~20%, 80~100%)에서 90~100%의 예측 정확도를 보여 모형의 현실적 활용 가능성을 보여주었다. 제2종 오류의 중요성 및 전체적 예측 정확도를 종합적으로 고려할 경우, XGBoost와 심층신경망이 가장 우수한 모형으로 평가되었다. 랜덤포레스트와 LightGBM은 그 다음으로 우수하며, 로지스틱 회귀모형은 가장 낮은 성과를 보였다. 본 연구는 한국무역보험공사의 빅데이터를 기계학습모형으로 분석해 업무의 효율성을 높이는 사례로서 향후 기계학습 등을 활용하여 실무 현장에서 빅데이터 분석 및 활용이 활발해지기를 기대한다.