• 제목/요약/키워드: Random Forest, RF

검색결과 185건 처리시간 0.023초

메탄 가스 기반 가스 누출 위험 예측을 위한 다변량 특이치 제거 (Multivariate Outlier Removing for the Risk Prediction of Gas Leakage based Methane Gas)

  • 홍고르출;김미혜
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.23-30
    • /
    • 2020
  • 본 연구에서는, 천연가스(NG) 데이터와 가스 관련 환경 요소 간의 관계를 기계학습 알고리즘을 사용하여 가스 누출 데이터를 직접 측정하지 않고 가스 누출 위험 수준을 예측하였다. 이번 연구는 서버가 제공하는 오픈 데이터인 IoT 기반 원격 제어 피카로(Picarro) 가스 센서 사양을 기반으로 사용했다. 천연 가스는 공기 중으로 누출이 되며, 대기 오염, 환경, 그리고 건강에 큰 문제가 된다. 본 연구에서 제안하는 방법은 천연 가스의 누출 위험 예측을 위한 랜덤 포레스트(Random Forest) 분류 기반 다변량 특이치 제거 방법이다. 비지도 k-평균 클러스터링 후에 실험 데이터 집합은 불균형 데이터이다. 따라서 우리는 제안된 모델이 중간과 높은 위험 수준을 가장 잘 예측할 수 있다는 점에 초점을 맞춘다. 이 경우 각 분류 모델에 대한 수신자 조작 특성(ROC) 곡선, 정확도, 평균 표준 오차(MSE)를 비교했다. 실험 결과로 정확도, 수신자 조작 특성의 곡선 아래 영역(AUC, Area Under the ROC Curve), MSE가 각각 MOL_RF의 경우 99.71%, 99.57%, 및 0.0016의 결과 값을 얻었다.

Comparison of Machine Learning Analysis on Predictive Factors of Children's Planning-Organizing Executive Function by Income Level: Through Home Environment Quality and Wealth Factors

  • Lim, Hye-Kyung;Kim, Hyun-Ok;Park, Hae-Seon
    • 인간식물환경학회지
    • /
    • 제24권6호
    • /
    • pp.651-662
    • /
    • 2021
  • Background and objective: This study identifies whether children's planning-organizing executive function can be significantly classified and predicted by home environment quality and wealth factors. Methods: For empirical analysis, we used the data collected from the 10th Panel Study on Korean Children in 2017. Using machine learning tools such as support vector machine (SVM) and random forest (RF), we evaluated the accuracy of the model in which home environment factors classify and predict children's planning-organizing executive functions, and extract the relative importance of variables that determine these executive functions by income group. Results: First, SVM analysis shows that home environment quality and wealth factors show high accuracy in classification and prediction in all three groups. Second, RF analysis shows that estate had the highest predictive power in the high-income group, followed by income, asset, learning, reinforcement, and emotional environment. In the middle-income group, emotional environment showed the highest score, followed by estate, asset, reinforcement, and income. In the low-income group, estate showed the highest score, followed by income, asset, learning, reinforcement, and emotional environment. Conclusion: This study confirmed that home environment quality and wealth factors are significant factors in predicting children's planning-organizing executive functions.

Prediction of Global Industrial Water Demand using Machine Learning

  • Panda, Manas Ranjan;Kim, Yeonjoo
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.156-156
    • /
    • 2022
  • Explicitly spatially distributed and reliable data on industrial water demand is very much important for both policy makers and researchers in order to carry a region-specific analysis of water resources management. However, such type of data remains scarce particularly in underdeveloped and developing countries. Current research is limited in using different spatially available socio-economic, climate data and geographical data from different sources in accordance to predict industrial water demand at finer resolution. This study proposes a random forest regression (RFR) model to predict the industrial water demand at 0.50× 0.50 spatial resolution by combining various features extracted from multiple data sources. The dataset used here include National Polar-orbiting Partnership (NPP)/Visible Infrared Imaging Radiometer Suite (VIIRS) night-time light (NTL), Global Power Plant database, AQUASTAT country-wise industrial water use data, Elevation data, Gross Domestic Product (GDP), Road density, Crop land, Population, Precipitation, Temperature, and Aridity. Compared with traditional regression algorithms, RF shows the advantages of high prediction accuracy, not requiring assumptions of a prior probability distribution, and the capacity to analyses variable importance. The final RF model was fitted using the parameter settings of ntree = 300 and mtry = 2. As a result, determinate coefficients value of 0.547 is achieved. The variable importance of the independent variables e.g. night light data, elevation data, GDP and population data used in the training purpose of RF model plays the major role in predicting the industrial water demand.

  • PDF

머신러닝 기법을 활용한 주요 침엽수종의 수관급 분류와 간벌목 선정 연구 (A Study on Classification of Crown Classes and Selection of Thinned Trees for Major Conifers Using Machine Learning Techniques)

  • 이용규;이정수;박진우
    • 한국산림과학회지
    • /
    • 제111권2호
    • /
    • pp.302-310
    • /
    • 2022
  • 본 연구는 효율적인 산림시업계획 수립을 위하여 입목의 측정정보와 머신러닝 알고리즘을 이용하여 주요 침엽수종(소나무, 잣나무, 낙엽송)의 수관급 분류를 목적으로 하였다. 입목의 측정정보는 9년간 수집된 국유림 모니터링 정보를 활용하였으며, 머신러닝 알고리즘은 Random Forest (RF), XGBoost (XGB), Light GBM (LGBM)을 사용하였다. 알고리즘의 정확도, 정밀도, 재현율, F1 score를 이용한 성능평가를 통하여 알고리즘의 정확도를 비교·평가하였다. 분석결과, 소나무림, 잣나무림, 낙엽송 모두 RF 알고리즘이 성능평가 점수가 가장 높았으며, 수종별로는 소나무가 정확도 약 65%, 정밀도 약 72%, 재현율 약 60%, F1 score 약 66%로 성능평가 점수가 가장 높았다. 수관급은 우세목의 정확도가 약 80%이상으로 높았으나, 준우세목과 중간목, 피압목의 분류 정확도는 낮게 평가되었다. 본 연구결과는 산림시업의 간벌목 선정에 있어 의사결정을 위한 참조자료로 활용이 가능할 것으로 판단된다.

인공지능을 이용한 수도권 학교 미세먼지 취약성 평가: Part I - 미세먼지 예측 모델링 (Vulnerability Assessment for Fine Particulate Matter (PM2.5) in the Schools of the Seoul Metropolitan Area, Korea: Part I - Predicting Daily PM2.5 Concentrations)

  • 손상훈;김진수
    • 대한원격탐사학회지
    • /
    • 제37권6_2호
    • /
    • pp.1881-1890
    • /
    • 2021
  • 미세먼지는 인체에는 물론 생태계, 날씨 등에도 많은 영향을 끼치며, 인구와 건물, 차량 등이 밀집된 대도시에서의 미세먼지의 예측과 모니터링은 중요하다. 특히 자동차, 연소 등에서 발생하는 PM2.5 농도는 독성 물질을 포함할 수 있어 체계적인 관리가 필요하다. 따라서 본 연구는 화학 인자, 위성 기반의 aerosol optical depth (AOD), 기상 인자 등을 입력 자료로 하여 수도권PM2.5 농도를 예측하고자 한다. PM2.5 농도 예측을 위해 기계 학습 모델 중 PM 농도 예측에 우수한 성능을 보이는 random forest (RF) 모델을 선정하였으며, 모델 평가를 위해 통계 지표인 R2, RMSE, MAE, MAPE를 산출하였다. RF 모델의 모델 정확도는 R2, RMSE, MAE, MAPE는 각각 0.97, 3.09, 2.18, 13.31로 나타났으며, 예측 정확도는 각각 0.82, 6.03, 4.36, 25.79로 본 연구에서 사용한 인자들을 이용하여 PM2.5를 예측 시 높은 정확도와 상관성을 나타내었다. 따라서 향후 학교 미세먼지 예측 및 범주화를 위해 본 연구에서 사용한 인자들을 RF 모델에 적용하였을 때 신뢰할만한 결과를 도출할 수 있을 것으로 기대된다.

머신러닝을 이용한 경기도 화재위험요인 예측분석 (Predictive Analysis of Fire Risk Factors in Gyeonggi-do Using Machine Learning)

  • 서민송;에베르 엔리케 카스티요 오소리오;유환희
    • 한국측량학회지
    • /
    • 제39권6호
    • /
    • pp.351-361
    • /
    • 2021
  • 화재는 막대한 재산과 인명피해를 초래하고 있으며 크고 작은 화재가 지속해서 발생하고 있다. 따라서 본 연구는 화재 유형별로 화재에 영향을 미치는 각종 위험요인을 예측하고자 한다. 전국에서 화재 발생 건수가 가장 많은 경기도를 대상으로 화재발생위험요인 예측분석을 실시하였다. 또한, 머신러닝 방법인 SVM, RF, GBRT를 활용하여 각 모형의 정확성을 MAE,RMSE를 통해 적합도가 높은 모형을 제시하였으며 이를 토대로 경기도 화재발생요인 예측분석을 실시하였다. 머신러닝 방법 3가지를 비교분석한 결과 RF가 MAE 1.517, RMSE 1.820으로 나타났으며 MAE, RMSE 검증데이터 및 시험데이터의 경우 MAE값 0.024, RMSE값 0.12의 차이로 매우 유사하게 나타나 가장 우수한 예측력으로 나타났다. RF기법을 적용하여 분석한 결과 공통적으로 발화장소가 화재발생에 가장 큰 영향을 주는 위험요인으로 나타났다. 이러한 연구 결과는 화재발생에 영향을 주는 요인들의 위험순서를 파악하여 화재안전관리의 유용한 자료로 활용될 것으로 예상된다.

머신러닝 기법을 활용한 토압식 쉴드TBM 막장압 예측에 관한 연구 (A study on EPB shield TBM face pressure prediction using machine learning algorithms)

  • 권기범;최항석;오주영;김동구
    • 한국터널지하공간학회 논문집
    • /
    • 제24권2호
    • /
    • pp.217-230
    • /
    • 2022
  • 쉴드TBM (Tunnel Boring Machine) 터널 시공에 있어 막장압 관리는 막장면 붕괴, 지반침하 등을 방지하여 막장 안정성을 유지하는 데 중요한 역할을 담당한다. 특히, 챔버 내부의 굴착토로 막장압을 조절하는 토압식 쉴드TBM의 경우, 이수식 쉴드TBM에 비해 막장압의 관리가 어렵다. 본 연구에서는 국내 토압식 쉴드TBM 터널 시공 현장의 지반조건 및 굴진특성 데이터를 분석하여, 토압식 쉴드TBM 터널의 세그먼트 링별 막장압 예측모델을 제시하였다. 예측모델의 입력특성으로 7가지를 선정하였으며, 912개의 학습 데이터 세트(Training data set)와 228개의 시험 데이터 세트(Test data set)를 확보하였다. 최적의 토압식 쉴드TBM 막장압 예측모델 선정을 위하여 KNN (K-Nearest Neighbors), SVM (Support Vector Machine), RF (Random Forest), XGB (eXtreme Gradient Boosting) 모델의 하이퍼파라미터(Hyperparameter)를 최적화하여 예측성능을 비교한 결과, RF 모델이 7.35 kPa의 평균 제곱근 오차(Root Mean Square Error, RMSE)로 가장 우수한 성능을 나타냈다. 추가적으로, RF 모델의 특성 중요도(Feature importance) 분석을 수행한 결과, 입력특성 중 수압의 영향도가 0.38로 가장 높았으며, 전반적으로 지반조건이 굴진특성보다 높은 중요도를 보여주었다.

Machine Learning for Flood Prediction in Indonesia: Providing Online Access for Disaster Management Control

  • Reta L. Puspasari;Daeung Yoon;Hyun Kim;Kyoung-Woong Kim
    • 자원환경지질
    • /
    • 제56권1호
    • /
    • pp.65-73
    • /
    • 2023
  • As one of the most vulnerable countries to floods, there should be an increased necessity for accurate and reliable flood forecasting in Indonesia. Therefore, a new prediction model using a machine learning algorithm is proposed to provide daily flood prediction in Indonesia. Data crawling was conducted to obtain daily rainfall, streamflow, land cover, and flood data from 2008 to 2021. The model was built using a Random Forest (RF) algorithm for classification to predict future floods by inputting three days of rainfall rate, forest ratio, and stream flow. The accuracy, specificity, precision, recall, and F1-score on the test dataset using the RF algorithm are approximately 94.93%, 68.24%, 94.34%, 99.97%, and 97.08%, respectively. Moreover, the AUC (Area Under the Curve) of the ROC (Receiver Operating Characteristics) curve results in 71%. The objective of this research is providing a model that predicts flood events accurately in Indonesian regions 3 months prior the day of flood. As a trial, we used the month of June 2022 and the model predicted the flood events accurately. The result of prediction is then published to the website as a warning system as a form of flood mitigation.

Covariance-based Recognition Using Machine Learning Model

  • Osman, Hassab Elgawi
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.223-228
    • /
    • 2009
  • We propose an on-line machine learning approach for object recognition, where new images are continuously added and the recognition decision is made without delay. Random forest (RF) classifier has been extensively used as a generative model for classification and regression applications. We extend this technique for the task of building incremental component-based detector. First we employ object descriptor model based on bag of covariance matrices, to represent an object region then run our on-line RF learner to select object descriptors and to learn an object classifier. Experiments of the object recognition are provided to verify the effectiveness of the proposed approach. Results demonstrate that the propose model yields in object recognition performance comparable to the benchmark standard RF, AdaBoost, and SVM classifiers.

  • PDF

6SV2.1과 GK2A AOD를 이용한 기계학습 기반의 Sentinel-2 영상 대기보정 (Machine Learning-based Atmospheric Correction for Sentinel-2 Images Using 6SV2.1 and GK2A AOD)

  • 김서연;윤유정;강종구;정예민;최소연;임윤교;서영민;박찬원;이경도;나상일;안호용;류재현;이양원
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.1061-1067
    • /
    • 2023
  • 이 단보에서는 차세대 중형위성 4호(농림위성)의 활용에 앞서, 농림위성과 분광밴드가 유사한 Sentinel-2 위성영상에 대하여 대기보정을 모의하였다. second simulation of the satellite signal in the solar spectrum - vector(6SV)2.1 복사전달모델과 기계학습의 일종인 랜덤 포레스트(random forest, RF)를 활용하여 6SV2.1을 모사한 RF 기반의 대기보정 모델을 개발한 결과, 6SV2.1로 산출된 반사도와 RF 모델로 예측된 반사도 간의 유사도가 매우 높게 나타났다.