• 제목/요약/키워드: random forests regression

검색결과 35건 처리시간 0.024초

GeoAI-Based Forest Fire Susceptibility Assessment with Integration of Forest and Soil Digital Map Data

  • Kounghoon Nam;Jong-Tae Kim;Chang-Ju Lee;Gyo-Cheol Jeong
    • 지질공학
    • /
    • 제34권1호
    • /
    • pp.107-115
    • /
    • 2024
  • This study assesses forest fire susceptibility in Gangwon-do, South Korea, which hosts the largest forested area in the nation and constitutes ~21% of the country's forested land. With 81% of its terrain forested, Gangwon-do is particularly susceptible to wildfires, as evidenced by the fact that seven out of the ten most extensive wildfires in Korea have occurred in this region, with significant ecological and economic implications. Here, we analyze 480 historical wildfire occurrences in Gangwon-do between 2003 and 2019 using 17 predictor variables of wildfire occurrence. We utilized three machine learning algorithms—random forest, logistic regression, and support vector machine—to construct wildfire susceptibility prediction models and identify the best-performing model for Gangwon-do. Forest and soil map data were integrated as important indicators of wildfire susceptibility and enhanced the precision of the three models in identifying areas at high risk of wildfires. Of the three models examined, the random forest model showed the best predictive performance, with an area-under-the-curve value of 0.936. The findings of this study, especially the maps generated by the models, are expected to offer important guidance to local governments in formulating effective management and conservation strategies. These strategies aim to ensure the sustainable preservation of forest resources and to enhance the well-being of communities situated in areas adjacent to forests. Furthermore, the outcomes of this study are anticipated to contribute to the safeguarding of forest resources and biodiversity and to the development of comprehensive plans for forest resource protection, biodiversity conservation, and environmental management.

시뮬레이티드 어니일링 기반의 랜덤 포레스트를 이용한 기업부도예측 (Predicting Corporate Bankruptcy using Simulated Annealing-based Random Fores)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.155-170
    • /
    • 2018
  • 기업의 금융 부도를 예측하는 것은 전통적으로 비즈니스 분석에서 가장 중요한 예측문제 중 하나이다. 선행연구에서 예측모델은 통계 및 기계학습 기반의 기법을 적용하거나 결합하는 방식으로 제안되었다. 본 논문에서는 잘 알려진 최적화기법 중 하나인 시뮬레이티드 어니일링에 기반한 새로운 지능형 예측모델을 제안한다. 시뮬레이티드 어니일링은 유전자알고리즘과 유사한 최적화 성능을 가진 것으로 알려져 있다. 그럼에도 불구하고, 시뮬레이티드 어니일링을 사용한 비즈니스 의사결정 문제의 예측과 분류에 관한 연구가 거의 없었기 때문에, 비즈니스 분석에서의 유용성을 확인하는 것은 의미가 있다. 본 연구에서는 시뮬레이티드 어니일링과 기계학습의 결합 모델을 사용하여 부도예측모델의 입력 특징을 선정한다. 최적화 기법과 기계학습기법을 결합하는 대표적인 유형은 특징 선택, 특징 가중치 및 사례 선택이다. 이 연구에서는 선행연구에서 가장 많이 연구된 특징 선택을 위한 결합모델을 제안한다. 제안하는 모델의 우수성을 확인하기 위하여 본 연구에서는 한국 기업의 실제 재무데이터를 이용하여 그 결과를 분석한다. 분석결과는 제안된 모델의 예측 정확도가 단순한 모델의 예측 정확성보다 우수하다는 것을 보여준다. 특히 기존의 의사결정나무, 랜덤포레스트, 인공신경망, SVM 및 로지스틱 회귀분석에 비해 분류성능이 향상되었다.

Creation of regression analysis for estimation of carbon fiber reinforced polymer-steel bond strength

  • Xiaomei Sun;Xiaolei Dong;Weiling Teng;Lili Wang;Ebrahim Hassankhani
    • Steel and Composite Structures
    • /
    • 제51권5호
    • /
    • pp.509-527
    • /
    • 2024
  • Bonding carbon fiber-reinforced polymer (CFRP) laminates have been extensively employed in the restoration of steel constructions. In addition to the mechanical properties of the CFRP, the bond strength (PU) between the CFRP and steel is often important in the eventual strengthened performance. Nonetheless, the bond behavior of the CFRP-steel (CS) interface is exceedingly complicated, with multiple failure causes, giving the PU challenging to forecast, and the CFRP-enhanced steel structure is unsteady. In just this case, appropriate methods were established by hybridized Random Forests (RF) and support vector regression (SVR) approaches on assembled CS single-shear experiment data to foresee the PU of CS, in which a recently established optimization algorithm named Aquila optimizer (AO) was used to tune the RF and SVR hyperparameters. In summary, the practical novelty of the article lies in its development of a reliable and efficient method for predicting bond strength at the CS interface, which has significant implications for structural rehabilitation, design optimization, risk mitigation, cost savings, and decision support in engineering practice. Moreover, the Fourier Amplitude Sensitivity Test was performed to depict each parameter's impact on the target. The order of parameter importance was tc> Lc > EA > tA > Ec > bc > fc > fA from largest to smallest by 0.9345 > 0.8562 > 0.79354 > 0.7289 > 0.6531 > 0.5718 > 0.4307 > 0.3657. In three training, testing, and all data phases, the superiority of AO - RF with respect to AO - SVR and MARS was obvious. In the training stage, the values of R2 and VAF were slightly similar with a tiny superiority of AO - RF compared to AO - SVR with R2 equal to 0.9977 and VAF equal to 99.772, but large differences with results of MARS.

The Role of Data Technologies with Machine Learning Approaches in Makkah Religious Seasons

  • Waleed Al Shehri
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.26-32
    • /
    • 2023
  • Hajj is a fundamental pillar of Islam that all Muslims must perform at least once in their lives. However, Umrah can be performed several times yearly, depending on people's abilities. Every year, Muslims from all over the world travel to Saudi Arabia to perform Hajj. Hajj and Umrah pilgrims face multiple issues due to the large volume of people at the same time and place during the event. Therefore, a system is needed to facilitate the people's smooth execution of Hajj and Umrah procedures. Multiple devices are already installed in Makkah, but it would be better to suggest the data architectures with the help of machine learning approaches. The proposed system analyzes the services provided to the pilgrims regarding gender, location, and foreign pilgrims. The proposed system addressed the research problem of analyzing the Hajj pilgrim dataset most effectively. In addition, Visualizations of the proposed method showed the system's performance using data architectures. Machine learning algorithms classify whether male pilgrims are more significant than female pilgrims. Several algorithms were proposed to classify the data, including logistic regression, Naive Bayes, K-nearest neighbors, decision trees, random forests, and XGBoost. The decision tree accuracy value was 62.83%, whereas K-nearest Neighbors had 62.86%; other classifiers have lower accuracy than these. The open-source dataset was analyzed using different data architectures to store the data, and then machine learning approaches were used to classify the dataset.

항공 LiDAR 자료를 이용한 산림재적추정 모델 개발 - 봉화군 춘양면 애당리 혼효림을 대상으로 - (Development of Forest Volume Estimation Model Using Airborne LiDAR Data - A Case Study of Mixed Forest in Aedang-ri, Chunyang-myeon, Bonghwa-gun -)

  • 조승완;김용구;박주원
    • 한국지리정보학회지
    • /
    • 제20권3호
    • /
    • pp.181-194
    • /
    • 2017
  • 본 연구의 목적은 산림재적 현장자료와 항공 LiDAR 자료 기반의 산림재적 추정을 위한 회귀모델의 개발이다. 추정 모델은 경상북도 봉화군 지역에서 임의추출법에 의해 선정된 30개의 원형 표본지로부터 산출한 표본지별 산림재적을 반응변수로 하고, 항공 LiDAR 원자료로부터 개별 표본지의 고도분포 백분위수(Height Percentiles, HP) 및 층위 단위 점 개체수 백분율(Height Bin, HB)을 추출하여 예측변수로 사용하여 구성하였다. 단순선형회귀분석, 이차 다항회귀분석 및 단계적 회귀분석 방법을 이용한 다중회귀분석을 실시하여 적합모델들의 후보들을 도출하였으며, 검증을 위하여 각 모델별로 교차 타당성 검증을 실시하여 PRESS 통계치를 구하였다. 모델의 $R^2$ 및 PRESS을 비교하여 적합성을 검토한 결과, $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$의 다중회귀모델의 $R^2$이 0.509로 가장 높고, $HP_{25}$ 단순회귀모델의 PRESS 값이 122.352으로 가장 낮은 것으로 나타났다. 수직구조가 복잡한 우리나라 산림재적을 추정하는 모델로는 다양한 수직적 정보를 포함하고 있는 $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$이 상대적으로 보다 적합하다고 사료된다.

초,중,고 사교육비 영향요인 분석 (The Analysis of Private Education Cost for the Elementary, Middle, and High School Students in Korea)

  • 이혜정;송종우
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1125-1137
    • /
    • 2014
  • 본 논문에서는 현재 우리 사회에서 큰 이슈가 되고 있는 사교육비에 영향을 미치는 요인을 분석하였다. 사교육비가 논란이 되는 이유 가운데 하나는 각 가정에서 소비되는 전체 교육비 가운데 사교육비가 차지하는 비중이 높으면 경제적으로 교육에 대한 기회균등이 이루어지지 않는 문제를 유발할 수 있기 때문이다. 또한, 과도한 사교육으로 인해 기본적인 학교 교육보다 더 많은 시간과 비용을 할애한다면, 계층 간, 지역 간의 양극화와 더불어 학교의 기능이 저하되는 요인으로 작용할 수 있기 때문이다. 우리는 다양한 회귀분석 방법론과 분류분석 방법론을 이용하여 사교육비에 영향을 미치는 중요변수가 무엇인지를 파악하고 또 각각의 변수들이 어떻게 사교육비에 영향을 미치는 지를 분석하였다. 그 결과 대도시가 중소도시 보다 사교육비 지출이 높았고, 일반 고등학교, 중학교, 전문 고등학교, 초등학교 순으로 사교육비 지출이 높았다. 그리고 가구소득이 높을수록 사교육비 지출도 높았다.

Prevalence and risk factors of helminth infections in cattle of Bangladesh

  • Rahman, A.K.M.A.;Begum, N.;Nooruddin, M.;Rahman, Md. Siddiqur;Hossain, M.A.;Song, Hee-Jong
    • 한국동물위생학회지
    • /
    • 제32권3호
    • /
    • pp.265-273
    • /
    • 2009
  • A cross-sectional survey was undertaken to identify risk factors and clinical signs associated with parasitic helminth infections of cattle in Mymensignh district of Bangladesh. A nonrandom convenience sampling method was used to select 138 animals from 40 farmers/herds. The eggs per gram of faeces (epg) for nematodes and trematodes were determined by McMaster and Stoll's methods respectively. Animal-level and herd-level data were recorded by means of a questionnaire. Multi-collinearity amongst explanatory variables were assessed using $2{\times}2{\times}\;X^2$ test and one variable in a pair was dropped if $P{\leq}0.05$ formultiple logistic regression models. Association study between outcome and explanatory variables was conducted using classification tree, random forests and multiple logistic regression. A positive epg was considered as infected. Analyses were performed using $STATA^{(R)}$, version 8.0/Intercooled and $R^{(R)}$, Version 2.3.0. Seventy eight percent of the cattle were found to be infected with at least one type of helminth. Twenty four pairs of combinations of explanatory variables showed significant associations. Male animals (OR=3.3, P=.006, 95% CI=1.4, 7.7) were associated with significantly increased prevalence of nematode infection. Female cattle of the study area are mostly cross-breed, kept indoor, fed relatively good diet and not used for draught purpose. Males are used for draught purpose thereby more exposed to nematode infective stage and provided with relatively poor diet. So stressed male cattle may become more susceptible to nematode infection. All of the three statistical techniques selected gender and lumen motility as most important variables in association with nematode infection in cattle. The result of this survey can only be extrapolated to the periurban cattle population of traditional management system.

다시기 Landsat TM 영상과 기계학습을 이용한 토지피복변화에 따른 산림탄소저장량 변화 분석 (Change Analysis of Aboveground Forest Carbon Stocks According to the Land Cover Change Using Multi-Temporal Landsat TM Images and Machine Learning Algorithms)

  • 이정희;임정호;김경민;허준
    • 한국지리정보학회지
    • /
    • 제18권4호
    • /
    • pp.81-99
    • /
    • 2015
  • 가속되는 지구온난화로 인해 한반도 주변의 탄소순환에 대한 명확한 이해의 필요성이 제기되고 있다. 산림은 이산화탄소의 주요 흡수원으로 지상 탄소량의 대부분을 저장하고 있어 이에 대한 추정이 필요하다. 우리나라에서는 국가산림자원조사의 표본점에서 측정되는 헥타르당 임목축적량을 활용하여 산림 탄소저장량을 추정한다. 하지만 탄소저장량은 요약된 수치 형태로 발표하고 있어 탄소저장량의 공간적 분포를 파악하는 것이 어렵다. 본 연구에서는 토지피복변화가 빠르고 국가산림자원조사 표본점 배치가 부족한 도시지역을 대상으로 UNFCCC의 Approach 3와 Tier 3를 충족하는 격자 기반 산림탄소저장량을 추정하였다. 토지피복변화 및 산림탄소저장량은 1991, 1992, 2010, 2011년에 취득된 Landsat 5 TM 영상과 고해상도 항공사진, 제 3차 및 제 5, 6차 국가산림자원조사 자료를 이용하여 추정하였다. 토지피복변화는 기계학습을 이용하여 변화된 토지피복과 변화되지 않은 토지피복 항목을 한 번에 분류하여 추정하였으며, 산림탄소저장량은 반사도, 밴드비율, 식생지수, 지형변수를 입력변수로 하여 기계학습을 통해 추정하였다. 연구 결과, 산림이 그대로 산림으로 유지되는 지역의 경우 33.23tonC/ha의 흡수를 하였으며 비산림이 산림으로 변한 지역의 경우 이보다 큰 36.83tonC/ha의 흡수가 진행된 것으로 추정되었다. 산림이 비산림으로 바뀐 경우에는 -7.35tonC/ha로, 배출이 일어난 것으로 추정되었다. 본 연구를 통하여 토지피복변화에 따른 산림탄소저장량 변화를 정량적으로 이해할 수 있었으며, 향후 효율적인 산림관리에 기여할 수 있을 것으로 판단된다.

아파트 매매가 추이 예측에 관한 연구: 정부 정책, 경제, 수요·공급 속성을 중심으로 (A Study on the Forecasting Trend of Apartment Prices: Focusing on Government Policy, Economy, Supply and Demand Characteristics)

  • 이중목;최수안;우수한;김성훈;김태준;우종필
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.91-113
    • /
    • 2021
  • 한국 자산 시장에서 부동산이 가지는 영향력에도 불구하고 시장 추이 예측은 쉽지 않으며, 그중 아파트는 주거 공간인 동시에 투자 속성을 내포하고 있어 더욱 예측이 쉽지 않다. 아파트 가격에 영향을 주는 요인은 다양하며 지역적 특성 또한 고려되어야 한다. 본 연구는 서울시 전체, 강남 3구, 노원, 도봉, 강북, 금천, 관악, 구로구의 아파트 매매가에 영향을 미치는 요인과 특성을 비교하고 이를 기반으로 가격 예측의 가능성을 파악하기 위해 수행되었다. 분석에는 신경망, CHAID, 선형회귀, 랜덤포레스트 등 머신러닝 알고리즘이 사용되었다. 서울시 전체 아파트 평균 매매가에 가장 중요한 영향을 미치는 요소는 정부 정책 요소였으며, 거래규제 완화, 금융규제 완화 등의 완화 정책이 영향력이 높게 도출되었다. 강남 3구의 경우 정책의 영향력이 낮은 것으로 파악되었으며 강남구의 경우 주택 공급량이 가장 중요한 요인이었다. 반면 6개의 중·하위구들은 정부 정책이 중요 변수로 작용하였으며 공통적으로 금융규제 정책이 영향을 끼치는 요인이었다.

IoT Enabled Intelligent System for Radiation Monitoring and Warning Approach using Machine Learning

  • Muhammad Saifullah ;Imran Sarwar Bajwa;Muhammad Ibrahim;Mutyyba Asgher
    • International Journal of Computer Science & Network Security
    • /
    • 제23권5호
    • /
    • pp.135-147
    • /
    • 2023
  • Internet of things has revolutionaries every field of life due to the use of artificial intelligence within Machine Learning. It is successfully being used for the study of Radiation monitoring, prediction of Ultraviolet and Electromagnetic rays. However, there is no particular system available that can monitor and detect waves. Therefore, the present study designed in which IOT enables intelligence system based on machine learning was developed for the prediction of the radiation and their effects of human beings. Moreover, a sensor based system was installed in order to detect harmful radiation present in the environment and this system has the ability to alert the humans within the range of danger zone with a buzz, so that humans can move to a safer place. Along with this automatic sensor system; a self-created dataset was also created in which sensor values were recorded. Furthermore, in order to study the outcomes of the effect of these rays researchers used Support Vector Machine, Gaussian Naïve Bayes, Decision Trees, Extra Trees, Bagging Classifier, Random Forests, Logistic Regression and Adaptive Boosting Classifier were used. To sum up the whole discussion it is stated the results give high accuracy and prove that the proposed system is reliable and accurate for the detection and monitoring of waves. Furthermore, for the prediction of outcome, Adaptive Boosting Classifier has shown the best accuracy of 81.77% as compared with other classifiers.