• Title/Summary/Keyword: Random Forest

검색결과 1,072건 처리시간 0.034초

임목재적(林木材積) 산정(算定)을 위(爲)한 Simple Random Sampling과 Two-stage P.P.S. Sampling 방법(方法)의 비교(比較) (Comparison of Simple Random Sampling and Two-stage P.P.S. Sampling Methods for Timber Volume Estimation)

  • 김재수
    • 한국산림과학회지
    • /
    • 제65권1호
    • /
    • pp.68-73
    • /
    • 1984
  • Simple random sampling과 P.P.S. sampling의 효율을 비교하기 위하여 오스트리아 Salzburg 부근의 침엽수 장령림 임분에서 임목조사를 실시하였다. 축적 1:10,000의 흑백 적외선 사진을 판독하여, 조사 임지를 제지, 유령림, 너도 밤나무 장령림, 침엽수 장령림으로 구분하고, 침엽수 장령림 내에서 random sampling에 의한 99개의 표본점과 P.P.S. sampling에 의한 75개의 표본점을 흉고 단면적 제수 4인 Relascope에 의하여 야외 조사한 자료를 비교한 결과는 다음과 같다. 1) random sampling에 의한 임분 재적의 추정치는 $422.0m^3/ha$이었고, P.P.S. sampling에 의해서는 $433.5m^3/ha$이었으나 이들간의 통계적 유의성은 없었다. 2) 5 %의 허용 오차내에서는 P.P.S. sampling에 의하여는 170점, random sampling에 의하여는 237점이 필요하였다. 3) P.P.S. sampling은 random sampling에 비하여 야외 조사 시간을 17% 감소시킬 수 있었다.

  • PDF

가중치 기반 Bag-of-Feature와 앙상블 결정 트리를 이용한 정지 영상에서의 인간 행동 인식 (Human Action Recognition in Still Image Using Weighted Bag-of-Features and Ensemble Decision Trees)

  • 홍준혁;고병철;남재열
    • 한국통신학회논문지
    • /
    • 제38A권1호
    • /
    • pp.1-9
    • /
    • 2013
  • 본 논문에서는 CS-LBP (Center-Symmetric Local Binary Pattern) 특징과 공간 피라미드를 이용한 BoF (Bag of Features)를 생성하고 이를 랜덤 포레스트(Random Forest) 분류기에 적용하여 인간의 행동을 인식하는 알고리즘을 제안한다. BoF를 생성하기 위해 영상을 균일한 패치로 나누고, 각 패치 마다 CS-LBP 특징을 추출한다. 행동 분류 성능을 향상시키기 위해 패치들마다 추출한 특징벡터들에 대해 K-mean 클러스터링을 적용하여 코드 북을 생성한다. 본 논문에서는 영상의 지역적인 특성을 고려하기 위해 공간 피라미드 방법을 적용하고 각 공간 레벨에서 추출된 BoF에 대해 가중치를 적용하여 최종적으로 하나의 특징 벡터로 결합한다. 행동 분류를 위해 결정트리의 앙상블로 이루어진 랜덤 포레스트는 학습 단계에서 각 행동 클래스를 위한 분류 모델을 만든다. 가중 BoF가 적용된 랜덤 포레스트는 다양한 인간 행동 영상을 포함하고 있는 Standford Actions 40 데이터를 성공적으로 분류하였다. 또한 기존 방법에 비해 분류 성능이 유사하거나 우수하며, 한 장의 영상에 대해 빠른 인식속도를 보였다.

Default Prediction of Automobile Credit Based on Support Vector Machine

  • Chen, Ying;Zhang, Ruirui
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.75-88
    • /
    • 2021
  • Automobile credit business has developed rapidly in recent years, and corresponding default phenomena occur frequently. Credit default will bring great losses to automobile financial institutions. Therefore, the successful prediction of automobile credit default is of great significance. Firstly, the missing values are deleted, then the random forest is used for feature selection, and then the sample data are randomly grouped. Finally, six prediction models of support vector machine (SVM), random forest and k-nearest neighbor (KNN), logistic, decision tree, and artificial neural network (ANN) are constructed. The results show that these six machine learning models can be used to predict the default of automobile credit. Among these six models, the accuracy of decision tree is 0.79, which is the highest, but the comprehensive performance of SVM is the best. And random grouping can improve the efficiency of model operation to a certain extent, especially SVM.

Random Forest Model for Silicon-to-SPICE Gap and FinFET Design Attribute Identification

  • Won, Hyosig;Shimazu, Katsuhiro
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권5호
    • /
    • pp.358-365
    • /
    • 2016
  • We propose a novel application of random forest, a machine learning-based general classification algorithm, to analyze the influence of design attributes on the silicon-to-SPICE (S2S) gap. To improve modeling accuracy, we introduce magnification of learning data as well as randomization for the counting of design attributes to be used for each tree in the forest. From the automatically generated decision trees, we can extract the so-called importance and impact indices, which identify the most significant design attributes determining the S2S gap. We apply the proposed method to actual silicon data, and observe that the identified design attributes show a clear trend in the S2S gap. We finally unveil 10nm key fin-shaped field effect transistor (FinFET) structures that result in a large S2S gap using the measurement data from 10nm test vehicles specialized for model-hardware correlation.

역전파가 필요없는 시계열 다층 랜덤 포레스트와 산불 조기 감지의 응용 (Time series Multilayered Random Forest Without Backpropagation and Application of Forest Fire Early Detection)

  • 김상원;구스타보 산체즈;고병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.660-661
    • /
    • 2020
  • 본 논문에서는 기존 인공 신경망 기반 시계열 학습 기법인 Recurrent Neural Network (RNN)의 많은 연산량 및 고 사양 시스템 요구를 개선하기 위해 랜덤 포레스트 (Random Forest)기반의 새로운 시계열 학습 기법을 제안한다. 기존의 RNN 기반 방법들은 복잡한 연산을 통해 높은 성능을 달성하는 데 집중하고 있다. 이러한 방법들은 학습에 많은 파라미터가 필요할 뿐만 아니라 대규모의 연산을 요구하므로 실시간 시스템에 적용하는데 어려움이 있다. 따라서 본 논문에서는, 효율적이면서 빠르게 동작할 수 있는 시계열 다층 랜덤 포레스트(Time series Multilayered Random Forest)를 제안하고 산불 조기 탐지에 적용해 기존 RNN 계열의 방법들과 성능을 비교하였다. 다양한 산불화재 실험데이터에 알고리즘을 적용해본 결과 GPU 상에서 방대한 연산을 수행하는 RNN 기반 방법들과 비교해 성능적인 한계가 존재했지만 CPU 에서도 빠르게 동작 가능하므로 성능의 개선을 통해 다양한 임베디드 시스템에 적용 가능하다.

  • PDF

리지나뿌리썩음병균 분리주들의 배양 특성 및 RAPD에 의한 유전적 다양성 분석 (Cultural Characteristics and Genetic Diversity of Rhizina undulata Isolates by Random Amplified Polymorphic DNA(RAPD))

  • 이상용;이선근;이종규;김경희;이승규
    • 한국산림과학회지
    • /
    • 제95권4호
    • /
    • pp.388-392
    • /
    • 2006
  • 국내에 분포하는 리지나뿌리썩음병균(Rhizina undulata)의 생리적 특성 및 유전적 다양성을 밝히기 위하여, 소나무(Pinus densiflora) 및 곰솔(P. thunbergii) 림으로부터 분리한 13종의 리지나뿌리썩음병균 분리주를 공시하여 각 분리주들의 배양 특성 및 RAPD에 의한 유전적 다양성을 분석하였다. P. densiflora 및 P. thunbergii로부터 제조한 수용성 추출물 첨가배지에서의 각 분리주들의 균사생장 특성을 조사한 결과, 각 분리주들의 기주와 분리주들의 기주로 부터 추출한 수용성 추출물 배지에서의 균사생장량 간에는 상관관계를 발견할 수 없었다. 한편, 12종의 random primer를 사용하여 R. undulata 분리주들의 genomic DNA의 random amplified polymorphic DNA(RAPD)에 의한 유전적 다양성을 분석한 결과, 국내 분리주들의 RAPD profile은 모두 동일하였다. 그러나, 국내 분리주들의 RAPD profile과 일본 분리주와는 다소 차이를 나타내었는데 즉, RAPD profile의 phylogenetic tree 분석 결과, 국내 분리주들과 일본분리주와는 88%의 상동성을 나타내었다.

GeoAI-Based Forest Fire Susceptibility Assessment with Integration of Forest and Soil Digital Map Data

  • Kounghoon Nam;Jong-Tae Kim;Chang-Ju Lee;Gyo-Cheol Jeong
    • 지질공학
    • /
    • 제34권1호
    • /
    • pp.107-115
    • /
    • 2024
  • This study assesses forest fire susceptibility in Gangwon-do, South Korea, which hosts the largest forested area in the nation and constitutes ~21% of the country's forested land. With 81% of its terrain forested, Gangwon-do is particularly susceptible to wildfires, as evidenced by the fact that seven out of the ten most extensive wildfires in Korea have occurred in this region, with significant ecological and economic implications. Here, we analyze 480 historical wildfire occurrences in Gangwon-do between 2003 and 2019 using 17 predictor variables of wildfire occurrence. We utilized three machine learning algorithms—random forest, logistic regression, and support vector machine—to construct wildfire susceptibility prediction models and identify the best-performing model for Gangwon-do. Forest and soil map data were integrated as important indicators of wildfire susceptibility and enhanced the precision of the three models in identifying areas at high risk of wildfires. Of the three models examined, the random forest model showed the best predictive performance, with an area-under-the-curve value of 0.936. The findings of this study, especially the maps generated by the models, are expected to offer important guidance to local governments in formulating effective management and conservation strategies. These strategies aim to ensure the sustainable preservation of forest resources and to enhance the well-being of communities situated in areas adjacent to forests. Furthermore, the outcomes of this study are anticipated to contribute to the safeguarding of forest resources and biodiversity and to the development of comprehensive plans for forest resource protection, biodiversity conservation, and environmental management.

부정맥 증상을 자동으로 판별하는 Random Forest 분류기의 정확도 향상을 위한 수정 알고리즘에 대한 연구 (Research on the modified algorithm for improving accuracy of Random Forest classifier which identifies automatically arrhythmia)

  • 이현주;신동규;박희원;김수한;신동일
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.341-348
    • /
    • 2011
  • 생체신호의 한 분야인 심전도는 분류알고리즘을 사용한 실험이 일반적이다. 심전도를 실험한 논문에서 사용된 분류알고리즘은 대부분 SVM(Support Vector Machine), MLP(Multilayer Perceptron) 이었으나, 본 실험은 Random Forest 분류기를 시도하였다. 실험방법은 Random Forest 알고리즘을 실험데이터의 신호의 특징에 기반하여 분석하도록 수정하였고, 분류기의 수정된 알고리즘 성능을 규명하기 위하여 SVM과 MLP 분류기와 정확도를 비교 분석하였다. 실험에서는 심전도 신호의 R-R interval을 추출하여 시행하였으며 또한 동일한 데이터를 사용한 타 논문의 결과와 본 실험의 결과를 비교 분석하였다. 결과는 수정된 Random Forest 분류기가 SVM, MLP 분류기, 그리고 타 실험의 결과보다 정확도 부분에서는 우수한 결과를 도출하였다. 본 실험의 전처리 과정에서는 대역통과필터를 사용하여 R-R interval을 추출하였다. 그러나 심전도 실험에서는 대역통과 필터 뿐 아니라, 웨이블릿 변환, 메디안 필터, 유한 임펄스 필터 등으로 실험하는 경우가 많다. 따라서 향후에는 전처리과정에서 기저선 잡음(baseline wandering)을 효율적으로 제거하는 필터의 선택이 필요하며, R-R interval을 정확하게 추출할 수 있는 방법에 대한 연구가 필요하다고 사려된다.

기계학습을 활용한 주택매도 결정요인 분석 및 예측모델 구축 (Using Mechanical Learning Analysis of Determinants of Housing Sales and Establishment of Forecasting Model)

  • 김은미;김상봉;조은서
    • 지적과 국토정보
    • /
    • 제50권1호
    • /
    • pp.181-200
    • /
    • 2020
  • 본 연구는 OLS모형을 적용하여 주택보유기간에 영향을 미치는 결정요인을 추정한 후 SVM, Decision Tree, Random Forest, Gradient Boosting, XGBoost, LightGBM을 통해 각 모형별 예측력을 비교하였다. 예측력이 가장 높은 모델을 기반모델 삼아 앙상블 모형 중 하나인 Stacking모형을 적용하여 더욱 예측력이 높은 모형을 구축하여 주택시장의 주택거래량을 파악할 수 있다는 점에 선행 연구와의 차이가 있다. OLS분석 결과 매도이익, 주택가격, 가구원 수, 거주주택형태(단독주택, 아파트)이 주택보유기간에 영향을 미치는 것으로 나타났으며, RMSE를 기준삼아 각 머신러닝 모형과 예측력 비교한 결과 머신러닝 모델의 예측력이 더 높은 것으로 나타났다. 이후, 영향을 미치는 변수로 데이터를 재구축한 후 각 머신러닝을 적용하여 예측력을 비교하였으며, 분석 결과 Random Forest의 예측력이 가장 우수한 것으로 나타났다. 또한 예측력이 가장 높은 Random Forest, Decision Tree, Gradient Boosting, XGBoost모형을 개별모형으로 적용하고, Linear, Ridge, Lasso모형을 메타모델로 하여 Stacking 모형을 구축하였다. 분석 결과, Ridge모형일 때 RMSE값이 0.5181으로 가장 낮게 나타나 예측력이 가장 높은 모델을 구축하였다.