• Title/Summary/Keyword: CART 알고리즘

Search Result 64, Processing Time 0.026 seconds

회귀나무에서 변수선택 편의에 관한 연구

  • Kim, Min-Ho;Kim, Jin-Heum
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.263-268
    • /
    • 2003
  • Breiman, Friedman, Olshen and Stone(1984)의 전체탐색법에 의한 회귀나무는 상대적으로 많은 분리가 가능한 변수로 분리기준이 정해지는 편의 현상을 갖고 있다. 본 연구에서는 이런 문제점을 해결할 수 있는 알고리즘을 제안하여 변수선택편의가 없는 회귀나무를 만들고자 한다. 제안하는 알고리즘은 노드의 분리변수를 선택하는 단계와 그 선택된 변수에 의해 이진분리를 위한 분리점을 찾는 단계로 구성되어 있다. 예측변수 중에서 목표변수와 가장 밀접하게 연관된 예측변수는 예측변수의 자료의 종류에 따라 스피어만의 순위상관계수에 의한 검정 혹은 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 가장 통계적으로 유의한 변수로 선택하였고, 선택된 변수에만 Breiman et al.(1984)의 전체선택법을 적용하여 분리점을 결정하였다. 모의실험을 통해 변수선택편의, 변수선택력 , 그리고 평균제곱오차 측면에서 Breiman et al. (1984)의 CART(Classification and Regression Trees)와 제안한 알고리즘을 서로 비교하였다. 또한, 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

  • PDF

Neuro-Fuzzy System and Its Application Using CART Algorithm and Hybrid Parameter Learning (CART 알고리즘과 하이브리드 학습을 통한 뉴로-퍼지 시스템과 응용)

  • Oh, B.K.;Kwak, K.C.;Ryu, J.W.
    • Proceedings of the KIEE Conference
    • /
    • 1998.07b
    • /
    • pp.578-580
    • /
    • 1998
  • The paper presents an approach to the structure identification based on the CART (Classification And Regression Tree) algorithm and to the parameter identification by hybrid learning method in neuro-fuzzy system. By using the CART algorithm, the proposed method can roughly estimate the numbers of membership function and fuzzy rule using the centers of decision regions. Then the parameter identification is carried out by the hybrid learning scheme using BP (Back-propagation) and RLSE (Recursive Least Square Estimation) from the numerical data. Finally, we will show it's usefulness for fuzzy modeling to truck backer upper control.

  • PDF

Comparison of factors affecting residential and residential environment satisfaction by region using the CART algorithm (CART 알고리즘을 이용한 지역별 주택 및 주거환경 만족도 영향 요인의 비교)

  • Jung su eun
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.4
    • /
    • pp.707-715
    • /
    • 2023
  • This study utilized CART algorithm, a decision tree analysis method, to comparatively analyze factors affecting housing and residential environment satisfaction by region using data from Ministry of Land, Infrastructure and Transport's housing survey in 2020. First, in terms of residential environment satisfaction, accessibility to medical facilities and school district showed higher importance in metropolitan cities and areas compared to other regions, whereas safety from accident showed the opposite trait, showing difference between region. Second, housing characteristics were important in housing satisfaction, indoor environment level satisfaction and indoor safety and hygiene being important in almost all regions, while residential environment characteristics were more important in residential environment satisfaction and influencing factors were relatively evenly distributed. In order to generalize these regional characteristics, research using time series data needs to be conducted later.

A Study on the Comparison of Classification Models′ Performance (분류모델의 성과 비교에 관한 연구)

  • 김신곤;박성용
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.203-214
    • /
    • 1999
  • 본 연구는 A카드 회사에서 현재 실시하고 텔레마케팅 시스템에 데이터마이닝 기법 가운데 하나인 CHAID, CART 알고리즘 및 신경망 기법을 적용하여 모텔을 개발하고 개발된 모델들의 성과를 분석한다. 이를 통하여 어떻게 기업이 데이터베이스와 데이터마이닝 기법을 마케팅에 효과적으로 사용할 수 있는가에 대한 방안을 제시하고 여러 모델들의 성과를 비교 분석하는 방안을 함께 제시한다.

  • PDF

A Comparative Study on The Effective Use of Decision Tree Algorithms (의사결정 트리의 효용성 제고 방안에 관한 비교 연구)

  • Sug, Hyon-Tai
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.321-324
    • /
    • 2009
  • 비교적 적은 크기이면서 예측력에 있어 만족할 만한 의사결정목을 생성하는 방법으로서 적절한 크기의 샘플링을 제안하였다. 일반적으로 샘플의 크기가 작을수록 작은 의사결정목이 생성되므로 적절한 예측 정확도를 갖는 작은 트리를 생성하기를 원할 경우 적당한 크기의 샘플링을 하는 것이 트리의 최적화를 위한 계산을 더 시행하는 것보다 바람직하다고 할 수 있으며, 이와 같은 사실은 현재 알려진 가장 대표적 의사결정목 생성 알고리즘인 C4.5 및 CART를 사용하여 실험으로서 보여주었다.

  • PDF

A Study on the Comparison of Classification Models Performance (분류모델의 성과 비교에 관한 연구)

  • 김신곤;박성용
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.203-214
    • /
    • 1999
  • 본 연구는 A카드 회사에서 현재 실시하고 텔레마케팅 시스템에 데이터마이닝 기법 가운데 하나인 CHAID, CART 알고리즘 및 신경망 기법을 적용하여 모델을 개발하고 개발괸 모델들의 성과를 분석한다. 이를 통하여 어떻게 기업이 데이터베이스와 데이터마이닝 기법을 마케팅에 효과적으로 사용할 수 있는가에 대한 방안을 제시하고 여러 모델들의 성과를 비교 분석하는 방안을 함께 제시한다.

  • PDF

A Study of The Determinants of Turnover Intention and Organizational Commitment by Data Mining (데이터마이닝을 활용한 이직의도와 조직몰입의 결정요인에 대한 연구)

  • Choi, Young Joon;Shim, Won Shul;Baek, Seung Hyun
    • Journal of the Korea Society for Simulation
    • /
    • v.23 no.1
    • /
    • pp.21-31
    • /
    • 2014
  • In this article, data mining simulation is applied to find a proper approach and results of analysis for study of variables related to organization. Also, turnover intention and organizational commitment are used as target (dependent) variables in this simulation. Classification and regression tree (CART) with ensemble methods are used in this study for simulation. Human capital corporate panel data of Korea Research Institute for Vocation Education & Training (KRIVET) is used. The panel data is collected in 2005, 2007, and 2009. Organizational commitment variables are analyzed with combined measure variables which are created after investigation of reliability and single dimensionality for multiple-item measurement details. The results of this study are as follows. First, major determinants of turnover intention are trust, communication, and talent management-oriented trend. Second, the main determining factors for organizational commitment are trust, the number of years worked, innovation, communication. CART with ensemble methods has two ensemble CART methods which are CART with Bagging and CART with Arcing. Comparing two methods, CART with Arcing (Arc-x4) extracted scenarios with very high coefficients of determination. In this study, a scenario with maximum coefficient of determinant and minimum error is obtained and practical implications are presented. Using one of data mining methods, CART with ensemble method. Also, the limitation and future research are discussed.

Control of Flexible Joint Cart based Inverted Pendulum using LQR and Fuzzy Logic System (LQR-퍼지논리제어기에 의한 2중 차량 구조 역진자 시스템의 제어)

  • Xu, Yue;Choi, Byung-Jae
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.23 no.3
    • /
    • pp.268-274
    • /
    • 2013
  • Any new method for controlling a nonlinear system has widely been reported. An inverted pendulum system has typically been used as a target system for demonstrating its usefulness. In this paper, we propose an algorithm to control a flexible joint cart based inverted pendulum system. Two carts are connected with a spring and one is a driving cart and the other is no driving cart with a pole. We here present a system modeling and a good fuzzy logic based control algorithm. We also introduce LQR (Linar Quadratic Regulator) technique for reducing the number of control variables. By using this technique, the number of input variables for a fuzzy logic controller is become only two not six. So the computational complexity is largely reduced. Moreover, a two-input fuzzy logic controller has a control rule table with a skew-symmetric property. And it will lead the design of a single-input fuzzy logic controller. In order to demonstrate the usefulness of the proposed method and prove the superiority of the proposed method, some computer simulations are presented.

A Study on Construction of an Expert System for Enhancement of Industrial Safety (산업안전 향상을 위한 전문가 시스템 구축에 관한 연구)

  • Leem, Young-Moon;Choi, Yo-Han
    • Proceedings of the Safety Management and Science Conference
    • /
    • 2005.11a
    • /
    • pp.324-327
    • /
    • 2005
  • 급속도로 발전하는 산업의 고도화와 이에 따른 업종의 다양화, 이에 동반되는 예상치 못한 산업재해는 불특정 다수에게 인적, 물적 피해를 야기 시키고 있다. 산업재해 예방을 위해 다양한 선행 연구들이 진행되었으나 이들 연구는 기존의 산업재해 데이터를 토대로 빈도분석, 비교분석을 통한 관리적, 교육적 등치 대책만을 제시하고 있다. 본 연구에서는 산업재해 예방을 위해 객관적이고 정량화된 데이터를 통한 예측 분석이 가능한 데이터마이닝을 적용하여 대표적인 기법인 의사결정나무의 CHAID, CART, C4.5, QUEST 4가지 알고리즘 비교분석하여 산업재해 예방 및 전문가 시스템 구축을 위해 적용할 수 있는 최적의 알고리즘을 제시하도록 한다.

  • PDF

Enhancement of Text Classification Method (텍스트 분류 기법의 발전)

  • Shin, Kwang-Seong;Shin, Seong-Yoon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2019.05a
    • /
    • pp.155-156
    • /
    • 2019
  • Traditional machine learning based emotion analysis methods such as Classification and Regression Tree (CART), Support Vector Machine (SVM), and k-nearest neighbor classification (kNN) are less accurate. In this paper, we propose an improved kNN classification method. Improved methods and data normalization achieve the goal of improving accuracy. Then, three classification algorithms and an improved algorithm were compared based on experimental data.

  • PDF