• 제목/요약/키워드: Decision tree

검색결과 1,629건 처리시간 0.041초

실시간 기계 상태 데이터베이스에서 데이터 마이닝을 위한 적응형 의사결정 트리 알고리듬 (Adaptive Decision Tree Algorithm for Data Mining in Real-Time Machine Status Database)

  • 백준걸;김강호;김성식;김창욱
    • 대한산업공학회지
    • /
    • 제26권2호
    • /
    • pp.171-182
    • /
    • 2000
  • For the last five years, data mining has drawn much attention by researchers and practitioners because of its many applicable domains. This article presents an adaptive decision tree algorithm for dynamically reasoning machine failure cause out of real-time, large-scale machine status database. Among many data mining methods, intelligent decision tree building algorithm is especially of interest in the sense that it enables the automatic generation of decision rules from the tree, facilitating the construction of expert system. On the basis of experiment using semiconductor etching machine, it has been verified that our model outperforms previously proposed decision tree models.

  • PDF

데이터마이닝을 위한 동적 결정나무 (Dynamic Decision Tree for Data Mining)

  • 최병수;차운옥
    • Communications for Statistical Applications and Methods
    • /
    • 제16권6호
    • /
    • pp.959-969
    • /
    • 2009
  • 결정나무는 데이터마이닝에서 데이터를 분류하는 기법으로 가장 많이 사용되고 있으며, 데이터 탐색 소프트웨어 DAVIS에서는 동적 기능을 사용하여 데이터 시각화를 하는 것이 가능하다. 본 논문에서는 동적 데이터 분석의 기본 원리와 이를 결정나무에 적용하는 방법을 소개하고, 생성되는 동적 결정나무의 효율성과 유용성을 실제 데이터를 사용하여 분석한다.

Decision Tree 분류기를 사용한 심전도 데이터 정확도 향상에 관한 연구 (A research on improving correctness of cardiac disorder data by using the Decision Tree Classifier)

  • 이현주;신동일;신동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.507-509
    • /
    • 2012
  • 심전도 질환 데이터는 일반적으로 분류기를 사용한 실험이 많다. 심전도 신호는 QRS-Complex와 R-R interval을 추출하는 경우가 많은데 본 실험에서는 R-R interval을 추출하여 실험하였다. 심전도 데이터의 분류 실험은 일반적으로 SVM(Support Vector Machine)과 MLP(Multilayer Perceptron)으로 실험되지만 본 실험은 Decision Tree를 사용하여 정확도 향상을 추구하였다. 그리고 정확도 비교 분석을 위해 SVM과 MLP 분류기 실험을 같이 수행하였고, 동일한 데이터와 간격으로 실험한 타 논문의 결과와 비교해 보았다. Decision Tree를 다른 분류기와 타 논문의 결과와 비교해 보니 정확도 부분에서는 Decision Tree가 가장 우수하였다.

의사결정나무법을 이용한 체질진단에 관한 연구 (A study of constitution diagnosis using decision tree method)

  • 이영섭;박성식;박은경
    • 사상체질의학회지
    • /
    • 제13권2호
    • /
    • pp.144-155
    • /
    • 2001
  • By the increasing concern about Sasang Constitution Medicine, its practical use is considered very important in disease prevention and medical treatment. However, the method of constitution classification is depending on the doctor's clinical trials because of the lack of the objective test criteria. This study is trying to improve the objectiveness of diagnosis using a new statistical method, decision tree. Decision tree method-a classification technique in the statistical analysis- was used to analyze the result of QSCCII instead of using discriminant analysis. As a result, 16 among 121 QSCCII questions was selected as important questions and 21 terminal nodes was built to classify the constitution. Using only 16 questions shown in the result of decision tree, we can diagnose and interpret the constitution easily and effectively.

  • PDF

적응형 결정 트리를 이용한 국소 특징 기반 표정 인식 (Local Feature Based Facial Expression Recognition Using Adaptive Decision Tree)

  • 오지훈;반유석;이인재;안충현;이상윤
    • 한국통신학회논문지
    • /
    • 제39A권2호
    • /
    • pp.92-99
    • /
    • 2014
  • 본 논문은 결정 트리(Decision tree) 구조를 기반으로 한 표정 인식 방법을 제안한다. ASM(Active Shape Model)과 LBP(Local Binary Pattern)를 통해, 표정 영상들의 국소 특징들을 추출한다. 국소 특징들로부터 표정들을 잘 분류할 수 있는 판별 특징(Discriminant feature)들을 추출하고, 그 판별 특징들은 모든 조합의 각 두 가지 표정들을 분류시킨다. 분류를 통해 얻어진 정인식의 합을 통해, 정인식 최대화 기반 국소 영역과 표정 조합을 결정한다. 이 가지 분류들을 종합하여, 결정 트리를 생성한다. 이 결정 트리 기반 표정 인식률은 약 84.7%로, 결정 트리를 고려하지 않은 방법보다, 더 좋은 인식 성능을 보였다.

효율적인 교통관리를 위한 혼잡상황변화 유형 분류기법 개발 (Classification Method of Congestion Change Type for Efficient Traffic Management)

  • 심상우;이환필;이규진;최기주
    • 한국도로학회논문집
    • /
    • 제16권4호
    • /
    • pp.127-134
    • /
    • 2014
  • PURPOSES : To operate more efficient traffic management system, it is utmost important to detect the change in congestion level on a freeway segment rapidly and reliably. This study aims to develop classification method of congestion change type. METHODS: This research proposes two classification methods to capture the change of the congestion level on freeway segments using the dedicated short range communication (DSRC) data and the vehicle detection system (VDS) data. For developing the classification methods, the decision tree models were employed in which the independent variable is the change in congestion level and the covariates are the DSRC and VDS data collected from the freeway segments in Korea. RESULTS : The comparison results show that the decision tree model with DSRC data are better than the decision tree model with VDS data. Specifically, the decision tree model using DSRC data with better fits show approximately 95% accuracies. CONCLUSIONS : It is expected that the congestion change type classified using the decision tree models could play an important role in future freeway traffic management strategy.

격자탐색법을 이용한 의사결정나무 분석 최적 모형 선택 : 직장예비군 지휘관의 직장만족도에 대한 영향 요인 분석을 중심으로 (Selection of the Optimal Decision Tree Model Using Grid Search Method : Focusing on the Analysis of the Factors Affecting Job Satisfaction of Workplace Reserve Force Commanders)

  • 정철우;정원영;신다윗
    • 한국경영과학회지
    • /
    • 제40권2호
    • /
    • pp.19-29
    • /
    • 2015
  • The purpose of this study is to suggest the grid search method for selecting an optimal decision tree model. It chooses optimal values for the maximum depth of tree and the minimum number of observations that must exist in a node in order for a split to be attempted. Therefore, the grid search method guarantees building a decision tree model that shows more precise and stable classifying performance. Through empirical analysis using data of job satisfaction of workplace reserve force commanders, we show that the grid search method helps us generate an optimal decision tree model that gives us hints for the improvement direction of labor conditions of Korean workplace reserve force commanders.

Feature Selection and Hyper-Parameter Tuning for Optimizing Decision Tree Algorithm on Heart Disease Classification

  • Tsehay Admassu Assegie;Sushma S.J;Bhavya B.G;Padmashree S
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.150-154
    • /
    • 2024
  • In recent years, there are extensive researches on the applications of machine learning to the automation and decision support for medical experts during disease detection. However, the performance of machine learning still needs improvement so that machine learning model produces result that is more accurate and reliable for disease detection. Selecting the hyper-parameter that could produce the possible maximum classification accuracy on medical dataset is the most challenging task in developing decision support systems with machine learning algorithms for medical dataset classification. Moreover, selecting the features that best characterizes a disease is another challenge in developing machine-learning model with better classification accuracy. In this study, we have proposed an optimized decision tree model for heart disease classification by using heart disease dataset collected from kaggle data repository. The proposed model is evaluated and experimental test reveals that the performance of decision tree improves when an optimal number of features are used for training. Overall, the accuracy of the proposed decision tree model is 98.2% for heart disease classification.

주변조건부 변수를 이용한 의사결정나무모형 생성에 관한 연구 (A study on decision tree creation using marginally conditional variables)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.299-307
    • /
    • 2012
  • 데이터마이닝은 주어진 데이터베이스에서 항목간의 흥미로운 관계를 찾아내는 기법으로서 의사결정나무는 데이터마이닝의 대표적인 알고리즘이라고 할 수 있다. 의사결정나무는 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법이다. 일반적으로 연구자가 의사결정나무 모형을 생성 할 때 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 한다. 특히 의사결정나무 모형에서 입력 변수의 수가 많을 경우 생성된 모형은 복잡한 형태가 될 수 있고, 모형 분석이 어려울 수도 있다. 만일 입력변수에서 주변조건부 변수 (매개변수, 외적변수)가 존재한다면 이 입력변수는 직접적인 관련성이 없는 것으로 판단한다. 이에 본 논문에서는 주변조건부 변수를 고려하여 의사결정나무모형을 생성하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.