• 제목/요약/키워드: decision trees

검색결과 295건 처리시간 0.028초

의사결정나무의 분기법 변화가 예측력에 미치는 영향 (The impact of the change in the splitting method of decision trees on the prediction power)

  • 장영재
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.517-525
    • /
    • 2022
  • 빅데이터 시대에 이르러 다양한 데이터 마이닝 기법이 주요 분석 방법론으로 제안되었다. 복잡 다양한 데이터가 양산되면서 데이터 마이닝 기법은 데이터 과학의 토대를 이루는 방법으로 부각되었다. 본고에서는 해석의 유용성과 예측력 향상의 측면 모두에 초점을 맞추어 다양한 실험 연구를 시행하였다. 구체적인 모형으로는 의사결정나무를 선택하였는데, 이는 실무적 사용 빈도가 높은 방법으로서 활용 폭이 넓을 뿐만 아니라 이해가 쉽고 성능평가가 용이한 방법론이기 때문이다. 의사결정나무모형을 대상으로 이 모형의 구조를 크게 변형시키지 않으면서도 예측력 향상의 목적을 이룰 수 있는 방법을 살펴보았으며 분기변수의 선택 방법이 모형의 성능에 미치는 영향을 분석하였다. 이 효과를 측정하기 위해서 다양한 모의실험 모델을 생성하고 분기법의 변화에 따른 예측력을 비교하였다. 비선형성을 지니면서 단일 분할을 통해서 하위 집합으로 명확하게 구분하기 어려운 복잡한 데이터의 경우에는 선형결합 분기방법이 예측력 제고에 도움을 주는 것으로 나타났다.

Fast Algorithm for Intra Prediction of HEVC Using Adaptive Decision Trees

  • Zheng, Xing;Zhao, Yao;Bai, Huihui;Lin, Chunyu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권7호
    • /
    • pp.3286-3300
    • /
    • 2016
  • High Efficiency Video Coding (HEVC) Standard, as the latest coding standard, introduces satisfying compression structures with respect to its predecessor Advanced Video Coding (H.264/AVC). The new coding standard can offer improved encoding performance compared with H.264/AVC. However, it also leads to enormous computational complexity that makes it considerably difficult to be implemented in real time application. In this paper, based on machine learning, a fast partitioning method is proposed, which can search for the best splitting structures for Intra-Prediction. In view of the video texture characteristics, we choose the entropy of Gray-Scale Difference Statistics (GDS) and the minimum of Sum of Absolute Transformed Difference (SATD) as two important features, which can make a balance between the computation complexity and classification performance. According to the selected features, adaptive decision trees can be built for the Coding Units (CU) with different size by offline training. Furthermore, by this way, the partition of CUs can be resolved as a binary classification problem. Experimental results have shown that the proposed algorithm can save over 34% encoding time on average, with a negligible Bjontegaard Delta (BD)-rate increase.

도심지 아스팔트 포장의 유지보수공법 의사결정 절차 개선 (Improvement of a Decision Tree for The Rehabilitation of Asphalt Pavement in City Road)

  • 박창규;김원재;김태우;이진욱;백종은;이현종
    • 한국도로학회논문집
    • /
    • 제20권3호
    • /
    • pp.27-37
    • /
    • 2018
  • PURPOSES : The objective of this study is to develop a pavement rehabilitation decision tree considering current pavement condition by evaluating severity and distress types such as roughness, cracking and rutting. METHODS : To improve the proposed overall rehabilitation decision tree, current decision tree from Korea and decision trees from other countries were summarized and investigated. The problem when applying the current rehabilitation method obtained from the decision tree applied in Seoul was further analyzed. It was found that the current decision trees do not consider different distress characteristics such as crack type, road types and functions. Because of this, different distress values for IRI, crack rate and plastic deformation was added to the proposed decision tree to properly recommend appropriate pavement rehabilitation. Utilizing the 2017 Seoul pavement management system data and considering all factors as discussed, the proposed overall decision tree was revised and improved. RESULTS :In this study, the type of crack was included to the decision tree. Meanwhile current design thickness and special asphalt mixture were studied and improved to be applied on different pavement condition. In addition, the improved decision tree was incorporated with the Seoul asphalt overlay design program. In the case of Seoul's rehabilitation budget, rehabilitation budget can be optimized if a 25mm milling and overlay thickness is used. CONCLUSIONS:A practical and theoretical evaluation tool in pavement rehabilitation design was presented and proposed for Seoul City.

Intercropping in Rubber Plantation Ontology for a Decision Support System

  • Phoksawat, Kornkanok;Mahmuddin, Massudi;Ta'a, Azman
    • Journal of Information Science Theory and Practice
    • /
    • 제7권4호
    • /
    • pp.56-64
    • /
    • 2019
  • Planting intercropping in rubber plantations is another alternative for generating more income for farmers. However, farmers still lack the knowledge of choosing plants. In addition, information for decision making comes from many sources and is knowledge accumulated by the expert. Therefore, this research aims to create a decision support system for growing rubber trees for individual farmers. It aims to get the highest income and the lowest cost by using semantic web technology so that farmers can access knowledge at all times and reduce the risk of growing crops, and also support the decision supporting system (DSS) to be more intelligent. The integrated intercropping ontology and rule are a part of the decision-making process for selecting plants that is suitable for individual rubber plots. A list of suitable plants is important for decision variables in the allocation of planting areas for each type of plant for multiple purposes. This article presents designing and developing the intercropping ontology for DSS which defines a class based on the principle of intercropping in rubber plantations. It is grouped according to the characteristics and condition of the area of the farmer as a concept of the rubber plantation. It consists of the age of rubber tree, spacing between rows of rubber trees, and water sources for use in agriculture and soil group, including slope, drainage, depth of soil, etc. The use of ontology for recommended plants suitable for individual farmers makes a contribution to the knowledge management field. Besides being useful in DSS by offering options with accuracy, it also reduces the complexity of the problem by reducing decision variables and condition variables in the multi-objective optimization model of DSS.

Decision Tree의 Test Cost 개선에 관한 연구 (A Study of Improving on Test Costs in Decision Trees)

  • 석현태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.223-225
    • /
    • 2002
  • Decision tree는 목표 데이터에 대한 계층적 관점을 보여준다는 의미에서 데이터를 보다 잘 이해하는데 많은 도움이 되나 탐욕법(greedy algorithm)에 의한 트리 생성법의 한계로 인해 최적의 예측자라고는 할 수가 없다. 이와 같은 약점을 보완하기 위하여 일반적 방법으로 생성한 decision tree에 대하여 다차원 연관규칙 알고리즘을 적용함으로써 짱은 길이의 최적 부분 규칙집합을 구하는 방법을 제시하였고 실험을 통해 그와 같은 사실을 확인하였다.

  • PDF

퍼지 결정 트리를 이용한 온라인 필기 문자의 계층적 인식 (An Application of Fuzzy Decision Trees for Hierarchical Recognition of Handwriting Symbols)

  • 전병환;김성훈;김재희
    • 전자공학회논문지B
    • /
    • 제31B권3호
    • /
    • pp.132-140
    • /
    • 1994
  • 온라인 필기 문자 인식 시스템 'SCRIPT(Symbol/Character Recognition In Pen-based Technology)'는 조합 가능한 모든 한글과 영어 대문자, 숫자, 그리고 키보드 부호 등 자연스럽게 필기되는 정자체 문자를 인식하기 위한 알고리듬이다. 필기 문자는 동일인이 쓰더라도 형태의 변화가 다양해서 정보의 불확실성을 지니게 된다. 그런데 기존의 결정 트리(decision tree)를 이용한 특징 분석 방법(feature analysis approach)은 효율적이지만 필기의 변형에 약하여 잘못된 선택을 하기 쉽기 때문에, 이러한 단점을 보완할 수 있는 방법이 필요하다. 이 논문에서는 패턴의 계층적(hierarchical)특성에 맞추어 획 자체의 형태와 획간의 위치 관계를 파악하기 위한 두 단계의 퍼지 결정 트리(fuzzy decision trees)를 사용하여 문자 패턴의 특징을 분석하는 방법을 제안한다. 이러한 방법은 다양한 가능성을 저장함으로써 형태의 변형에 강하고 이전의 잘못된 선택을 수정하기 쉬우며, 특히 하위 후보 패턴들에 의한 상위 패턴의 인식률 상승 효과가 매우 크다. 실헌 결과, 한글은 약 91%의 인식률과 약 0.33초의 인식 속도를 나타냈으며, 영어 및 기타 문자는 약 95%의 인식률과 약 0.08초의 인식 속도를 보였다. 이는 퍼지 결정 트리를 적용하지 않은 겨우에 비하여 인식률이 8~18% 정도 향상된 것이다.

  • PDF

중대사고관리전략의 평가를 위한 의사결정수목과 영향도에 관한 연구 (On the Tools of Decision Trees and Influence Diagrams for Assessing Severe Accident Management Strategies)

  • Moosung Jae;Park, Chang-Kue
    • Nuclear Engineering and Technology
    • /
    • 제26권2호
    • /
    • pp.168-178
    • /
    • 1994
  • 사고관리란 사고발생시에 이용가능한 모든 자원, 즉 인원과 설비를 효율적으로 활용함으로써 발전소를 안전상태로 회복시키거나 사고의 피해를 완화시키기 위한 제반 활동을 말한다. 사고관리의 접근방식은 첫째, 후보사고관리방안의 사전 평가, 둘째, 효과적으로 적절한 조치를 수행하게 하는 세부 절차서의 개발, 그리고 셋째, 그러한 조치수행에 필요한 도구와 자원의 준비, 실현 가능한 원전 시스템의 변경등을 포함한다. 사고관리 전략을 평가할 때에는 그 전략의 효율성분만 아니라 부작용, 타당성, 필요한 정보, 기존 절차서와의 양립성 등을 종합적으로 고려하여야 한다. 이 논문의 목적은 여러가지 사고관리 전략을 모델링하고 평가하기위한 체제를 개발하기 위한 의사결정 수목과 영향도의 해석도구를 소개하는 것이다. 이 해석도구와 관련한 여러가지 특징들이 제시되었으며 이 해석도구에 근거하여 세워진 사고관리전략의 평가체제가 간단한 예제문제에 적용되었다.

  • PDF

A Decision Tree Algorithm using Genetic Programming

  • Park, Chongsun;Ko, Young Kyong
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.845-857
    • /
    • 2003
  • We explore the use of genetic programming to evolve decision trees directly for classification problems with both discrete and continuous predictors. We demonstrate that the derived hypotheses of standard algorithms can substantially deviated from the optimum. This deviation is partly due to their top-down style procedures. The performance of the system is measured on a set of real and simulated data sets and compared with the performance of well-known algorithms like CHAID, CART, C5.0, and QUEST. Proposed algorithm seems to be effective in handling problems caused by top-down style procedures of existing algorithms.

Object Classification Method Using Dynamic Random Forests and Genetic Optimization

  • Kim, Jae Hyup;Kim, Hun Ki;Jang, Kyung Hyun;Lee, Jong Min;Moon, Young Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.79-89
    • /
    • 2016
  • In this paper, we proposed the object classification method using genetic and dynamic random forest consisting of optimal combination of unit tree. The random forest can ensure good generalization performance in combination of large amount of trees by assigning the randomization to the training samples and feature selection, etc. allocated to the decision tree as an ensemble classification model which combines with the unit decision tree based on the bagging. However, the random forest is composed of unit trees randomly, so it can show the excellent classification performance only when the sufficient amounts of trees are combined. There is no quantitative measurement method for the number of trees, and there is no choice but to repeat random tree structure continuously. The proposed algorithm is composed of random forest with a combination of optimal tree while maintaining the generalization performance of random forest. To achieve this, the problem of improving the classification performance was assigned to the optimization problem which found the optimal tree combination. For this end, the genetic algorithm methodology was applied. As a result of experiment, we had found out that the proposed algorithm could improve about 3~5% of classification performance in specific cases like common database and self infrared database compare with the existing random forest. In addition, we had shown that the optimal tree combination was decided at 55~60% level from the maximum trees.

탄소가치를 고려한 소나무림의 최적관리 방안 (The Optimal Harvest Scheme for Pine Trees When Carbon Value Is Considered)

  • 이상민
    • 한국산학기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.1164-1170
    • /
    • 2013
  • 나무는 대기 중의 탄소를 흡수하기 때문에 산림은 목재의 생산지로서만 아니라 탄소저장고로 고려되어야한다. 이 연구는 산림의 탄소흡수 역할을 고려한 최적 벌채연령을 찾는 데 중점을 두고 있다. 관리방법별 연령별 재적자료를 이용하였으며, 문제해결을 위해 다이나믹프로그래밍을 적용하였다. 그 결과 벌채연령은 탄소의 가치를 고려하지 않은 경우보다 늘어나는 것으로 분석되었다. 그러나 정부가 규정하는 국유림 소나무에 대한 벌채연령보다는 짧은 것으로 나타났다. 따라서 국유림 소나무에 대한 정부의 관리에는 탄소흡수에 대한 가치뿐만 아니라 다른 공익적 가치가 포함되어 있다고 판단할 수 있다. 반면 사유림에 대한 규정은 적정 벌채연령보다 짧은 것으로 나타났으며, 이로 인해 사유림경영에 비효율성을 초래할 수 있다.