• Title/Summary/Keyword: 결정나무

Search Result 792, Processing Time 0.033 seconds

A technology of structure information of decision tree transfered in distributed environment (분산 환경에서 전송되는 의사결정나무 구조 정보 표현 기술)

  • Kim, Choong-Gon;Baik, Sung-Wook
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.195-198
    • /
    • 2006
  • 분산형 데이터 마이닝에서는 의사결정나무 알고리즘을 사용한다. 의사결정나무 알고리즘을 사용하여 분산된 정보를 데이터 마이닝 하기 위해서 의사결정나무 구조 정보가 없는 에이전트에서는 의사결정나무 구조 정보를 가진 에이전트로부터 정보를 받아야 한다. 일반적으로 네트워크의 전승속도는 제한이 있고 환경마다 속도도 다르기 때문에 분산형 데이터 마이닝이 비분산형 데이터 마이닝 보다 효율적으로 실행되기 위해서 의사결정나무 구조 정보의 전송량이 최대한 작아야 한다. 본 논문에서 의사결정나무 구조 정보를 전달하는 방법과 그 정보를 보다 효율적으로 전송하는 구현방법에 대해 제시한다. (본 연구는 서울시 신기술연구개발지원사업의 지원에 의하여 이루어진 것임)

  • PDF

Dynamic Decision Tree for Data Mining (데이터마이닝을 위한 동적 결정나무)

  • Choi, Byong-Su;Cha, Woon-Ock
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.6
    • /
    • pp.959-969
    • /
    • 2009
  • Decision tree is a typical tool for data classification. This tool is implemented in DAVIS (Huh and Song, 2002). All the visualization tools and statistical clustering tools implemented in DAVIS can communicate with the decision tree. This paper presents methods to apply data visualization techniques to the decision tree using a real data set.

의사결정나무모형을 이용한 교통사고 유형 분석

  • 김유진;최종후;이의용
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2000.11a
    • /
    • pp.257-260
    • /
    • 2000
  • 본 연구에서는 의사결정나무모형을 이용하여 교통사고 유형 분석을 시도한다. 분석에 이용된 자료는 도로교통안전관리공단에서 수집한 교통사고 정밀조사 자료이다. 본 연구에서 목표변수는 '사고내용'이며, 설명변수는 '인적 요인', '차량적 요인', '도로 환경적 요인' 관련 변수이다. 목표변수에 주요한 기여를 하는 주요 설명변수를 도출하였으며, 얻어진 의사결정나무모형을 토대로 하여 교통사고를 유형화하였다.

  • PDF

데이터마이닝을 위한 혼합 데이터베이스에서의 속성선택

  • Cha, Un-Ok;Heo, Mun-Yeol
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.05a
    • /
    • pp.103-108
    • /
    • 2003
  • 데이터마이닝을 위한 대용량 데이터베이스를 축소시키는 방법 중에 속성선택 방법이 많이 사용되고 있다. 본 논문에서는 세 가지 속성선택 방법을 사용하여 조건속성 수를 60%이상 축소시켜 결정나무와 로지스틱 회귀모형에 적용시켜보고 이들의 효율을 비교해 본다. 세 가지 속성선택 방법은 MDI, 정보획득, ReliefF 방법이다. 결정나무 방법은 QUEST, CART, C4.5를 사용하였다. 속성선택 방법들의 분류 정확성은 UCI 데이터베이스에 주어진 Credit 승인 데이터베이스와 German Credit 데이터베이스를 사용하여 10층-교차확인 방법으로 평가하였다.

  • PDF

의사결정나무와 대응분석을 이용한 사이버 쇼핑몰의 연구

  • Go, Bong-Seong;Kim, Yeon-Hyeong
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2001.10a
    • /
    • pp.12-12
    • /
    • 2001
  • 정보기술을 바탕으로 전자상거래의 규모는 빠르게 늘어가고 있다. 본 연구에서는 종합쇼핑몰의 성격을 띠는 사이버 쇼핑몰의 고객과 구매 고객의 특성 등을 살펴보고 의사결정나무를 이용한 이탈고객의 분류, 쇼핑몰에 등록된 상품군과 인구특성적인 변수들간의 대응분석을 실시하여 쇼핑몰에 대한 인식을 제고한다.

  • PDF

Classification and Recognition of Movement Behavior of Animal based on Decision Tree (의사결정나무를 이용한 생물의 행동 패턴 구분과 인식)

  • Lee, Seng-Tai;Kim, Sung-Shin
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.225-228
    • /
    • 2005
  • 본 논문에서는 생물의 2차원영상에서 4가지의 특징을 추출한 다음 약품에 대한 생물의 행동 패턴 반응에 대하여 의사결정나무를 적용하여 패턴의 인식 및 분류를 하였다. 생물의 행동패턴을 대변하는 물리적인 특징인 속도, 방향전환 각도, 이동거리에 대하여 각각 중간이상속도비율, FFT(Fast Fourier Transformation), 2차원 히스토그램 면적, 프렉탈, 무게중심을 사용하여 특징을 추출하였다. 이렇게 추출된 4가지의 특징변수들을 사용하여 의사결정나무 모델을 구성한 다음 생물의 약품 첨가에 대한 반응을 분석하였다. 또한 결과에서는 기존의 생물의 행동패턴 구분에 쓰였던 전형적인 기법(conventional methods)보다 본 연구에서 적용한 의사결정나무가 생물의 행동패턴이 가지는 물리적 요소에 대한 독해력을 가짐을 보임으로써 특정환경에서 이동행동에 대한 분석을 용이하게 하고자 하였다.

  • PDF

Customer Churning Forecasting and Strategic Implication in Online Auto Insurance using Decision Tree Algorithms (의사결정나무를 이용한 온라인 자동차 보험 고객 이탈 예측과 전략적 시사점)

  • Lim, Se-Hun;Hur, Yeon
    • Information Systems Review
    • /
    • v.8 no.3
    • /
    • pp.125-134
    • /
    • 2006
  • This article adopts a decision tree algorithm(C5.0) to predict customer churning in online auto insurance environment. Using a sample of on-line auto insurance customers contracts sold between 2003 and 2004, we test how decision tree-based model(C5.0) works on the prediction of customer churning. We compare the result of C5.0 with those of logistic regression model(LRM), multivariate discriminant analysis(MDA) model. The result shows C5.0 outperforms other models in the predictability. Based on the result, this study suggests a way of setting marketing strategy and of developing online auto insurance business.

Interesting Node Finding Criteria for Regression Trees (회귀의사결정나무에서의 관심노드 찾는 분류 기준법)

  • 이영섭
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.1
    • /
    • pp.45-53
    • /
    • 2003
  • One of decision tree method is regression trees which are used to predict a continuous response. The general splitting criteria in tree growing are based on a compromise in the impurity between the left and the right child node. By picking or the more interesting subsets and ignoring the other, the proposed new splitting criteria in this paper do not split based on a compromise of child nodes anymore. The tree structure by the new criteria might be unbalanced but plausible. It can find a interesting subset as early as possible and express it by a simple clause. As a result, it is very interpretable by sacrificing a little bit of accuracy.

An Analysis of Choice Behavior for Tour Type of Commercial Vehicle using Decision Tree (의사결정나무를 이용한 화물자동차 투어유형 선택행태 분석)

  • Kim, Han-Su;Park, Dong-Ju;Kim, Chan-Seong;Choe, Chang-Ho;Kim, Gyeong-Su
    • Journal of Korean Society of Transportation
    • /
    • v.28 no.6
    • /
    • pp.43-54
    • /
    • 2010
  • In recent years there have been studies on tour based approaches for freight travel demand modelling. The purpose of this paper is to analyze tour type choice behavior of commercial vehicles which are divided into round trips and chained tours. The methods of the study are based on the decision tree and the logit model. The results indicates that the explanation variables for classifying tour types of commercial vehicles are loading factor, average goods quantity, and total goods quantity. The results of the decision tree method are similar to those of logit model. In addition, the explanation variables for tour type classification of small trucks are not different from those for medium trucks', implying that the most important factor on the vehicle tour planning is how to load goods such as shipment size and total quantity.

A study on decision tree creation using intervening variable (매개 변수를 이용한 의사결정나무 생성에 관한 연구)

  • Cho, Kwang-Hyun;Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.4
    • /
    • pp.671-678
    • /
    • 2011
  • Data mining searches for interesting relationships among items in a given database. The methods of data mining are decision tree, association rules, clustering, neural network and so on. The decision tree approach is most useful in classification problems and to divide the search space into rectangular regions. Decision tree algorithms are used extensively for data mining in many domains such as retail target marketing, customer classification, etc. When create decision tree model, complicated model by standard of model creation and number of input variable is produced. Specially, there is difficulty in model creation and analysis in case of there are a lot of numbers of input variable. In this study, we study on decision tree using intervening variable. We apply to actuality data to suggest method that remove unnecessary input variable for created model and search the efficiency.