• 제목/요약/키워드: 의사결정 트리 분류

검색결과 84건 처리시간 0.028초

비트맵을 활용한 분류 구현 (BBC;Bit-map Based Classification)

  • 조용준;이상원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.63-66
    • /
    • 2005
  • 분류란 여러 분야에서 쌓인 정보 데이터를 분석하여, 결과값에 대한 공통속성을 찾아내어 새로운 입력 데이터에 대해 보다 보편적인 결과를 분석하거나 예측하는 기법이다. 의사 결정 트리는 이러한 분류의 한 형태로 저장된 데이터를 활용하여 선험적 지식을 취득하고, 새로운 데이터에 대한 예측을 발생시키는 데이터 분석 방법이다. 그러나, 의사 결정 트리의 여러 가지 장점에도 불구하고 트리 구성에 많은 비용이 소요되는 단점이 존재한다. 점점 대량의 데이터를 다루어야 하는 현대 사회에서는 이러한 단점이 더욱더 커질 수 밖에 없다. 본 논문에서는 이러한 문제점을 해결하고자 비트맵을 활용한 의사 결정 트리의 구현을 제안한다. 비트맵을 사용하게 되면 의사 결정 트리 생성의 가장 큰 비용인 속성값 측정에서 높은 효율을 유지할 수 있게 된다. 또한 보다 효율적이고, 확장성이 높은 의사 결정 트리를 구현할 수가 있다.

  • PDF

퍼지 클러스터링과 결정 트리를 이용한 모델기반 오존 예보 시스템 (Model-based Ozone Forecasting System using Fuzzy Clustering and Decision tree)

  • 천성표;이미희;이상혁;김성신
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.458-461
    • /
    • 2004
  • 오존 반응 메카니즘은 상당히 복잡하고 비선형적이기 때문에 오존 농도를 예측하는 것은 상당한 어려움을 안고 있다 따라서, 신뢰성 높은 오존 예측값을 구하는데 단일 예측모델만으로는 한계가 있으며, 이를 개선하기 위하여 다중 모델을 제안하였다. 입력데이터에 퍼지 클러스터링을 사용하여 고, 중, 저농도별로 그룹핑한 후, 그룹핑된 오존농도에 대해서 의사결정 트리를 사용하여 그룹핑된 오존데이터가 어느 정도 분류능력을 갖는지 파악하여, 오차가 가장 적은 분류특성을 갖는 그룹을 설정하여, 다중모델의 입력 데이터로 사용하여 모델을 형성하였다. 의사결정 트리를 이용하여 모델의 입력 데이터를 설정하는 것은 어떤 오존농도까지의 범위를 클래스로 설정하느냐에 따라서 모델의 성능과 고, 중, 저농도의 오존을 분류하는 성능이 달라지므로 본 논문에서는 퍼지 클러스터링을 이용하여 의사결정 트리의 클래스의 범위를 설정하여 예측 시스템을 구현하였다.

  • PDF

의사결정 트리 앙상블을 구축하기 위한 상관성 기반 기법을 이용한 속성 중복성 제거 (Removing the Feature Redundancy using Correlation-Based Approach for Decision Tree Ensemble)

  • 박영준;박명호;손호선;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1229-1231
    • /
    • 2011
  • 대량의 분류 규칙 탐사 과정은 앙상블기법을 사용하여 다양한 연구들이 이루어지고 있다. 본 논문에서는 의사결정 트리의 분열 문제와 singleton 포함 한계를 해결하기 위하여 Cascading-and-Sharing 앙상블 기법을 적용하여 점진적 다중 의사결정 트리를 구축하였다. 또한 분류의 정확도를 향상시키고, 트리의 복잡도와 모델 과잉접합을 피하기 위하여 다중 트리 구축과정에서 선형 상관분석기법을 기반으로 훈련 데이터 속성들의 중복성을 제거하였다. 실험 결과, 속성들의 중복성을 제거하여 구축한 트리들은 원래 기법보다 더 좋은 결과를 보여주었다.

데이터 웨어하우스에서 의사결정 트리를 이용한 실체화 뷰 선택 기법 (Materialized View Selection using Decision Tree in Data Warehouse)

  • 장윤경;유병섭;어상훈;김경배;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.63-66
    • /
    • 2006
  • 실체화 뷰 선택은 질의 수행 시간과 제한된 저장 공간 등의 유지 비용을 고려하여 최적의 실체화 뷰 집합을 선택하고 유지하는 것이다. 본 논문에서는 의사결정 트리를 이용한 실체화 뷰 선택기법을 제안한다. 제안기법은 의사결정 트리를 이용하여 실체화 뷰로 생성될 질의를 판단하고 실체화 뷰 교체가 필요한 경우 메타데이터 테이블을 이용하여 교체 대상을 결정한다. 의사결정 트리는 높은 우선순위를 가진 속성으로부터 차례대로 데이터를 분류하기 때문에 이용도가 높은 실체화 뷰를 선택하는 방법을 제공하고 메타데이터 테이블은 실체화 뷰 집합의 빠른 교체 수행과 효율적인 유지보수를 제공한다. 성능평가를 통해 제안된 기법은 실체화 뷰 비율에 따른 질의처리 시간이 기존기법보다 약 13%의 성능 향상을 보였다.

  • PDF

의사결정트리에서 공간사건 예측을 위한 리프노드 등급 결정 방법 분석 (Analysis of Leaf Node Ranking Methods for Spatial Event Prediction)

  • 연영광
    • 한국지리정보학회지
    • /
    • 제17권4호
    • /
    • pp.101-111
    • /
    • 2014
  • 공간사건들은 데이터마이닝 분류알고리즘을 이용하여 예측 가능하며, 의사결정 트리는 대표적인 분류알고리즘들 중 하나로 사용되고 있다. 의사결정 트리는 레이블 값을 갖는 분류작업에 주로 사용되었으나 규칙평가 기법을 트리 리프노드 등급 계산에 응용하면서부터 공간사건 예측에 이용되고 있다. 이 논문에서는 의사결정 트리에서 사용되는 규칙평가 방법들을 공간예측에 적용하여 비교하였다. 실험을 위해 의사결정 트리 알고리즘인 C4.5알고리즘과 규칙 평가기법인 Laplace, M-estimate 및 m-branch 기법들을 구현하여 자연환경에서 발생되는 대표적인 공간예측 응용분야인 산사태에 적용하였다. 적용한 규칙 평가 기법들의 정확도 평가결과, 그 특성에 따라 정확도의 차이가 있었으며 m-branch가 가장 높은 성능을 보였다. 그러나 m-branch 및 M-estimate와 같이 별도의 파라미터를 갖는 경우 반복적으로 최적의 파라미터 값을 찾는 과정을 요구하였다. 따라서 적용 대상에 따라 선택적으로 활용할 수 있다. 이러한 의사결정 트리를 이용한 공간예측은 예측 결과뿐만 아니라 특정 위치에서의 예측결과에 대한 원인분석을 가능하게 함으로 다양한 응용을 가능하게 한다.

공간 데이터의 분포를 고려한 공간 엔트로피 기반의 의사결정 트리 기법 (A Spatial Entropy based Decision Tree Method Considering Distribution of Spatial Data)

  • 장윤경;유병섭;이동욱;조숙경;배해영
    • 정보처리학회논문지B
    • /
    • 제13B권7호
    • /
    • pp.643-652
    • /
    • 2006
  • 의사결정 트리는 데이터 마이닝의 분류와 예측 작업에 주로 사용되는 기법 중의 하나이다. 실생활에서 공간의사결정을 위한 분류를 수행할 때에는 인접 데이터의 위치와 분산도를 고려하는 것이 매우 중요하다. 기존의 공간 의사결정 트리는 데이터의 공간적 특성을 표현하기 위해 각 객체간의 유클리디안 거리비율을 엔트로피로 반영하여 트리 구축 시 이용하였다. 그러나 이것은 공간 객체간의 거리 비율만을 설명할 뿐 공간 차원에서의 데이터 분산 정도와 각 분류된 클래스간의 연관관계 등은 파악할 수 없다는 한계점이 있었다 본 논문에서는 분산도와 차별도 기반의 공간 엔트로피를 이용하여 공간 데이터의 분포도를 반영하는 공간 의사결정 트리를 제안한다 분산도는 분류된 클래스 내의 공간 객체 분포도를 나타내고 차별도는 다른 클래스 내 공간 객체와의 분포도 및 관계성을 나타낸다. 이러한 분산도와 차별도의 비율을 엔트로피 계산 시 이용함으로써 비공간적 속성으로 분류된 각 클래스가 공간적으로는 얼마나 뚜렷하게 분류되는지 알 수 있게 한다. 제안 기법은 정확성과 계산 비용에 있어서 기존 기법보다 각각 약 18%, 11%의 성능 향상을 보였다.

다변량 퍼지 의사결정트리의 적응 기법 (Adaptation method of multivariate fuzzy decision tree )

  • 전문진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.17-18
    • /
    • 2008
  • 다변량 퍼지 의사결정트리(이하 MFDT)는 학습 모델의 구조가 간소하고 분류율이 높다는 장점 때문에 일반 퍼지 의사결정트리를 대신해 손동작 인식 시스템의 분류기로 사용되었다. 다양한 사용자의 손동작 특성을 분류하기 위해 여러 개의 인식 모델을 만들고 새로운 사용자에게 가장 적합한 모델을 선택해 사용하는 모델 선택 기법도 손동작 인식에 적용되었다. 모델 선택 과정을 통해 선택된 모델은 기존 모델 중에서 새로운 사용자의 특성에 가장 가깝지만 해당 사용자에 최적화된 모델이라고는 할 수 없다. 이 논문에서는 MFDT 모델을 새로 입력된 데이터를 이용해 적응시키는 방법을 설명하고 실험 결과를 통해 적응 성능을 검증한다.

특징공간을 사선 분할하는 퍼지 결정트리 유도 (Fuaay Decision Tree Induction to Obliquely Partitioning a Feature Space)

  • 이우향;이건명
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권3호
    • /
    • pp.156-166
    • /
    • 2002
  • 결정트리 생성은 특징값들로 기술된 사례들로부터 분류 규칙을 추출하는 유용한 기계학습 방법중 하나이다. 결정트리는 특징공간을 분할하는 형태에 따라 단변수(univariate) 결정트리와 다변수(multivariate) 결정트리로 대별된다. 실제 현장에서 얻어지는 데이터는 관측오류, 불확실성, 주관적인 판단 등의 이유로 특징값 자체에 오류를 포함하는 경우가 많다. 이러한 오류에 대해 강건한 결정트리를 생성하기 위한 방법으로 퍼지 기법을 도입한 결정트리 생성 방법에 대한 연구가 진행되어 왔다. 현재까지 대부분의 퍼지 결정트리에 대한 연구는 단변수 결정트리에 퍼지 기법을 도입한 것들이며, 다변수 결정트리에 퍼지 기법을 적용한 것은 찾아보기 힘들다. 이 논문에서는 다변수 결정트리에 퍼지 기법을 적용하여 퍼지사선형 결정트리라고 하는 퍼지 결정트리를 생성하는 방법을 제안한다. 또한 제안한 결정트리 생성 방법의 특성을 보이기 위한 실험 결과를 보인다.

중요한 이벤트만을 검색함으로써 분류기의 최적 성능을 찾는 방법 (A method of searching the optimum performance of a classifier by testing only the significant events)

  • 김동희;이원돈
    • 한국정보통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1275-1282
    • /
    • 2014
  • 유비쿼터스 환경에서는 수많은 정보들이 존재한다. 하지만 이 정보들은 너무 광범위하기 때문에 이로부터 필요에 따라 적절하게 사용 할 수 있는 정보를 얻기란 쉽지가 않다. 이로 인해 의사 결정 트리 알고리즘은 데이터 마이닝 분야 또는 기계 학습 시스템 분야에서 매우 유용하게 사용된다. 왜냐하면 빠르고 정확하게 정보를 분류하여 좋은 결과를 도출하기 때문이다. 하지만 때때로 의사 결정 트리가 매우 작은 데이터나 노이즈 데이터로 구성된 리프 노드들로 인해 좋은 정보를 제공하지 못하는 경우가 있다. 이 논문은 이러한 분류 문제를 해결하기 위해 분류기, UChoo를 사용할 것이고 노이즈 또는 노이즈 형태로 보이는 리프들을 제외하고 오직 중요한 리프들만을 검사하는 효과적인 방법을 제안한다. 그리고 실험을 통하여 의사 결정시 오직 중요한 리프들만을 의사 결정 트리에서 선택함으로써 효과적으로 에러가 줄어드는 것을 보일 것이다.

Decision Tree와 SNP정보를 이용한 간경화 환자의 감수성 예측 (Pridict of Liver cirrhosis susceptibility using Decision tree with SNP)

  • 김동회;엄상용;조성원;함기백;김진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.63-66
    • /
    • 2006
  • 본 논문에서는 SNP데이터를 이용하여 간경화에 대한 감수성을 예측하기 위해 의사결정 트리를 이용하였다. 데이터는 간경화 환자와 정상환자 총 116명의 데이터를 사용하였으며, Feature 값으로는 간질환과 밀접한 연관성을 갖는 28개의 SNP데이터를 사용하였다. 실험방법은 각각의 SNP에 대하여 의사결정트리로 분류율을 측정한 후 가장 높은 분류율을 가지는 SNP부터 조합해 나가는 방식으로 C4.5 의사결정트리를 이용 leave-one-out cross validation으로 간경화와 정상을 구분하는 정확도를 측정하였다. 실험결과 간 질환 관련 SNP중 IL1RN-S130S, IRNGR2-Q64R, IL-10(-592), IL1B_S35S 4개의 SNP조합에서 65.52%의 정확도를 얻을 수 있었다.

  • PDF