DOI QR코드

DOI QR Code

A Comparative Study on Feature Selection and Classification Methods Using Closed Frequent Patterns Mining

닫힌 빈발 패턴을 기반으로 한 특징 선택과 분류방법 비교

  • Zhang, Lei (Dept. of Computer Science, Chungbuk National University) ;
  • Jin, Cheng Hao (Dept. of Computer Science, Chungbuk National University) ;
  • Ryu, Keun Ho (Dept. of Computer Science, Chungbuk National University)
  • 장뢰 (충북대학교 컴퓨터과학과) ;
  • 김성호 (충북대학교 컴퓨터과학과) ;
  • 류근호 (충북대학교 컴퓨터과학과)
  • Published : 2010.11.12

Abstract

분류 기법은 데이터 마이닝 기술 중 가장 잘 알려진 방법으로서, Decision tree, SVM(Support Vector Machine), ANN(Artificial Neural Network) 등 기법을 포함한다. 분류 기법은 이미 알려진 상호 배반적인 몇 개 그룹에 속하는 다변량 관측치로부터 각각의 그룹이 어떤 특징을 가지고 있는지 분류 모델을 만들고, 소속 그룹이 알려지지 않은 새로운 관측치가 어떤 그룹에 분류될 것인가를 결정하는 분석 방법이다. 분류기법을 수행할 때에 기본적으로 특징 공간이 잘 표현되어 있다고 가정한다. 그러나 실제 응용에서는 단일 특징으로 구성된 특징공간이 분명하지 않기 때문에 분류를 잘 수행하지 못하는 문제점이 있다. 본 논문에서는 이 문제에 대한 해결방안으로써 많은 정보를 포함하면서 빈발패턴에 대한 정보의 순실이 없는 닫힌 빈발패턴 기반 분류에 대한 연구를 진행하였다. 본 실험에서는 ${\chi}^2$(Chi-square)과 정보이득(Information Gain) 속성 선택 척도를 사용하여 의미있는 특징 선택을 수행하였다. 그 결과, 이 연구에서 제시한 척도를 사용하여 특징 선택을 수행한 경우, C4.5, SVM 과 같은 분류기법보다 더 향상된 분류 성능을 보였다.

Keywords