DOI QR코드

DOI QR Code

의사결정 트리 앙상블을 구축하기 위한 상관성 기반 기법을 이용한 속성 중복성 제거

Removing the Feature Redundancy using Correlation-Based Approach for Decision Tree Ensemble

  • 박영준 (충북대학교 데이터베이스 및 바이오인포메틱스 연구실) ;
  • 박명호 (충북대학교 데이터베이스 및 바이오인포메틱스 연구실) ;
  • 손호선 (충북대학교 데이터베이스 및 바이오인포메틱스 연구실) ;
  • 류근호 (충북대학교 데이터베이스 및 바이오인포메틱스 연구실)
  • Piao, Yongjun (Database/Bioinformatics Laboratory, Chungbuk National University) ;
  • Piao, Minghao (Database/Bioinformatics Laboratory, Chungbuk National University) ;
  • Shon, Ho Sun (Database/Bioinformatics Laboratory, Chungbuk National University) ;
  • Ryu, Keun Ho (Database/Bioinformatics Laboratory, Chungbuk National University)
  • 발행 : 2011.11.11

초록

대량의 분류 규칙 탐사 과정은 앙상블기법을 사용하여 다양한 연구들이 이루어지고 있다. 본 논문에서는 의사결정 트리의 분열 문제와 singleton 포함 한계를 해결하기 위하여 Cascading-and-Sharing 앙상블 기법을 적용하여 점진적 다중 의사결정 트리를 구축하였다. 또한 분류의 정확도를 향상시키고, 트리의 복잡도와 모델 과잉접합을 피하기 위하여 다중 트리 구축과정에서 선형 상관분석기법을 기반으로 훈련 데이터 속성들의 중복성을 제거하였다. 실험 결과, 속성들의 중복성을 제거하여 구축한 트리들은 원래 기법보다 더 좋은 결과를 보여주었다.

키워드