DOI QR코드

DOI QR Code

An Effective Method for Dense and Sparse Frequent Itemsets Mining

효율적인 밀집 및 희소 빈발 항목 집합 탐색 방법

  • Yi, Gyeong Min (Database/Bioinformatics Laboratory Chungbuk National University) ;
  • Jung, Sukho (Database/Bioinformatics Laboratory Chungbuk National University) ;
  • Shin, DongMun (Database/Bioinformatics Laboratory Chungbuk National University) ;
  • Musa, Ibrahim Musa Ishag (Database/Bioinformatics Laboratory Chungbuk National University) ;
  • Lee, Dong Gyu (Database/Bioinformatics Laboratory Chungbuk National University) ;
  • Sohn, Gyoyong (Database/Bioinformatics Laboratory Chungbuk National University) ;
  • Ryu, Keun Ho (Database/Bioinformatics Laboratory Chungbuk National University)
  • 이경민 (충북대학교 데이터베이스연구실) ;
  • 정석호 (충북대학교 데이터베이스연구실) ;
  • 신동문 (충북대학교 데이터베이스연구실) ;
  • ;
  • 이동규 (충북대학교 데이터베이스연구실) ;
  • 손교용 (충북대학교 데이터베이스연구실) ;
  • 류근호 (충북대학교 데이터베이스연구실)
  • Published : 2009.04.23

Abstract

트리기반 빈발 항목 집합 알고리즘들은 전체적으로 밀집 빈발 항목 집합에는 효율적이고 빠르게 빈발 항목 집합을 탐색하나 희소 빈발 항목 집합에는 효율적이지 않고 빈발 항목 집합을 빠르게 탐색하지 못한다. 반면에 배열기반 빈발 항목 집합 알고리즘은 희소 빈발 항목 집합에 효율적이고 빠르게 빈발 항목 집합을 탐색하나 밀집 빈발 항목 집합에는 효율적이지 않고 빈발 항목 집합을 빠르게 탐색하지 못한다. 밀집 및 희소 빈발 항목 집합 모두 효율적으로 빈발 항목 집합을 탐색 하고자 하는 시도가 있었으나 두 가지 종류의 알고리즘을 동시에 사용하므로 각각의 알고리즘을 사용할 정확한 기준 제시가 어렵고, 두 가지 알고리즘의 단점을 내포한다. 따라서 본 논문에서는 단일 알고리즘을 사용하여 밀집 빈발 항목 집합 및 희소 빈발 항목 집합 모두에 대해 작은 메모리 공간을 사용하면서도 효율적이고 빠르게 빈발 항목 집합을 탐색할 수 있는 CPFP-Tree라는 새로운 자료구조와 탐색 방법을 제안한다.

Keywords