Association Rule Discovery using TID List Table

TID 리스트 테이블을 이용한 연관 규칙 탐사

  • Published : 2005.06.01

Abstract

In this paper, we propose an efficient algorithm which generates frequent itemsets by only one database scanning. A frequent itemset is subset of an itemset which is accessed by a transaction. For each item, if informations about transactions accessing the item are exist, it is possible to generate frequent itemsets only by the extraction of items haying an identical transaction ID. Proposed method in this paper generates the data structure which stores transaction ID for each item by only one database scanning and generates 2-frequent itemsets by using the hash technique at the same time. k(k$\geq$3)-frequent itemsets are simply found by comparing previously generated data structure and transaction ID. Proposed algorithm can efficiently generate frequent itemsets by only one database scanning .

본 논문에서는 데이타베이스를 단 한번 스캔하여 빈발 항목집합들을 생성할 수 있는 효율적인 알고리즘을 제안한다. 빈발 항목집합은 어떤 트랜잭션이 접근하는 항목 집합의 부분집합이다. 각 항목에 대하여 그 항목을 접근하는 트랜잭션들에 관한 정보를 가지고 있다면, 동일한 트랜잭션 식별자를 갖는 항목들만을 추출함으로써 빈발 항목집합들을 생성할 수 있다 본 논문에서 제안하는 방법은 한 번의 데이타베이스 스캔으로 각 항목마다 접근하는 트랜잭션 식별자를 저장할 수 있는 자료 구조를 생성하며, 동시에 해쉬 기법을 이용하여 2-빈발 항목집합들을 생성한다. 3-빈발 항목집합부터는 이 자료 구조와 각 항목에 대한 트랜잭션 식별자를 비교함으로써 간단히 빈발 항목집합들을 찾아낼 수 있다. 제안하는 알고리즘은 한 번의 데이타베이스 스캔만으로 빈발 항목집합들을 효율적으로 생성할 수 있다.

Keywords

References

  1. R. Agrawal and R. Srikant, 'Fast algorithms for mining association rules,' In VLDB, pp. 487-499, 1994
  2. J.S. Park, M.S. Chen and P.S. Yu, 'An effective hash-based algorithm for mining association rules,' In ACM SIGMOD, pp.175-186, 1995 https://doi.org/10.1145/568271.223813
  3. B. Lent, A. Swami and J. Widom, 'Clustering association rules,' In ICDE, pp. 220-231, 1997 https://doi.org/10.1109/ICDE.1997.581756
  4. R. Ng, L. V. S. Lakshmanan, J. Han and A. Pang, 'Exploratory mining and pruning optimizations of constrained associations rules,' In SIGMOD, pp. 13-24, 1998 https://doi.org/10.1145/276304.276307
  5. B. Liu, W. Hsu and Y. Ma, 'Mining association rules with multiple minimum supports,' In ACM SIGKDD, pp. 337-341, 1999 https://doi.org/10.1145/312129.312274
  6. J. Han, J. Pei and Y. Yin, 'Mining frequent patterns without candidate generation,' In ACM SIGMOD, pp. 1-12, 2000 https://doi.org/10.1145/342009.335372
  7. G. Grahne, L. Lakshmanan and X. Wang, 'Efficient mining of constrained correlated sets,' In ICDE, 2000 https://doi.org/10.1109/ICDE.2000.839450
  8. R. Agarwal, C. Aggarwal and V. V. V. Prasad, 'A tree projection algorithm for generation of frequent itemsets,' In J. Parallel and Distributed Computing, 2000 https://doi.org/10.1006/jpdc.2000.1693
  9. M. Klemettinen, h. Mannila, P. Ronkainen, h. Toivonen and A.I. Verkamo, 'Finding interesting rules from large sets of discovered association rules,' In CIKM, pp. 401-408, 1994 https://doi.org/10.1145/191246.191314
  10. A. savasere, E. Omiecinski and S. Navathe, 'An efficient algorithm for mining association rules in large databases,' In VLDB, pp. 432-443, 1995
  11. R. Srikant, Q. Vu and R. Agrawal, 'Mining association rules with item constraints,' In KDD, pp. 67-73, 1997
  12. S. Sarawagi, S. Thomas and R. Agrawal, 'Integrating association rule mining with relational database systems: Alternatives and implications,' In SIGMOD, pp. 343-354, 1998 https://doi.org/10.1145/276305.276335
  13. R. Agrawal, T. Imielinski and A. Swami, 'Mining association rules between sets of items in large database,' In ACM SIGMOD, pp.207-216, 1993 https://doi.org/10.1145/170035.170072
  14. 박종수, 유원경, 홍기형 '연관 규칙 탐사와 그 응용', 한국 정보과학회지 제16권 제 9호, pp. 37-44, 1998