DOI QR코드

DOI QR Code

An efficient approach of avoiding extensions of duplicated graph patterns in cyclic graph mining

순환 그래프 마이닝에서 중복된 그래프 패턴의 확장을 피하는 효율적인 기법

  • No, Young-Sang (Dept. of Computer Science, Chungbuk National University) ;
  • Yun, Un-Il (Dept. of Computer Science, Chungbuk National University) ;
  • Pyun, Gwang-Bum (Dept. of Computer Science, Chungbuk National University) ;
  • Ryang, Heung-Mo (Dept. of Computer Science, Chungbuk National University) ;
  • Lee, Gang-In (Dept. of Computer Science, Chungbuk National University) ;
  • Ryu, Keun-Ho (Dept. of Computer Science, Chungbuk National University) ;
  • Lee, Kyung-Min (Office of the Texas State Chemist, Texas AgriLife Research, Texas A&M University)
  • 노영상 (충북대학교 전자정보대학 컴퓨터과학과 및 컴퓨터정보통신연구소) ;
  • 윤은일 (충북대학교 전자정보대학 컴퓨터과학과 및 컴퓨터정보통신연구소) ;
  • 편광범 (충북대학교 전자정보대학 컴퓨터과학과 및 컴퓨터정보통신연구소) ;
  • 양흥모 (충북대학교 전자정보대학 컴퓨터과학과 및 컴퓨터정보통신연구소) ;
  • 이강인 (충북대학교 전자정보대학 컴퓨터과학과 및 컴퓨터정보통신연구소) ;
  • 류근호 (충북대학교 전자정보대학 컴퓨터과학과 및 컴퓨터정보통신연구소) ;
  • 이경민 (텍사스 A&M 대학교, 부설 텍사스 농업생명 연구소, 텍사스 화학 물질 규제 연구실)
  • Received : 2011.07.16
  • Accepted : 2011.10.30
  • Published : 2011.12.31

Abstract

From Complicated graph structures, duplicated operations can be executed and the operations give low efficiency. In this paper, we propose an efficient graph mining algorithm of minimizing the extension of duplicated graph patterns in which the priorities of cyclic edges are considered. In our approach, the cyclic edges with lower priorities are first extended and so duplicated extensions can be reduced. For performance test, we implement our algorithm and compare our algorithm with a state of the art, Gaston algorithm. Finally, We show that ours outperforms Gaston algorithm.

그래프 마이닝에서 복잡한 그래프 구조로 인해, 중복된 확장 연산이 수행되며 이로인해 낮은 효율성을 가지게 된다. 본 논문에서는 순환그래프에서 중복된 그래프 패턴으로의 확장을 최소화하기위해 중복 판단을 효율적으로 하는 그래프 마이닝 알고리즘을 제안한다. 제안하는 기법에서는 순환간선의 우선순위를 고려하여 우선순위가 낮은 간선을 먼저 확장하게 함으로써 중복확장을 줄이도록 하였다. 이 기법의 성능을 평가하기 위해, 알고리즘을 구현하고 그래프 마이닝의 대표 알고리즘인 가스톤 알고리즘과 성능 평가를 하였으며, 제안하는 알고리즘이 복잡한 그래프 구조에서 반복되어 발생하는 연산중 하나인 순환 그래프에서 패턴 확장 시에 필요한 연산을 효율적으로 줄이도록하여 전체 마이닝의 성능이 향상됨을 보인다.

Keywords

References

  1. R. Agrawal, T. Imilienski, and A. Swami. "Mining association rules between sets of items in large datasets." In Proceedings of SIGMOD, May, 1993.
  2. P. Dmitriev, and C. Lagoze. Mining Generalized Graph Patterns Based on User Examples. ICDM, Dec. 2006. pp. 857-862.
  3. S. Gunnemann and T. Seidl, Subgraph Mining on Directed and Weighted Graphs. PAKDD, June 2010, pp. 133-146.
  4. J. Han, H. Cheng, D. Xin, and X. Yan, Frequent pattern mining: current status and future directions, Data Mining and Knowledge Discovery, 2007, 15(1), pp. 55-86. https://doi.org/10.1007/s10618-006-0059-1
  5. A. Inokuchi, T. Washio, and H. Motoda, An apri ori-based algorithm for mining frequent substructures from graph data, PAKDD, Sep. 2000, pp. 13-23.
  6. U. Kang, D. H. Chau, and C. Faloutsos, Mining large graphs: Algorithms, inference, and discoveries. ICDE, April 2011, pp. 243-254
  7. Y. Ke, J. Cheng, J. X. Yu, Top-k Correlative Graph Mining. SDM, May 2009, pp. 1038-1049.
  8. M. Kuramochi and G. Karypis, An Efficient Algorithm for Discovering Frequent Subgraphs, TKDE 16(9), pp. 1038-1051, 2004.
  9. M. McGlohon, and L. Akoglu, C. Faloutsos. Weighted graphs and disconnected components: Patterns and a generator, ACM SIGKDD, August 2008, pp. 524-532.
  10. S. Nijssen, and J. N. Kok, A quickstart in frequent structure mining can make a difference, ACM SIGKDD, August 2004, pp. 647-652.
  11. T. Ozaki, and T. Ohkawa, Mining Correlated Subg raphs in Graph Databases. PAKDD, May 2008, pp.272-283.
  12. S. Ranu, and A. K. Singh, GraphSig: A Scalable Approach to Mining Significant Subgraphs in Large Graph Databases. ICDE, March 2009, pp.844-855.
  13. Y. Xie, and P. S. Yu, Max-Clique: A Top-Down Graph-Based Approach to Frequent Pattern Mining. ICDM, Dec. 2010, pp.1139-1144.
  14. X. Yan, and J. Han, gSpan: Graph-based substr ucture pattern mining, ICDM, Dec. 2002, pp. 721-724.
  15. X. Yan, and J. Han, CloseGraph: Mining Closed Frequent Graph Patterns, ACM SIGKDD, August 2003, pp. 286-295.
  16. F. Zhu, X. Yan, J. Han, and P. S. Yu, gPrune: A Constraint Pushing Framework for Graph Pattern Mining, May PAKDD 2007, pp. 388-400.
  17. Z. Zou, J. Li, H. Gao, and S. Zhang, Mining Frequ ent Subgraph Patterns from Uncertain Graph Data. TKDE, 2010, 22(9), pp. 1203-1218.