DOI QR코드

DOI QR Code

A Bottom-up Algorithm to Find the Densest Subgraphs Based on MapReduce

맵리듀스 기반 상향식 최대 밀도 부분그래프 탐색 알고리즘

  • 이웅희 (한양대학교 컴퓨터공학과) ;
  • 김영훈 (한양대학교 컴퓨터공학과)
  • Received : 2016.08.16
  • Accepted : 2016.10.14
  • Published : 2017.01.15

Abstract

Finding the densest subgraphs from social networks, such that people in the subgraph are in a particular community or have common interests, has been a recurring problem in numerous studies undertaken. However, these algorithms focused only on finding the single densest subgraph. We suggest a heuristic algorithm of the bottom-up type, which finds the densest subgraph by increasing its size from a given starting node, with the repeated addition of adjacent nodes with the maximum degree. Furthermore, since this approach matches well with parallel processing, we further implement a parallel algorithm on the MapReduce framework. In experiments using various graph data, we confirmed that the proposed algorithm finds the densest subgraphs in fewer steps, as compared to other related studies. It also scales efficiently for many given starting nodes.

최대 밀도 부분 그래프는 소셜 네트워크에서 사용자들이 속한 특정 커뮤니티나 사용자들의 공통 관심사를 나타내기에, 최대 밀도 부분 그래프를 찾는 연구가 다수 있었다. 그러나 기존의 연구들은 단일한 최고 밀도 부분 그래프를 찾는다는 문제점이 있었다. 이 연구에서는 주어진 노드에서 시작하여, 인접하는 노드 중에 연결수(degree)가 가장 높은 노드를 추가하는 방식을 사용한 최고 밀도 부분 그래프를 찾는 상향식 휴리스틱 알고리즘을 제안한다. 이에 따라, 병렬 처리에 용이하게 하였고, 이를 맵리듀스 프레임 워크 상에서 병렬 알고리즘으로 구현하였다. 다양한 그래프 데이터로 실험결과 이전 연구와 비교하여 조기에 최고 밀도 부분 그래프를 찾아냄을 보였다. 또한 다양한 다수의 노드가 주어졌을 때에도 효과적으로 동작함을 보였다.

Keywords

Acknowledgement

Grant : 정보 네트워크에서의 정보 이동 경로 및 출처 추적

Supported by : 삼성전자

References

  1. M. Charikar, Moses, "Greedy Approximation Algorithms for Finding Dense Components in a Graph," International Workshop on Approximation Algorithms for Combinatorial Optimization, pp. 84-95, 2000.
  2. S. Khuller, and B. Saha, "On Finding Dense Subgraphs," International Colloquium on Automata, Languages and Programming. Springer Berlin Heidelberg, pp. 597-608, 2009.
  3. J. J. McAuley, and L. Jure, "Learning to Discover Social Circles in Ego Networks," NIPS, pp. 556, 2012.
  4. M. EJ. Newman, "Modularity and Community Structure in Networks," Proceedings of the National Academy of Sciences, pp. 8577-8582, 2006.
  5. B. Bahmani, K. Ravi, and V. Sergei, "Densest Subgraph in Streaming and Mapreduce," Proc. of the VLDB Endowment, pp. 454-465, 2012.