DOI QR코드

DOI QR Code

빅데이터 처리를 위한 PC와 라즈베리파이 클러스터에서의 Apache Spark 성능 비교 평가

Performance Evaluation Between PC and RaspberryPI Cluster in Apache Spark for Processing Big Data

  • 서지혜 (이화여자대학교 컴퓨터공학과) ;
  • 박미림 (이화여자대학교 컴퓨터공학과) ;
  • 양혜경 (이화여자대학교 컴퓨터공학과) ;
  • 용환승 (이화여자대학교 컴퓨터공학과)
  • Seo, Ji-Hye (Dept of Computer Science and Engineering, Ewha Womans University) ;
  • Park, Mi-Rim (Dept of Computer Science and Engineering, Ewha Womans University) ;
  • Yang, Hye-Kyung (Dept of Computer Science and Engineering, Ewha Womans University) ;
  • Yong, Hwan-Seung (Dept of Computer Science and Engineering, Ewha Womans University)
  • 발행 : 2015.10.28

초록

최근 IoT 기술의 등장으로 저전력 소형 컴퓨터인 라즈베리파이 클러스터가 IoT 데이터 처리를 위해 사용되고 있다. IoT 기술이 발전하면서 다양한 데이터가 생성되고 있으며 IoT 환경에서도 빅데이터 처리가 요구되고 있다. 빅데이터 처리 프레임워크에는 일반적으로 하둡이 사용되고 있으며 이를 대체하는 솔루션으로 Apache Spark가 등장했다. 본 논문에서는 PC와 라즈베리파이 클러스터에서의 성능을 Apache Spark를 통해 비교하였다. 본 실험을 위해 Yelp 데이터를 사용하며 데이터 로드 시간과 Spark SQL을 이용한 데이터 처리 시간을 통해 성능을 비교하였다.

키워드