DOI QR코드

DOI QR Code

Implementation of a GPU Cluster System using Inexpensive Graphics Devices

저가의 그래픽스 장치를 이용한 GPU 클러스터 시스템 구현

  • 이종민 (동의대학교 컴퓨터소프트웨어공학과) ;
  • 이중화 (동의대학교 컴퓨터소프트웨어공학과) ;
  • 김성우 (동의대학교 컴퓨터소프트웨어공학과)
  • Received : 2011.07.20
  • Accepted : 2011.10.04
  • Published : 2011.11.30

Abstract

Recently the research on GPGPU has been carried out actively as the performance of GPUs has been increased rapidly. In this paper, we propose the system architecture by benchmarking the existing supercomputer architecture for a cost-effective system using GPUs in low-cost graphics devices and implement a GPU cluster system with eight GPUs. We also make the software development environment that is suitable for the GPU cluster system and use it for the performance evaluation by implementing the n-body problem. According to its result, we found that it is efficient to use multiple GPUs when the problem size is large due to its communication cost. In addition, we could calculate up to eight million celestial bodies by applying the method of calculating block by block to mitigate the problem size constraint due to the limited resource in GPUs.

최근 들어 GPU 성능이 급격하게 향상됨에 따라서 그래픽 처리가 아닌 일반 계산 분야에도 활용하기 위하여 GPGPU 분야에 대한 연구에 많이 이루어지고 있다. 본 논문에서는 저가의 그래픽스 장치에 내재된 GPU를 활용하여 비용 대비 성능이 높은 시스템을 구현하기 위하여 기존의 슈퍼컴퓨터 구조를 벤치마킹한 시스템 구조를 제안하고, 8개의 GPU를 사용하는 GPU 클러스터 시스템을 구현한다. 또한 이를 위한 소프트웨어 환경을 구축하여 n-body 문제를 사용하여 시스템 성능을 분석한다. 성능 평가 결과 사용하는 GPU 수가 많아질수록 통신경비로 인하여 문제 크기가 충분히 커야 효율적임을 알 수 있었다. 그리고 GPU내 자원 부족 문제 때문에 발생하는 문제 크기 제약을 블록 단위로 계산하여 완화할 수 있는 방법을 적용하여 최대 팔백만 개의 천체에 대한 계산을 할 수 있었다.

Keywords

References

  1. 전진홍, 이용우, 이명호, "GPU를 활용한 고성능 컴퓨팅," 정보처리학회지, 제15권, 제5호, pp. 119-125, 2008년.
  2. Home $\mid$ TOP500 Supercomputing Sites, http:// www.top500.org/.
  3. 이병훈, 이호, 계희원, 신영길, "다중 GPU 기반의 고속 삼차원 역전사기법," 멀티미디어학회 논문지, 제12권, 제2호, pp. 209-218, 2009.
  4. J.S. Park, J.M. Lee, S.Y. Lee, and S.W. Shin, "A Fast 3D Spatial Analysis Techniques Using Graphic Process Units," in Proceedings of American Society for Photogrammetry and Remose Sensing (ASPRS) 2011 Annual Conference, Milwaukee, 2011.
  5. Q.-D. Wang, "The Global Solution of the N-Body Problem," Celestial Mechanics and Dynamical Astronomy, Vol.50, No.1, pp. 73- 88, 1991. https://doi.org/10.1007/BF00048987
  6. Z. Fan, F. Qiu, A. Kaufman, and S. Yoakum- Stover, "GPU Cluster for High Performance Computing," in Proc. the ACM/IEEE Supercomputing Conference 2004, pp. 47-58, 2004.
  7. V.V. Kindratenko, J.J. Enos, G. Shi, M.T. Showerman, G.W. Arnold, J.E. Stone, J.C. Philips, and W.-M. Hwu, "GPU Clusters for High-Performance Computing," in Proc. Workshop on Parallel Programming on Accelerator Clusters (PPAC'09) , IEEE International Conference on Cluster Computing, pp. 1-8, 2009.
  8. A. Munshi (ed.), "The OpenCL Specification: Version 1.1," Khronos OpenCL Working Group, 2010.
  9. PVM: Parallel Virtual Machine, http://www. csm.ornl.gov/pvm/.
  10. XPVM: A Graphical Console and Monitor for PVM, http://www.netlib.org/utk/icl/xpvm/ xpvm.html.
  11. B. Wilkinson and M. Allen, Parallel Programming: Techniques and Applications using Networked Workstations and Parallel Computers, 2nd ed., NJ: Pearson Prentice Hall, 2005, pp. 62-64.

Cited by

  1. A GPU scheduling framework for applications based on dataflow specification vol.17, pp.10, 2014, https://doi.org/10.9717/kmms.2014.17.10.1189
  2. PCI Express 기반 OpenSHMEM 초기 설계 및 구현 vol.6, pp.3, 2011, https://doi.org/10.3745/ktccs.2017.6.3.105