멀티-GPU 기반 MPI-CUDA 병렬 성능 확장성

An MPI-CUDA Implementation for Parallel Scalability on Multi-GPU Clusters

  • 이홍석 (한국과학기술정보연구원 슈퍼컴퓨팅센터) ;
  • 이승민 (한국과학기술정보연구원 슈퍼컴퓨팅센터)
  • Yi, Hong-Suk (Korea Institute of Science and Technology Information, Supercomputing Center) ;
  • Lee, Seung-Min (Korea Institute of Science and Technology Information, Supercomputing Center)
  • 발행 : 2012.06.22

초록

매우 빠른 GPU의 성능과 저가의 개발 비용으로, 최신 GPU는 대용량 계산과학 분야에 꼭 필수적인 자원으로 등장하였다. 이 논문에서는 멀티-GPU 클러스터 시스템에서 GPU 컴퓨팅 기술을 적용한 대용량 Monte Carlo 알고리즘을 개발하였다. MPI와 CUDA를 동시에 적용한 결과 8개 GPU까지 병렬 확장성을 얻을 수 있었다. 병렬 성능 확장성 분석 결과, 멀티-GPU 클러스터에서는 GPU 사이의 데이터 통신이 전체 프로그램 성능 향상을 결정하는 매우 중요한 요인임을 보였다.

키워드