DOI QR코드

DOI QR Code

A study on comparison and analysis of interconnect network communication performance between computing nodes in GPU cluster system

GPU 클러스터 시스템의 계산노드 간 인터커넥트 네트워크 통신 성능 비교 분석 연구

  • Min-Woo Kwon (Dept. of Supercomputing Infrastructure Center, KISTI) ;
  • Do-Sik An (Dept. of Supercomputing Infrastructure Center, KISTI) ;
  • TaeYoung Hong (Dept. of Supercomputing Infrastructure Center, KISTI)
  • 권민우 (한국과학기술정보연구원 슈퍼컴퓨팅인프라센터) ;
  • 안도식 (한국과학기술정보연구원 슈퍼컴퓨팅인프라센터) ;
  • 홍태영 (한국과학기술정보연구원 슈퍼컴퓨팅인프라센터)
  • Published : 2023.11.02

Abstract

KISTI의 GPU 클러스터 시스템인 뉴론은 NVIDIA의 A100과 V100 GPU가 총 260개 탑재되어 있는 클러스터 시스템이다. 뉴론의 계산노드들은 고성능의 인터커넥트인 Infiniband(IB) 케이블로 연결되어 있어 멀티 노드 작업 수행 시에 고대역 병렬통신이 가능하다. 본 논문에서는 NVIDIA사에서 제공하는 NCCL의 벤치마크 코드를 이용하여 인터커넥트 네트워크의 통신 성능을 비교분석하는 방안에 대해서 소개한다.

Keywords

Acknowledgement

이 논문은 2023년도 한국과학기술정보연구원(KISTI)의 기본사업(과제번호:K-23-L02-C01-S01) 및 자체사업(과제번호:J-23-NB-C03-S01)으로 수행된 연구입니다.