DOI QR코드

DOI QR Code

NVIDIA Tegra와 Tesla GPU에서의 CPU-GPU 데이터 전송성능 연구

A Performance Study on CPU-GPU Data Transfers of NVIDIA Tegra and Tesla GPUs

  • 권오경 (한국과학기술정보연구원 슈퍼컴퓨팅본부) ;
  • 구기범 (한국과학기술정보연구원 슈퍼컴퓨팅본부)
  • Kwon, Oh-Kyoung (National Supercomputing Center, Korea Institute of Science and Technology Information) ;
  • Gu, Gibeom (National Supercomputing Center, Korea Institute of Science and Technology Information)
  • 발행 : 2021.11.04

초록

최근 HPC, 인공지능에서 GPU 성능이 향상되면서 사용이 보편화되고 있지만 GPU 프로그래밍은 난이도 측면에서 여전히 큰 장애물이다. 특히 호스트(host) 메모리와 GPU 메모리를 따로 관리해야 하는 어려움 때문에 편의성과 성능 측면에서 연구가 활발히 진행되고 있으며, 다양한 CPU-GPU 메모리 전송프로그래밍 방법들이 제시되고 있다. 본 연구는 NVIDIA Tegra 장치들과 NVIDIA SMX 기반 V100 GPU 카드에서 CPU-GPU 데이터 전송 기법별로 성능비교를 하고자 한다. 특히 NVIDIA Tegra 장치는 CPU와 GPU 통합메모리를 제공하고 있어서 CPU-GPU 메모리 전송방법의 관점에서 기존 GPU 장치와 다른 성능 특징을 보여준다. 성능비교를 위한 실험 워크로드는 HPC 응용프로그램에서 빈번하게 사용하는 2차원 행렬 전치 예제를 사용하였다. 실험을 통해 각 GPU 장치별로 CPU-GPU 메모리 전송 방법에 따른 GPU 커널 성능차이, 페이지 잠긴 메모리와 페이지 가능 메모리의 전송 성능차이, 마지막으로 전체 성능비교를 하였다.

키워드

과제정보

이 논문은 대한민국 정부(과학기술정보통신부)의 재원으로 한국연구재단 슈퍼컴퓨터개발선도사업의 지원을 받아 수행된 연구임 (과제번호 : 2020M3H6A1084857)