DOI QR코드

DOI QR Code

A study on how to generate GPU usage statistics for each task in a cluster system operated by shared node policy

공유노드 정책으로 운영 중인 클러스터 시스템에서 작업별 GPU 사용 통계 생성 방안에 대한 연구

  • Kwon, Min-Woo (Dept. of Supercomputing Infrastructure Center, KISTI) ;
  • Yoon, JunWeon (Dept. of Supercomputing Infrastructure Center, KISTI) ;
  • Hong, TaeYoung (Dept. of Supercomputing Infrastructure Center, KISTI)
  • 권민우 (한국과학기술정보연구원 슈퍼컴퓨팅인프라센터) ;
  • 윤준원 (한국과학기술정보연구원 슈퍼컴퓨팅인프라센터) ;
  • 홍태영 (한국과학기술정보연구원 슈퍼컴퓨팅인프라센터)
  • Published : 2022.11.21

Abstract

KISTI(한국과학기술정보연구원)는 슈퍼컴퓨터 5호기 메인시스템인 Nurion과 보조시스템인 Neuron을 연구자들에게 서비스하고 있다. Neuron은 메인시스템인 Nurion이 Intel Knights Landing 프로세서가 장착된 클러스터로 구성됨에 따라 인공지능, 빅데이터에 관한 연구 인프라 수요를 충족시키기 위해 GPU를 장착한 이기종 클러스터로 구성되어 있다. Neuron은 연구자들에게 효율적으로 계산 자원을 배분하기 위해 SLURM 작업배치스케줄러의 공유노드 정책을 이용하여 한 개의 계산노드에서 다수 개의 작업이 수행될 수 있는 환경으로 서비스되고 있다. 본 논문에서는 공유노드 정책으로 운영 중인 클러스터 시스템에서 작업별로 GPU 사용 통계 데이터를 생성하는 기법을 소개한다.

Keywords