Apache TVM 기반 HPC 워크로드의 오토튜닝 성능 최적화 연구

A Study on Auto-Tuning Performance Optimization of HPC Workloads Based on Apache TVM

  • 권오경 (한국과학기술정보연구원 슈퍼컴퓨팅본부)
  • Oh-Kyoung Kwon (National Supercomputing Center, Korea Institute of Science and Technology Information)
  • 발행 : 2024.10.31

초록

최근 고성능 컴퓨팅(HPC) 환경에서는 이기종 컴퓨팅 자원의 보편화로 인해 다양한 하드웨어 아키텍처에서의 프로그램 최적화가 필수적이다. 이에 따라 수작업 없이도 하드웨어에 맞춤형 최적화를 자동으로 수행할 수 있는 오토튜닝 기술의 중요성이 커지고 있다. 본 연구에서는 Apache TVM을 활용하여 HPC 워크로드에서의 성능 최적화 가능성을 탐구하였다. 밀집 행렬 연산(GEMM)과 희소 행렬 연산(SpMM)을 주요 워크로드로 설정하고, 국가슈퍼컴퓨터센터의 5호기 누리온에서 실험을 진행하였다. GEMM 연산에서는 누리온 KNL과 Skylake 노드에서 각각 209배, 87배의 성능 향상을 확인하였고, SpMM 연산에서는 BCSR 포맷 기준으로 최대 117배, 10배의 성능 향상이 이루어졌다. 본 연구는 Apache TVM이 인공지능 분야를 넘어 HPC 워크로드에서도 성능 최적화에 유효한 도구임을 시사하며, 향후 다양한 이기종 컴퓨팅 환경에의 적용 가능성을 제시한다.

키워드

과제정보

이 성과는 과학기술정보통신의 재원으로 한국연구재단의 지원을 받아 수행된 연구입니다(RS-2023-00283799).

참고문헌

  1. Tianqi Chen, et al. "TVM: an automated end-to-end optimizing compiler for deep learning", OSDI'18: Proceedings of the 13th USENIX conference on Operating Systems Design and Implementation
  2. Sun, H. et al. Selective Protection for Sparse Iterative Solvers to Reduce the Resilience Overhead. SBAC-PAD, Porto, Portugal, September 2020.
  3. Asanovic, K. et al. A view of the parallel computing landscape. Commun. ACM 2009, 52, 56-67.