DOI QR코드

DOI QR Code

인텔 차세대 매니코어 프로세서에서의 다중 병렬 프로그램 성능 향상기법 연구

Enhancing the Performance of Multiple Parallel Applications using Heterogeneous Memory on the Intel's Next-Generation Many-core Processor

  • 노승우 (한국과학기술정보연구원 슈퍼컴퓨터소프트웨어연구실) ;
  • 김서영 (한국과학기술정보연구원 슈퍼컴퓨터소프트웨어연구실) ;
  • 남덕윤 (한국과학기술정보연구원 슈퍼컴퓨터소프트웨어연구실) ;
  • 박근철 (한국과학기술정보연구원 슈퍼컴퓨터소프트웨어연구실) ;
  • 김직수 (명지대학교 컴퓨터공학과)
  • 투고 : 2017.03.28
  • 심사 : 2017.06.12
  • 발행 : 2017.09.15

초록

본 논문에서는 고성능컴퓨팅 분야에서 주로 활용되는 MPI 응용들을 인텔의 차세대 매니코어 프로세서인 Knights Landing(KNL)에서 실행할 때 발생할 수 있는 성능 병목 현상 및 이를 해결하기 위한 효율적인 자원 할당 방법에 대해서 논의하고자 한다. KNL은 기존의 가속기 형태의 매니코어 프로세서 형태뿐만 아니라 자체적으로 부팅이 가능한 형태의 호스트 프로세서로 구성되어 있으며, 기존의 DDR4 기반의 메모리와 함께 향상된 대역폭을 가진 새로운 형태의 온-패키지 메모리를 장착해서 출시되었다. 이러한 새로운 매니코어 프로세서 아키텍처에 최적화된 자원 할당 방법을 연구함으로써 다중 MPI 응용 실행 성능의 향상과 전체적인 시스템 활용률을 높일 수 있음을 실험적으로 검증하였다.

This paper discusses performance bottlenecks that may occur when executing high-performance computing MPI applications in the Intel's next generation many-core processor called Knights Landing(KNL), as well as effective resource allocation techniques to solve this problem. KNL is composed of a host processor to enable self-booting in addition to an existing accelerator consisting of a many-core processor, and it was released with a new type of on-package memory with improved bandwidth on top of existing DDR4 based memory. We empirically verified an improvement of the execution performance of multiple MPI applications and the overall system utilization ratio by studying a resource allocation method optimized for such new many-core processor architectures.

키워드

과제정보

연구 과제번호 : 빅데이터 처리 고도화 핵심기술개발 사업 총괄 및 고성능컴퓨팅 기술을 활용한 성능 가속화 기술 개발

연구 과제 주관 기관 : 정보통신기술진흥센터

참고문헌

  1. G. Manimaran, R. Murthy, and K. Ramamritham, "A new approach for scheduling of parallelizable tasks in real-time multiprocessor systems," Proc. of the Real-Time Systems, pp. 39-60, 1998.
  2. A. Sodani, "Knights landing (KNL): 2nd Generation $Intel{(R)}$ Xeon Phi processor," Hot Chips 27 Symposium (HCS) IEEE 2015, 2015.
  3. J. Jeddeloh and B. Keeth, "Hybrid memory cube new DRAM architecture increases density and performance," Proc. of the VLSIT, 2012.
  4. An Intro to MCDRAM (High Bandwith Memory) on Knights Landing(KNL): [Online]. Available:https://software.intel.com/en-us/blogs/2016/01/20/an-introto-mcdram-high-bandwidth-memory-on-knights-landing (downloaded 2017, Jan. 10)
  5. K. Kandalla, et al., "Optimizing Cray MPI and SHMEM Software Stacks for Cray-XC Supercomputers based on Intel KNL Processors," Proc. of the Cray User Group, 2016.
  6. C. Rosales, J. Cazes, K. Milfeld, A. Gomez-Iglesias, L. Koesterke, L. Huang, and J. Vienne, "A comparative study of application performance and scalability on the Intel Knights Landing processor," Proc. of the International Conference on High Performance Computing, pp. 307-318, 2016.
  7. C. Pasquale, K. Bittel, and J. Kraiman, "A Static and Dynamic Workload Characterization Study of the San Diego Supercomputer Center CRAY X-MP," Proc. of the 1991 ACM SIGMETRICS Conference on Measurement and Modeling of Computer Systems, pp. 218-219, 1991.
  8. G. Park, S. Kim, J. Kim, and D. Nam, "Profiling Parallel Program Execution Patterns for effectively leveraging high-bandwidth on-package memory," Proc. of the Communications of the Korean Institute of Information Scientists and Engineers Winter Conference 2016, pp. 42-44, 2016.
  9. Slurm Workload Manager [Online]. Available: http://slurm.schedmd.com/ (downloaded 2017, Feb. 5)