DOI QR코드

DOI QR Code

A Study on Running Large-Scale Deep Learning on Nurion System

누리온 시스템 상에서 거대 규모 딥러닝 수행 연구

  • Myung, Hunjoo (Korea Institute of Science and Technology Information)
  • Published : 2019.10.30

Abstract

누리온 시스템은 Intel Xeon Phi 아키텍쳐를 기반한 8305개의 노드로 구성되었고, 이론 성능 25.7페타플롭스를 갖춘 시스템으로 2018년도에 도입되었다. 누리온 시스템은 그동안 KISTI가 지속적으로 수행해 온 국내 계산과학자를 지원하는 한편, 빅데이터를 기반으로 하는 거대 규모의 딥러닝 등의 새로운 AI 분야에서도 슈퍼컴퓨팅을 활용할 수 있도록 전략적으로 지원하고 있다. 본 논문에서는 이러한 거대 규모 딥러닝을 수행하는데 있어 발생하는 주요 이슈들과 이러한 이슈들을 누리온 시스템에서는 어떻게 해결하고 있는지에 대해 소개한다.

Keywords