DOI QR코드

DOI QR Code

An Optimization Method for Hologram Generation on Multiple GPU-based Parallel Processing

다중 GPU기반 홀로그램 생성을 위한 병렬처리 성능 최적화 기법

  • 국중진 (상명대학교 정보보안공학과)
  • Received : 2019.05.16
  • Accepted : 2019.05.23
  • Published : 2019.06.30

Abstract

Since the computational complexity for hologram generation increases exponentially with respect to the size of the point cloud, parallel processing using CUDA and/or OpenCL library based on multiple GPUs has recently become popular. The CUDA kernel for parallelization needs to consist of threads, blocks, and grids properly in accordance with the number of cores and the memory size in the GPU. In addition, in case of multiple GPU environments, the distribution in grid-by-grid, in block-by-block, or in thread-by-thread is needed according to the number of GPUs. In order to evaluate the performance of CGH generation, we compared the computational speed in CPU, in single GPU, and in multi-GPU environments by gradually increasing the number of points in a point cloud from 10 to 1,000,000. We also present a memory structure design and a calculation method required in the CUDA-based parallel processing to accelerate the CGH (Computer Generated Hologram) generation operation in multiple GPU environments.

홀로그램의 생성을 위한 연산은 포인트 클라우드의 규모에 따라 연산량이 기하급수적으로 증가하기 때문에 최근에는 다중의 GPU를 기반으로 CUDA 또는 OpenCL 라이브러리를 활용한 병렬처리가 이루어지고 있다. GPU기반의 병렬처리를 위한 CUDA 커널은 GPU의 코어 개수와 메모리 크기를 고려하여 쓰레드(thread), 블록(block), 그리드(grid)를 구성해야 하며, 다중 GPU 환경인 경우 GPU의 개수에 따른 그리드, 블록, 또는 쓰레드 단위의 분산처리가 필요하다. 본 논문에서는 CGH 생성에 대한 성능평가를 위해 포인트 클라우드의 포인트 개수를 10~1,000,000개 범위에서 점진적으로 증가시키면서 CPU, 단일 GPU, 다중 GPU 환경에서 연산 속도를 비교해 보았으며, 다중 GPU 환경에서 CGH(Computer Generated Hologram) 생성 연산을 가속화하기 위한 CUDA 기반의 병렬처리 과정에서 요구되는 메모리 구조 설계와 연산 방법을 제안한다.

Keywords

References

  1. Peter Wai Ming Tsang, Ting-Chung Poon, "Review on the State-of-the-Art Technologies for Acquisition and Display of Digital Holograms," IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, Vol.12, No.3, pp.886-901. 2016. https://doi.org/10.1109/TII.2016.2550535
  2. 임용준 김진웅, "가상, 증강 및 혼합현실을 위한 디지털 홀로그래피 기술 연구 동향," 정보통신기술진흥센터, 주간기술동향-AR, VR, MR, pp. 1-13, Dec. 2018.
  3. Tomoyoshi S., Tomoyoshi I., Nobuyuki M., Yasuyuki I., and Naoki, T. 2010, "Fast calculation of computer-generated-hologram on AMD HD5000 series GPU and OpenCL," OSA OPTICS EXPRESS. Vol. 18, No. 10, pp. 9955-9960, May. 2010. https://doi.org/10.1364/OE.18.009955
  4. Tomoyoshi S., Nobuyuki M., Takashige S., Satoru H., Shinobu T., Tomoyoshi I., "Special-purpose computer for holography HORN-3 with PLD technology," Computer Physics Communications, Vol. 130, Issues 1-2, pp. 75-82, Jul. 2000. https://doi.org/10.1016/S0010-4655(00)00044-8
  5. T. Yatagai, "Stereoscopic approach to 3-D display using computer-generated holograms," Applied Optics, Vol. 15, pp. 2722-2729, 1976. https://doi.org/10.1364/AO.15.002722
  6. M. Yamaguchi, H. Hoshino, T. Honda and N. Ohyama, "phase-added stereogram: calculation of hologram using computer graphic technique," in Practical holographic VII, S. A. Benton, ed., Proc. SPIE 1914, pp. 25-33, 1993.
  7. Yongchao Liu*, Douglas L Maskell and Bertil Schmidt, CUDASW++: optimizing Smith-Waterman sequence database searches for CUDA-enabled graphics processing units, BMC Research Notes, BioMed Central, May 2009,
  8. Tomoyoshi S., Tomoyoshi I., Nobuyuki M., Yasuyuki I., and Naoki T., "Fast calculation of computer-generated-hologram on AMD HD5000 series GPU and OpenCL" OPTICS EXPRESS 9955, Vol. 18, No. 10, pp. 9955-9960, 2010. https://doi.org/10.1364/OE.18.009955
  9. 이성욱, 변기범, 김기수, 홍지만, "GPGPU를 이용한 영상 품질 측정 프로그램의 가속화 연구," 스마트미디어저널, 제5권, 제4호, 69-74쪽, 2016년 12월
  10. 최홍준, 김철홍, "범용 그래픽 처리 장치의 메모리 설계를 위한 그래픽 처리 장치의 메모리 특성 분석," 스마트미디어저널, 제3권, 제1호, 33-38쪽, 2014년 3월
  11. 손동오, 심규연, 김철홍, "작업 처리 단위 변화에 따른 GPU 성능과 메모리 접근 시간의 관계 분석," 스마트미디어저널, 제4권, 제4호, 56-63쪽, 2015년 12월