DOI QR코드

DOI QR Code

Fast View Synthesis Using GPGPU

GPGPU를 이용한 고속 영상 합성 기법

  • Shin, Hong-Chang (Department of Electronics and Computer Engineering, Hanyang University) ;
  • Park, Han-Hoon (NHK Science & Technical Research Laboratories) ;
  • Park, Jong-Il (Department of Electronics and Computer Engineering, Hanyang University)
  • 신홍창 (한양대학교 전자통신컴퓨터공학과) ;
  • 박한훈 (일본 NHK 방송기술연구소) ;
  • 박종일 (한양대학교 전자통신컴퓨터공학과)
  • Published : 2008.11.30

Abstract

In this paper, we develop a fast view synthesis method that generates multiple intermediate views in real-time for the 3D display system when the camera geometry and depth map of reference views are given in advance. The proposed method achieves faster view synthesis than previous approaches in GPU by processing in parallel the entire computations required for the view synthesis. Specifically, we use $CUDA^{TM}$ (by NVIDIA) to control GPU device. For increasing the processing speed, we adapted all the processes for the view synthesis to single instruction multiple data (SIMD) structure that is a main feature of CUDA, maximized the use of the high-speed memories on GPU device, and optimized the implementation. As a result, we could synthesize 9 intermediate view images with the size of 720 by 480 pixels within 0.128 second.

본 논문은 3차원 디스플레이 시스템에서 카메라의 기하 정보 및 참조 영상들의 깊이 맵 정보가 주어졌을 때, 다수의 중간 시점 영상을 실시간으로 생성하는 고속 영상 합성 기법을 제안한다. 기본적으로 본 논문에서는 영상 합성 기법의 모든 과정을 GPU에 서 병렬 처리함으로써 고속화 할 수 있었다. 병렬처리를 이용한 고속화 효율을 높이기 위해 최근 NVIDIA사에서 발표한 $CUDA^{TM}$를 이용하였다. 영상 합성을 위한 모든 중간 과정을 CUDA로 처리하기 위해 병렬구조로 변환하고, GPU 상의 고속메모리의 사용을 극대화하고, 알고리즘 구현을 최적화함으로써 고속화 효율을 높일 수 있었다. 결과적으로 본 논문에서는 양안 영상과 깊이 지도를 이용하여 가로 720, 세로 480 크기의 9개의 시점 영상을 0.128초 이내에 생성할 수 있었다.

Keywords

References

  1. O. Schreer, P. Kauff, and T. Sikora, 3D Videocommunication, John Wiley & Sons, 2005
  2. C. L. Zitnick et al, "High-quality video view interpolation using a layered representation," ACM Transactions on Graphics, vol. 23, no. 3, pp. 600-608, 2004 https://doi.org/10.1145/1015706.1015766
  3. J. Park, G. Um, C. Ahn, and C.-T. Ahn, "Virtual control of optical axis of the 3DTV camera for reducing visual fatigue in stereoscopic 3DTV," ETRI Journal, pp. 597-604, 2004 https://doi.org/10.4218/etrij.04.0603.0024
  4. A.-R. Mansouri and J. Konrad, "Bayesian winner-take-all reconstruction of intermediate views from stereoscopic images," IEEE Trans. Image Processing, vol. 9, pp. 1710-1722, 2000 https://doi.org/10.1109/83.869183
  5. N. Cornelis and L. Van Gool, "Fast scale invariant feature detection and matching on programmable graphics hardware," Proc. of Workshop on Visual Computer Vision on GPUs, June, 2008
  6. Y. Luo and R. Duraiswami, "Canny edge detection on NVIDIA CUDA," Proc. of Workshop on Visual Computer Vision on GPUs, June, 2008
  7. V. Vineet and P. J. Narayanan, "CUDA cuts: fast graph cuts on the GPU," Proc. of Workshop on Visual Computer Vision on GPUs, June, 2008
  8. http://vision.middlebury.edu/stereo/data/
  9. http://www.hhi.fraunhofer.de/
  10. http://www.nvidia.com/object/cuda_home.html
  11. http://developer.download.nvidia.com/compute/cuda/1_1/ NVIDIA_CUDA_Programming_Guide_1.1.pdf