DOI QR코드

DOI QR Code

Parallelization of Feature Detection and Panorama Image Generation using OpenCL and Embedded GPU

OpenCL 및 Embedded GPU를 이용한 영상 특징 추출 및 파노라마 영상 생성의 병렬화

  • 강승헌 (인하대학교 정보통신공학과) ;
  • 이승재 (인하대학교 정보통신공학과) ;
  • 이만희 (인하대학교 정보통신공학과) ;
  • 박인규 (인하대학교 정보통신공학과)
  • Received : 2014.03.17
  • Accepted : 2014.05.08
  • Published : 2014.05.30

Abstract

In this paper, we parallelize the popular feature detection algorithms, i.e. SIFT and SURF, and its application to fast panoramic image generation on the latest embedded GPU. Parallelized algorithms are implemented using recently developed OpenCL as the embedded GPGPU software platform. We compare the implementation efficiency and speed performance of conventional OpenGL Shading Language and OpenCL. Experimental result shows that implementation on OpenCL has comparable performance with GLSL. Compared with the performance on the embedded CPU in the same application processor, the embedded GPU runs 3~4 times faster. As an example of using feature extraction, panorama image synthesis is performed on embedded GPU by applying image matching using detected features.

본 논문에서는 최신 embedded GPU를 사용하여 영상의 특징 추출 알고리즘(SIFT, SURF)을 병렬화하고, 특징 추출 및 정합 결과를 이용하여 파노라마 영상을 GPU에서 고속으로 생성하는 방법을 제안한다. 병렬화 된 알고리즘의 GPGPU(general purpose computation on GPU) 구현은 최신 스마트폰의 embedded GPU에서 지원하기 시작한 OpenCL을 이용하였다. 본 논문에서는 GPU에서 OpenGL Shading Language(GLSL)를 이용한 기존의 병렬화와 OpenCL을 이용한 새로운 병렬화 구현 결과를 효과적인 코드 구현 방법과 수행속도 관점에서 비교하였다. 실험결과, OpenCL은 GLSL과 유사한 수행 속도를 보였으며 embedded CPU와 비교하여 약 3~4배 빠른 수행속도를 보였다. 구현한 특징 추출 결과의 응용 사례로써, 특징 정합을 통한 영상 정합을 GPU상에서 병렬 수행하여 여러 장의 영상으로부터 파노라마 영상을 고속으로 생성하는 사례를 보인다.

Keywords

References

  1. I. K. Park, N. Singhal, M. H. Lee, S. Cho, and C. Kim, "Design and performance evaluation of image processing algorithms on GPUs," IEEE Trans. on Parallel and Distributed Systems, vol. 22, no. 1, pp. 91-104, January 2011. https://doi.org/10.1109/TPDS.2010.115
  2. N. Singhal, J. W. Yoo, H. Y. Choi, and I. K. Park, "Implementation and optimization of image processing algorithms on embedded GPU," IEICE Trans. on Information and Systems, E95-D(5):1475-1484, May 2012 https://doi.org/10.1587/transinf.E95.D.1475
  3. J. Lee, S. H. Kang, M. H. Lee, S. Li, H. Kim, I. K. Park, , "Real-time parallel image processing library using mobile GPU," Journal of KIISE: Computing Practices and Letters, vol. 20, no. 2, pp. 96-100, February 2014.
  4. D. Lowe, "Distinctive image features from scale-invariant keypoints," International Journal of Computer Vision, vol. 60, no. 2, pp. 91-110, November 2004. https://doi.org/10.1023/B:VISI.0000029664.99615.94
  5. H. Bay, A. Ess, T. Tuytelaars, and L. V. Gool, "Speeded-up robust features," Computer Vision and Image Understanding, vol. 110, no. 3, pp. 346-359, June 2008. https://doi.org/10.1016/j.cviu.2007.09.014
  6. The Khronos Group, OpenGL Shading Language, https://www.opengl.org/documentation/glsl/.
  7. The Khronos Group, Open Computing Language (OpenCL), http://www.khronos.org/opencl/.
  8. S. H. Kang, S.-J. Lee, and I. K. Park, "Parallelization and optimization of feature dtection algorithms on embedded GPU," Proc. International Workshop on Advanced Image Technology, pp. 164-167, January 2014.
  9. R. I. Hartley and A. Zisserman, Multiple View Geometry in Computer Vision, Second Edition, Cambridge University Press, 2004.
  10. M. A. Fischler and R. C. Bolles, "Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography," Communications of the ACM, vol. 24, no. 6, pp. 381-395, June 1981. https://doi.org/10.1145/358669.358692