DOI QR코드

DOI QR Code

A Study of Integral Image Hardware Design for Memory Size Efficiency

메모리 크기에 효율적인 적분영상 하드웨어 설계 연구

  • Lee, Su-Hyun (Department of Electronic Communication Engineering, Kwangwoon University) ;
  • Jeong, Yong-Jin (Department of Electronic Communication Engineering, Kwangwoon University)
  • 이수현 (광운대학교 전자통신공학과) ;
  • 정용진 (광운대학교 전자통신공학과)
  • Received : 2014.04.22
  • Accepted : 2014.09.02
  • Published : 2014.09.25

Abstract

The integral image is the sum of input image pixel values. It is mainly used to speed up processing of a box filter operation, such as Haar-like features. However, large memory for integral image data can be an obstacle on an embedded hardware environment with limited memory resources. Therefore, an efficient method to store the integral image is necessary. In this paper, we propose a memory size reduction hardware design for integral image. The hardware design is used two methods. It is the new integral image memory and modulo calculation for reducing integral image data. The new integral image memory has additional calculation overhead, but it is not obstacle in hardware environment that parallel processing is possible. In the Xilinx Virtex5-LX330T targeted experimental result, integral image memory can be reduced by 50% on a $640{\times}480$ 8-bit gray-scale input image.

적분영상은 입력영상의 픽셀 값을 기준좌표부터 순차적으로 누적하여 만든 영상으로, Haar-like features와 같은 네모난 박스 모양의 필터 연산을 효율적으로 처리하기 위하여 사용된다. 그러나 적분영상은 입력영상보다 3배 이상 많은 메모리를 소모하기 때문에, 메모리 자원이 제한적인 하드웨어 설계 환경에서는 사용이 어렵다. 본 논문에서는 효율적인 메모리 사용을 위한 적분영상 하드웨어 설계 방법을 제안한다. 해당 방법은 적분영상 이외에 세로적분영상과 가로적분영상을 생성하고, 입력영상을 재사용 하는 방법을 사용한다. 그리고 박스 필터의 크기에 따라 modulo 연산을 적용하여 적분영상의 데이터 크기를 줄이는 방법을 함께 적용하였다. 적분 영상 데이터를 읽기 위해 나누어진 영상 데이터를 다시 덧셈해야하는 연산 오버헤드가 발생하지만, 4개의 데이터를 단순히 더하는 연산이므로 병렬처리가 가능한 하드웨어 환경에서는 큰 영향을 미치지 않는다. Xilinx사의 Virtex5-LX330T를 대상으로 실험한 결과 $640{\times}480$ 크기의 8bit gray-scale 입력영상에서 최대 $32{\times}32$ 크기의 필터사용을 기준으로 50%의 적분영상 메모리를 감소시킬 수 있다.

Keywords

References

  1. Crow, F., "Summed-area tables for texture mapping," in SIGGRAPH'84: Proceedings of the 11th annual conference on Computer graphics and interactive techniques, New York, NY, USA, 1984, pp. 207-212, ACM.
  2. Bay, H., Tuytelaars, T. and Gool, Luc V., "Speeded Up RobustFeatures (SURF)," in Computer Vision and Image Understanding, Vol. 110, No. 3, pp. 346-359, June 2008. https://doi.org/10.1016/j.cviu.2007.09.014
  3. Viola, P. and Jones, M. "Rapid Object Detection using a BoostedCascade of Simple Features," in Proceedings of CVPR 2001, pp. 511-518.
  4. Su-hyun Lee, Yong-jin Jeong, "A design and implementation of Face Detection hardware", Journal of the Institute of Electronics Engineers of Korea Vol. 51, NO. 9, pp.43-54, April 2007.
  5. Su-hyun Lee, Yong-jin Jeong., "A New Integral Image Structure for Memory Size Reduction," IEICE Transactions on Information and Systems, Volume E97-D No.4, pp. 998-1000, 2014. https://doi.org/10.1587/transinf.E97.D.998
  6. Belt, H.J.W., "Word length reduction for the integral image," ICIP 2008, 15th IEEE International Conference on Image Processing, San Diago, USA, pp. 805 -808, 2008.
  7. "Virtex-5 Family Overview", DS100(v5.0), (C)XILINX, February 6, 2009.
  8. "LogiCORE IP Block Memory Generator v4.3", DS512, (C)XILINX, September 21, 2010.