Fixed-Point Modeling and Performance Analysis of a SIFT Keypoints Localization Algorithm for SoC Hardware Design

SoC 하드웨어 설계를 위한 SIFT 특징점 위치 결정 알고리즘의 고정 소수점 모델링 및 성능 분석

  • Park, Chan-Ill (Department of Electronics and Communications Engineering, Kwangwoon University) ;
  • Lee, Su-Hyun (Department of Electronics and Communications Engineering, Kwangwoon University) ;
  • Jeong, Yong-Jin (Department of Electronics and Communications Engineering, Kwangwoon University)
  • 박찬일 (광운대학교 전자통신공학과) ;
  • 이수현 (광운대학교 전자통신공학과) ;
  • 정용진 (광운대학교 전자통신공학과)
  • Published : 2008.06.25

Abstract

SIFT(Scale Invariant Feature Transform) is an algorithm to extract vectors at pixels around keypoints, in which the pixel colors are very different from neighbors, such as vortices and edges of an object. The SIFT algorithm is being actively researched for various image processing applications including 3-D image constructions, and its most computation-intensive stage is a keypoint localization. In this paper, we develope a fixed-point model of the keypoint localization and propose its efficient hardware architecture for embedded applications. The bit-length of key variables are determined based on two performance measures: localization accuracy and error rate. Comparing with the original algorithm (implemented in Matlab), the accuracy and error rate of the proposed fixed point model are 93.57% and 2.72% respectively. In addition, we found that most of missing keypoints appeared at the edges of an object which are not very important in the case of keypoints matching. We estimate that the hardware implementation will give processing speed of $10{\sim}15\;frame/sec$, while its fixed point implementation on Pentium Core2Duo (2.13 GHz) and ARM9 (400 MHz) takes 10 seconds and one hour each to process a frame.

본 논문에서는 SIFT(Scale Invariant Feature Transform) 알고리즘을 임베디드 환경에서 실시간으로 처리하기 위해 가장 연산량이 많은 특징점 위치 결정 단계를 고정 소수점 모델로 설계 및 분석하고 그에 근거한 하드웨어 구조를 제안한다. SIFT 알고리즘은 객체의 꼭지점이나 모서리와 같이 색상 성분의 차가 심한 구역에서 얻어진 특징점 주위 픽셀의 벡터성분을 추출하는 알고리즘으로, 현재 얼굴인식, 3차원 객체 인식, 파노라마, 3차원 영상 복원 작업의 핵심 알고리즘으로 연구 되고 있다. 본 알고리즘에 대한 최적의 하드웨어 구현을 위해 특징점 위치(Keypoint Localization)와 방향(Orient Assignment)에 대한 정확도, 오차율을 사용하여 고정 소수점 모델에서 각 중요 변수들의 비트 크기를 결정 한다. 얻어진 고정 소수점 모델은 원래의 부동 소수점 모델과 비교했을 때 정확도 93.57%, 오차율 2.72%의 결과를 보이며, 고정 소수점 모델은 부동 소수점 모델과 비교하여 제거된 특징점의 대부분이 두 영상에서 추출된 특징점 끼리의 매칭과정에서 불필요한 객체의 모서리 영역에 몰려있음을 확인했다. 고정 소수점 모델링 결과 ARM 400MHz 환경에서 약 3시간, Pentium Core2Duo 2.13GHz 환경에서 약 15초의 연산시간을 갖는 부동 소수점 모델이 동일한 환경에서 약 1시간과 10초의 연산시간을 가지며, 최적화된 고정 소수점 모델을 하드웨어로 구현 시 $10{\sim}15\;frame/sec$의 성능을 보일 것으로 예상한다.

Keywords

References

  1. D. G. Lowe. "Object recognition from local scaleinvariant features." In Proceedings of the Seventh International Conference on Computer Vision (ICCV''99), pages 1150-1157, Kerkyra, Greece, September 1999
  2. D. G. Lowe, "Distinctive image features from scale invariant keypoints", International Journal of Computer Vision, vol. 60, no. 2, 2004
  3. Cristina Cabani, W. James MacLean, "A Proposed Pipelined-Architecture for FPGA-Based Affine-Invariant Feature Detectors." accepted for presentation at The Second IEEE Workshop on Embedded Computer Vision Systems, New York, June 2006
  4. Cabani C, MacLean WJ. "Implementation of an Affien-Covariant Feature Detector in Field-Programmable Gate Arrays", International Conference on Computer Vision Systems 2007, Bielefeld, Germany, March 21-24, 2007
  5. Stephen Se and Piotr Jasiobedzki, "Photo- realistic 3D Model Reconstruction", Procedings of IEEE International Conference on Robotics and Automation, ICRA 2006, pages 3076-3082, Orlando, Florida, May 2006
  6. Tim Barfoot, Stephen Se, Piotr Jasiobedzki, "Vision-based Localization and Terrain Modelling for Planetary Rovers", Chapter in Intelligence for Space Robotics, A. Howard and E. Tunstel, editors, TSI Press, Albuquerque, NM, 2006
  7. Pettersson. N, Petersson. L, "Online stereo calibration using FPGAs", Intelligent Vehicles Symposium, 2005. Proceedings. IEEE, 6-8, June, 2005
  8. M. brown and D. G. Lowe. "Recognising Panoramas-slides." University of British Columbia, 2004
  9. M. Brown and D. G. Lowe. "Recognising Panoramas." Ninth IEEE International Conference on Computer Vision (ICCV'03) - Volume 2, 2003
  10. 정성태, Visual C++을 이용한 실용 영상처리, 생능출판사, 2007