DOI QR코드

DOI QR Code

Gradual Block-based Efficient Lossy Location Coding for Image Retrieval

영상 검색을 위한 점진적 블록 크기 기반의 효율적인 손실 좌표 압축 기술

  • Choi, Gyeongmin (Department of Computer Engineering, Sejong University) ;
  • Jung, Hyunil (Department of Computer Engineering, Sejong University) ;
  • Kim, Haekwang (Department of Computer Engineering, Sejong University)
  • 최경민 (세종대학교 컴퓨터공학과) ;
  • 정현일 (세종대학교 컴퓨터공학과) ;
  • 김해광 (세종대학교 컴퓨터공학과)
  • Received : 2012.12.12
  • Accepted : 2013.02.27
  • Published : 2013.03.30

Abstract

Image retrieval research activity has moved its focus from global descriptors to local descriptors of feature point such as SIFT. MPEG is Currently working on standardization of effective coding of location and local descriptors of feature point in the context mobile based image search driven application in the name of MPEG-7 CDVS (Compact Descriptor for Visual Search). The extracted feature points consist of two parts, location information and Descriptor. For efficient image retrieval, we proposed a novel method that is gradual block-based efficient lossy location coding to compress location information according to distribution in images. From experimental result, the number of average bits per feature point reduce 5~6% and the accuracy rate keep compared to state of the art TM 3.0.

MPEG-7 CDVS (Compact Descriptor for Visual Search)분야에서 표준화하고 있는 현대의 모바일 디바이스 및 서버에서 사용되는 영상검색과 매칭 알고리즘들은 SIFT(scale invariant feature transform)와 SURF(speeded up robust features) 같은 강인한 디스크립터를 기반으로 하는 특징 점에 의한 알고리즘으로 이루어진다. 이러한 특징 점들은 크게 좌표와 디스크립터로 나누어져 있다. 빠르고 정확한 검색을 위해서 특징 점들은 디바이스에서 서버, 또는 서버에서 디바이스로 자유롭게 전송이 되어야 하므로 과거에 여러 압축 알고리즘들이 제안 되었다. 이 논문에서는 특징 점들의 분포 및 연관성 등을 관찰하고 연구하여 좌표의 정보를 효율적으로 압축하면서 정확도를 보존할 수 있는 점진적 블록 크기 기반의 손실 좌표 압축 알고리즘을 제안한다. 실험 결과로부터 현재 가장 효율이 좋은 알고리즘 보다 특징 점당 비트가 평균적으로 0.3~0.4bit(5%~6%) 감소하고 정확도(TP,FP,TN)가 데이터 종류에 따라 유지되거나 미약하게 상승하는 결과를 얻었다.

Keywords

References

  1. Yuri Reznik. Compact Descriptors for Visual Search: Applications and Use Scenarios Requirements Subgroup.MPEG N11529. 2010.
  2. ISO/MPEG N4320, MPEG-7 Requirements Document, v 15, F. Pereira, ed., MPEG Requirements Group, Sydney, July 2001.
  3. D. Lowe, Distinctive image features from scale-invariant keypoints," International Journal of Computer Vision, vol. 60, no. 2, pp. 91-110,November 2004. https://doi.org/10.1023/B:VISI.0000029664.99615.94
  4. H. Bay, T. Tuytelaars, and L. V. Gool, "SURF:speeded up robust features," in European Conferenceon Computer Vision, Graz, Austria, May 2006, pp.404-417.
  5. S. Tsai, D. Chen, G. Takacs, V. Chandrasekhar, J. P. Singh, and B. Girod, "Location Coding for Mobile Image Retrieval," in Proc. International Mobile Multimedia Communications Conference, Sept. 2009.
  6. ISO/IEC JTC1/SC29/WG11/M24758, "Improvements to location coding : Reponse to CE3 - Feature Point Location Coding", Geneva, CH, April 2012
  7. ISO/IEC JTC1/SC29/WG11/M24782, "Peking University's Response to the CDVS Core Experiment 3", Geneva, CH, April 2012
  8. ISO/IEC JTC1/SC29/WG11/M24802, "Huawei's response to CDVS Core Experiment 3", Geneva, CH, April 2012
  9. ISO/IEC JTC1/SC29/WG11/W12929, "Test Model 3: Compact Descriptors for Visual Search," Stockholm, SE, Jul. 2012.