DOI QR코드

DOI QR Code

A Post-Verification Method of Near-Duplicate Image Detection using SIFT Descriptor Binarization

SIFT 기술자 이진화를 이용한 근-복사 이미지 검출 후-검증 방법

  • 이유진 (서강대학교 컴퓨터공학과) ;
  • 낭종호 (서강대학교 컴퓨터공학과)
  • Received : 2015.01.09
  • Accepted : 2015.03.16
  • Published : 2015.06.15

Abstract

In recent years, as near-duplicate image has been increasing explosively by the spread of Internet and image-editing technology that allows easy access to image contents, related research has been done briskly. However, BoF (Bag-of-Feature), the most frequently used method for near-duplicate image detection, can cause problems that distinguish the same features from different features or the different features from same features in the quantization process of approximating a high-level local features to low-level. Therefore, a post-verification method for BoF is required to overcome the limitation of vector quantization. In this paper, we proposed and analyzed the performance of a post-verification method for BoF, which converts SIFT (Scale Invariant Feature Transform) descriptors into 128 bits binary codes and compares binary distance regarding of a short ranked list by BoF using the codes. Through an experiment using 1500 original images, it was shown that the near-duplicate detection accuracy was improved by approximately 4% over the previous BoF method.

최근 이미지 컨텐츠에 쉽게 접근할 수 있는 인터넷 환경과 이미지 편집 기술들의 보급으로 근-복사 이미지가 폭발적으로 증가하면서 관련 연구가 활발하게 이루어지고 있다. 그러나 근-복사 이미지 검출 방법으로 주로 쓰이는 BoF(Bag-of-Feature)는 고차원의 지역 특징을 저차원으로 근사화하는 양자화과정에서 서로 다른 특징들을 같다고 하거나 같은 특징을 다르다고 하는 한계가 발생할 수 있으므로 이를 극복하기 위한 후-검증 방법이 필요하다. 본 논문에서는 BoF의 후-검증 방법으로 SIFT(Scale Invariant Feature Transform) 기술자를 128bit의 이진 코드로 변환한 후 BoF 방법에 의하여 추출된 짧은 후보 리스트에 대하여 변환한 코드들간의 거리를 비교하는 방법을 제안하고 성능을 분석하였다. 1500장의 원본이미지들에 대한 실험을 통하여 기존의 BoF 방법과 비교하여 근-복사 이미지 검출 정확도가 4% 향상됨을 보였다.

Keywords

Acknowledgement

Grant : 클라우드 기반 개방형 소셜 방송미디어 콘텐츠 융합 생성, 편집 및 재생을 위한 미디어 제작 및 전송 시스템 개발

Supported by : 정보통신기술연구진흥센터

References

  1. S. Lazebnik, C. Schmid, and J. Ponce, "Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories," Proc. of IEEE Conference on Computer Vision and Pattern Recognition, Vol. 2, pp. 2169-2178, 2006.
  2. E. Nowak, F. Jurie, and B. Triggs, "Sampling Strategies for Bag-of-Features Image Classification," Proc. of European Conference on Computer Vision, pp. 490-503, May. 2006.
  3. H. Jegou, M. Douze, and C. Schmid, "Improving Bag-of-Feature for Large Scale Image Search," International Journal of Computer Vision, Vol. 87, No. 3, pp. 316-336, 2010. https://doi.org/10.1007/s11263-009-0285-2
  4. H. Jegou, M. Douze, and C. Schmid, "Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search," Proc. of European Conference on Computer Vision, pp. 304-317, Oct. 2008.
  5. K. He, F. Wen, and J. Sun, "K-means Hashing: an Affinity-Preserving Quantization Method for Learning Binary Compact Codes," Proc. of IEEE Conference on Computer Vision and Pattern Recognition, pp. 2938-2945, 2013.
  6. D. Lowe, "Distinctive Image Features from Scale-Invariant Keypoints," International Journal of Computer Vision, Vol. 60, No. 2, pp. 91-110, 2004. https://doi.org/10.1023/B:VISI.0000029664.99615.94
  7. Y. Ke, R. Sukthankar, and L. Huston, "Efficient Near-Duplicate Detection and Sub-Image Retrieval," Proc. of ACM International Conference on Multimedia, Vol. 4, No. 1, pp. 869-876, 2004.
  8. J. Sivic and A. Zisserman, "Efficient Visual Search of Videos Cast as Text Retrieval," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 31, No. 4, pp. 591-606, 2009. https://doi.org/10.1109/TPAMI.2008.111
  9. J. Lee, Y. J. Lee, and J. Nang, "Implementation of Near-Duplicate Image Detection System based on Bag of Feature," Proc. of the KIISE Korea Computer Congress 2014, pp. 1427-1429, 2014. (in Korean)