DOI QR코드

DOI QR Code

Invariant Classification and Detection for Cloth Searching

의류 검색용 회전 및 스케일 불변 이미지 분류 및 검색 기술

  • 황인성 (연세대학교 전기전자공학부) ;
  • 조법근 (연세대학교 전기전자공학부) ;
  • 전승우 (연세대학교 전기전자공학부) ;
  • 최윤식 (연세대학교 전기전자공학부)
  • Received : 2014.03.19
  • Accepted : 2014.04.21
  • Published : 2014.05.30

Abstract

The field of searching clothing, which is very difficult due to the nature of the informal sector, has been in an effort to reduce the recognition error and computational complexity. However, there is no concrete examples of the whole progress of learning and recognizing for cloth, and the related technologies are still showing many limitations. In this paper, the whole process including identifying both the person and cloth in an image and analyzing both its color and texture pattern is specifically shown for classification. Especially, deformable search descriptor, LBPROT_35 is proposed for identifying the pattern of clothing. The proposed method is scale and rotation invariant, so we can obtain even higher detection rate even though the scale and angle of the image changes. In addition, the color classifier with the color space quantization is proposed not to loose color similarity. In simulation, we build database by training a total of 810 images from the clothing images on the internet, and test some of them. As a result, the proposed method shows a good performance as it has 94.4% matching rate while the former Dense-SIFT method has 63.9%.

의류 검색 분야는 의류의 비정형 특성으로 인해 매우 어려운 분야로 인식 오류 및 연산량을 줄이기 위한 노력이 많이 진행되어 왔으나 이를 위한 학습 및 인식 과정 전체에 대한 구체적인 사례가 없고 일부 관련 기술들은 아직 많은 한계를 보이고 있다. 이에 본 논문에서는 입력된 영상에서 사람 객체를 파악하여 착용한 의상으로부터 색상, 무늬, 질감 등 의상이 가질 수 있는 특성 정보를 분석하여, 이를 분류하고 검색하는 방법에 대한 전 과정을 구체적으로 보였다. 특히, 의류의 패턴 및 무늬 등을 구분하기 위한 비정형 의류 검색을 위한 LBPROT_35 디스크립터를 제안하였다. 이 제안 방식은 영상의 통계적 특징을 분석하는 기존의 LBP_ROT(Local Binary Pattern with ROTation-invariant) 방식에 추가로 원 영상에 크기 변화가 생겨도 검색해 낼 수 있도록 하는 특성이 추가된 것이며, 이를 통해 비정형 의류 검색 시 옷이 회전되어 있거나 스케일에 변화가 있어도 높은 검색율을 얻을 수 있게 되었다. 또한 색 공간을 11개의 구간으로 양자화 하는 방식을 이용하여 컬러 분류를 구현하여, 의류 검색에 있어서 중요한 컬러 유사성을 상실하지 않도록 하였다. 한편, 인터넷 상의 의류 사진들로부터 추출한 총 810장의 트레이닝 이미지로 데이터베이스를 구축하고 이들 중 36장을 질의영상으로 테스트 한 결과, 94.4%의 인식률을 보이는 등 Dense-SIFT 대비 높은 인식률을 보였다.

Keywords

References

  1. Kumar, S. Suresh, and L. Ganesan. "Texture classification using wavelet based laws energy measure." International Journal of Soft Computing 3.4, 293-296, 2008.
  2. Yang, Ming, and Kai Yu. "Real-time clothing recognition in surveillance videos." Image Processing (ICIP), 2011 18th IEEE International Conference on. IEEE, 2011.
  3. Zhang, Jianguo, et al. "Local features and kernels for classification of texture and object categories: A comprehensive study." International journal of computer vision 73.2 (2007): 213-238, 2007. https://doi.org/10.1007/s11263-006-9794-4
  4. Pietikainen, Matti, Timo Ojala, and Zelin Xu. "Rotation-invariant texture classification using feature distributions." Pattern Recognition 33.1 (2000): 43-52, 2000. https://doi.org/10.1016/S0031-3203(99)00032-1
  5. Yuan, Shuai, YingLi Tian, and Aries Arditi. "Clothing matching for visually impaired persons." Technology and disability 23.2 (2011): 75-85, 2011.
  6. Timo Ahonen, Jiri Matas, Chu He, and Matti Pietikanen, "Rotation Invariant Image Description with Local Binary Pattern Histogram Fourier Features", LNCS 5575, pp. 61-70, 2009.
  7. Viola, Paul, and Michael J. Jones. "Robust real-time face detection." International journal of computer vision 57.2 (2004): 137-154, 2004. https://doi.org/10.1023/B:VISI.0000013087.49260.fb
  8. D. G. Lowe. Object recognition from local scale-invariant features. In IEEE International Conference on Computer Vision (ICCV), pages 1150-1157, Kerkyra, Greece, 1999.
  9. C. Liu, J. Yuen, A. Torralba, J. Sivic, and W. T. Freeman. SIFT flow:dense correspondence across different scenes. In European Conference on Computer Vision (ECCV), 2008.
  10. L. Wolf, T. Hassner, and Y. Taigman, "Descriptor based methods in the wild," in Proc. ECCV, 2008.
  11. J. Ruiz-del-Solar, R. Verschae, and M. Correa, "Recognition of faces in unconstrained environments: A comparative study," EURASIP Journal on Advances in Signal Processing, vol. 2009, pp. 1-20, 2009.
  12. T. Ahonen, A. Hadid, and M. Pietikainen, "Face description with local binary patterns: Application to face recognition," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 28, no. 12, pp. 2037-2041, 2006. https://doi.org/10.1109/TPAMI.2006.244
  13. Y. Rodriguez and S. Marcel, "Face authentication using adapted local binary pattern histograms," Lecture Notes in Computer Science, vol. 3954, p. 321, 2006.
  14. Canny, John. "A computational approach to edge detection." Pattern Analysis and Machine Intelligence, IEEE Transactions on 6 (1986): 679-698, 1986.
  15. Joblove, George H. and Greenberg, Donald (August 1978). "Color spaces for computer graphics". Computer Graphics 12 (3): 20-25, 1978. https://doi.org/10.1145/965139.807362
  16. Swain, Michael J., and Dana H. Ballard. "Color indexing." International journal of computer vision 7.1 (1991): 11-32, 1991. https://doi.org/10.1007/BF00130487
  17. M. J. Swain and D. H. Ballard, "Color indexing," IJCV, vol.7, no. 1, pp. 11-32, 1991. https://doi.org/10.1007/BF00130487
  18. J. L. Bentley. Multidimensional binary search trees used for associative searching. Communications of the ACM, 18(9):509-517, 1975. https://doi.org/10.1145/361002.361007
  19. Silpa-Anan, Chanop, and Richard Hartley. "Optimised KD-trees for fast image descriptor matching." Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on. IEEE, 2008.
  20. Xindong Wu, Vipin Kumar, J. Ross Quinlan, Joydeep Ghosh, Qiang Yang, Hiroshi Motoda, Geoffrey J. McLachlan, Angus Ng, Bing Liu, Philip S. Yu, Zhi-Hua Zhou, Michael Steinbach, David J. Hand, and Dan Steinberg. 2007. Top 10 algorithms in data mining. Knowl. Inf. Syst. vol.14, no.1, pp.1-37, Dec. 2007.
  21. Elkan, Charles. "Using the triangle inequality to accelerate k-means." ICML. Vol. 3. 2003.