DOI QR코드

DOI QR Code

MCLT 피크쌍 기반의 강인한 해시 함수를 이용한 오디오 핑거프린팅

Audio Fingerprinting Using a Robust Hash Function Based on the MCLT Peak-Pair

  • 이준용 (광운대학교 전파공학과) ;
  • 김형국 (광운대학교 전파공학과)
  • 투고 : 2014.11.18
  • 심사 : 2015.01.16
  • 발행 : 2015.03.31

초록

본 논문은 MCLT(Modulated complex lapped transform) 피크쌍 기반의 강인한 해시 함수를 이용한 오디오 핑거프린팅을 제안한다. 기존 방식의 오디오 핑거프린팅은 시간-스케일, 피치-이동, 이퀄라이제이션과 같은 다양한 왜곡이 발생했을 때, 강인한 핑거프린트를 추출하지 못한다는 문제점이 있다. 이를 해결하기 위해 본 논문에서는 MCLT 스펙트럼, 현저한 피크검색을 위한 적응적 문턱값 방식, 개선된 해시 함수를 이용하여 잡음과 왜곡 환경 강인한 오디오 핑거프린팅을 추출하였다. 실험결과 제안된 방식이 잡음과 왜곡 환경에서 보다 강인한 핑거프린팅을 추출할 수 있으며 매칭 인식률을 향상 시키는 것을 보여준다.

In this paper, we propose an audio fingerprinting using robust hash based on the MCLT (Modulated Complex Lapped Transform) peak-pair. In existing methods, the robust audio fingerprinting is not generated if various distortions occurred; time-scaling, pith-shifting and equalization. To solve this problem, we used the spectrum of the MCLT, an adaptive thresholding method for detection of prominent peaks and the novel hash function in the audio fingerprinting. Experimental results show that the proposed method is highly robust in various distorted environments and achieves better identification rates compared to other methods.

키워드

참고문헌

  1. W. Li, C. Xiao, and Y. Liu, "Low-order auditory Zernike moment: a novel approach for robust music identification in the compressed domain," EURASIP J. on Advances in Signal Processing, 1-15 (2013).
  2. A. Wang, "An industrial strength audio search algorithm," 4th International Conference Music Information Retrieval, 7-13 (2003).
  3. M. K. Mihcak and R. Venkatesan, "A perceptual audio hashing algorithm: A tool for robust audio identication and information hiding," In: Lett. Notes in Computer Science 2137, 51-65 (2001).
  4. T. Jiang, R. Wu, J. Li, K. Xiang, and F. Dai, "A real-time peak discovering method for audio fingerprinting," 5th International Conference on Internet Multimedia Computing and Service, 368-371 (2013).
  5. S. Fenet, G. Richard, and Y. Grenier, "A scalable audio fingerprint method with robustness to pitch-shifting," 12th International Society for Music Information Retrieval Conference, 121-126 (2011).