A Study on the Efficient Feature Vector Extraction for Music Information Retrieval System

음악 정보검색 시스템을 위한 효율적인 특징 벡터 추출에 관한 연구

  • 윤원중 (단국대학교 정보ㆍ컴퓨터학부 컴퓨터과학 전공) ;
  • 이강규 (단국대학교 정보ㆍ컴퓨터학부 컴퓨터과학 전공) ;
  • 박규식 (단국대학교 정보ㆍ컴퓨터학부 컴퓨터과학 전공)
  • Published : 2004.10.01

Abstract

In this Paper, we propose a content-based music information retrieval (MIR) system base on the query-by-example (QBE) method. The proposed system is implemented to retrieve queried music from a dataset where 60 music samples were collected for each of the four genres in Classical, Hiphop. Jazz. and Reck. resulting in 240 music files in database. From each query music signal, the system extracts 60 dimensional feature vectors including spectral centroid. rolloff. flux base on STFT and also the LPC. MFCC and Beat information. and retrieves queried music from a trained database set using Euclidean distance measure. In order to choose optimum features from the 60 dimension feature vectors, SFS method is applied to draw 10 dimension optimum features and these are used for the Proposed system. From the experimental result. we can verify the superior performance of the proposed system that provides success rate of 84% in Hit Rate and 0.63 in MRR which means near 10% improvements over the previous methods. Additional experiments regarding system Performance to random query Patterns (or portions) and query lengths have been investigated and a serious instability problem of system Performance is Pointed out.

본 논문에서는 Classic, Hiphop, Jazz, Rock 4개의 장르로 곡을 구분하여 각 장르별 60곡씩 총 240곡의 음악 DB를 대상으로 예제 질의 (QBE) 방식의 음악 정보 검색 시스템을 제안하였다. 제안된 시스템은 입력 질의로부터 spectral centroid, rolloff, flux등 STFT기반의 특징들과 MFCC, LPC, Beat 정보 등의 총 60차의 특징 벡터들을 추출한후 Euclidean 유사도를 측정해서 DB내의 해당 음악을 검색한다. 실제 검색에 사용되는 특징 벡터는 SFS (Sequential Forward Selection) 기법을 사용하여 10차 특징 벡터로 최적화 되며 검색 실험결과 평균 84% Hit Rate 와 0.63 MRR의 성공률을 보이고 있어 기존의 연구 결과보다 약 10%이상의 성능 향상을 보였다. 한편 본 논문에서는 실제 시스템 사용 환경을 고려하여 임의 질의 구간과 임의 질의 길이에 대한 시스템 성능 평가를 수행하였으며 실험 결과 이러한 임의성에 기인한 검색 성능의 불안정성을 지적하였다.

Keywords

References

  1. E. Wold. T. Blum, D. Keislar, and J. Wheaton, 'Content-based classification, search and retrieval of audio,' IEEE Multimedia, 3(2), 1996
  2. T. Zhang and C. -C. Jay Kuo, 'Hierarchical System for Content-based Audio Classification and Retrieval,' Proceedings of SPIE's Conference on Multimedia Storage and Archiving Systems III, SPIE, 3527, pp. 398-409, Boston, Nov., 1998
  3. G. Tzanetakis, Manipulation, Analysis and Retrieval Systems for Audio, PhD Thesis in Computer Science from Princeton University, June, 2002
  4. P G. Guo and S. Z. Li, 'Content-based audio classification and retrieval by support vector machine,' IEEE Trans. on neural networks, 14(1), 209-215, Jan. 2003 https://doi.org/10.1109/TNN.2002.806626
  5. A. Ghias, J. Logan, D. Chamberlin, and B. Smith, 'Query by Humming: Musical Information Retrieval in an Audio Database,' ACM Multimedia, 213-236,1995
  6. Melucci, M. and Orio, N., 'Musical Information Retrieval using Melodic Surface,' Proceedings of the fourth ACM conference on Digital libraries, pp. 152-160, August 1999
  7. R.J. McNab, L. Smith, I.H. Witten, and C.L. Henderson, 'Tune Retrieval in the Multimedia Library,' Multimedia Tools and Applications, 10, 113-132,2000 https://doi.org/10.1023/A:1009606600500
  8. Lutz Prechelt and Rainer Typke, 'An Interface for Melody Input,' ACM Transactions on Computer-Human Interaction, 8(2), pp. 133-149, June 2001 https://doi.org/10.1145/376929.376978
  9. J. J. Burred and A. Lerch, 'A hierarchical approach to automatic musical genre classification,' in Proc. DAFx03, 2003, 308-311
  10. S. Doraisamy and S. Ruger, 'Robust polyphony music retrieval with N-grams,' Journal of Intelligent Information Systems, 21(1), 53-70, 2003 https://doi.org/10.1023/A:1023553801115
  11. 조용춘, 김광희, 이배호, '효율적인 웨이블렛 기반 오디오 데이터 검색 시스템의 구현,' 한국음향학회지, 21(1), 82-88, 2002