한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현

An Implementation of Automatic Genre Classification System for Korean Traditional Music

  • 이강규 (단국대학교 정보 컴퓨터공학부) ;
  • 윤원중 (단국대학교 정보 컴퓨터공학부) ;
  • 박규식 (단국대학교 정보 컴퓨터공학부)
  • 발행 : 2005.01.01

초록

본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.

This paper proposes an automatic genre classification system for Korean traditional music. The Proposed system accepts and classifies queried input music as one of the six musical genres such as Royal Shrine Music, Classcal Chamber Music, Folk Song, Folk Music, Buddhist Music, Shamanist Music based on music contents. In general, content-based music genre classification consists of two stages - music feature vector extraction and Pattern classification. For feature extraction. the system extracts 58 dimensional feature vectors including spectral centroid, spectral rolloff and spectral flux based on STFT and also the coefficient domain features such as LPC, MFCC, and then these features are further optimized using SFS method. For Pattern or genre classification, k-NN, Gaussian, GMM and SVM algorithms are considered. In addition, the proposed system adopts MFC method to settle down the uncertainty problem of the system performance due to the different query Patterns (or portions). From the experimental results. we verify the successful genre classification performance over $97{\%}$ for both the k-NN and SVM classifier, however SVM classifier provides almost three times faster classification performance than the k-NN.

키워드

참고문헌

  1. E. Wold, T. Blum, D. Keislar, and J. Wheaton, 'Content-based classification, search, and retrieval of audio,' IEEE Multimedia, 3(2), 1996
  2. G. Tzanetakis and P. Cook, 'Musical genre classification of audio signals,' IEEE Trans. on Speech and Audio Processing, 10(5), pp. 293-302, July 2002 https://doi.org/10.1109/TSA.2002.800560
  3. T. Li, M. Ogihara and O. Li, 'A comparative study on content-based music genre classification,' in Proc. of the 26th annual internal ACM SIGIR, pp. 282-289, ACM Press, July 2003
  4. D. N. Jiang, L. Lu and H. J. Zhang, 'Music type classification by spectra contrast features,' in Proc. ICME2002, 2002, pp. 113-116
  5. G. Guo and S. Z. Li, 'Content-based audio classification and retrieval by support vector machine,' IEEE Trans. on neural networks, 14(1), pp. 209-215, Jan. 2003 https://doi.org/10.1109/TNN.2002.806626
  6. J. Foote et al, 'An overview of audio information retrieval,' ACM-Springer Multimedia Systems, 7(1), pp. 2-11, Jan. 1999 https://doi.org/10.1007/s005300050106
  7. Y. Wang, Z. Liu and J. Huang, 'Multimedia content analysis: using both audio and visual clues,' IEEE Signal Proc. Mag., Nov. 2000
  8. S. Blackburn, 'Content based retrieval and navigation of music', 1999, Mini-thesis, University of Southampton
  9. Kyu-Sik Park, Won-Jung Yoon, Kang-Kue Lee, 'A Robust Approach to Content-Based Musical Genre Classification and Retrieval Using Multi-Feature Clustering' ASIAN2004, Thailand, Dec. 2004
  10. J. M. Gray, 'An Exploration of Musical Timbre', PhD thesis, Dept. of Psychology, Stanford University, 1975
  11. M. J. Carey, E. S. Parris, and H. Lloyd-Thomas, 'A comparison of features for speech, music discrimination', In Proc. ICASSP, pp. 1432-1436, March 1999
  12. J. Makhoul, 'Linear prediction: A tutorial overview', Proceedings of the IEEE, Apr. 1975
  13. B.Logan, 'Mel Frequency Cepstral Coefficients for Music Modeling', In proc. Int. Symposium on Music Information Retrieval (ISMIR), 2000
  14. R. Duda, P. Hart and D. Stork, Pattern Classification, 2nd Ed., Wiley-Interscience Publication, 2001