The Comparison of features for Speech/Music Discrimination

음성/음악 분류를 위한 특징 비교

  • Lee Kyong Rok (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University) ;
  • Seo Bong Su (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University) ;
  • Kim Jin Young (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University)
  • 이경록 (전남대 전자공학과 멀티미디어 DSP 연구실) ;
  • 서봉수 (전남대 전자공학과 멀티미디어 DSP 연구실) ;
  • 김진영 (전남대 전자공학과 멀티미디어 DSP 연구실)
  • Published : 2000.07.07

Abstract

본 논문에서는 멀티미디어 정보에서 원하는 정보를 추출하는 멀티미디어 인덱싱 중 오디오 인덱싱의 전처리 부격인 음성/음악 분류실험을 하였다. 오디오 인덱싱에 있어서 음성/음악 분류기는 원 오디오 신호에서 정보를 가진 음성 부분을 분리하는 역할을 한다. 실험에서는 음성/음악 분류에서 널리 쓰이는 멜캡스트럼(Mel Cepstrum), 정규화 로그 에너지(normalized log energy), 영교차(Zero-Crossings)를 특징 파라미터로 사용하였다[l, 2, 3]. 특징공간은 GMM(Gaussian Mixture Model)에 의해 모델링 되었고, 오디오 신호의 분류는 각각 3가지 분류항목(음성, 음악, 음성+음악)과 2가지 분류항목(음성, 음악)을 적용하였다. 실험결과 3가지 분류항목 적용시와 2가지 분류항목 적용시 모두 멜캡스트럼을 사용하였을 때 가장 좋은 결과를 보였다.

Keywords