Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
- spring
- /
- Pages.157-160
- /
- 2000
The Comparison of features for Speech/Music Discrimination
음성/음악 분류를 위한 특징 비교
- Lee Kyong Rok (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University) ;
- Seo Bong Su (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University) ;
- Kim Jin Young (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University)
- Published : 2000.07.07
Abstract
본 논문에서는 멀티미디어 정보에서 원하는 정보를 추출하는 멀티미디어 인덱싱 중 오디오 인덱싱의 전처리 부격인 음성/음악 분류실험을 하였다. 오디오 인덱싱에 있어서 음성/음악 분류기는 원 오디오 신호에서 정보를 가진 음성 부분을 분리하는 역할을 한다. 실험에서는 음성/음악 분류에서 널리 쓰이는 멜캡스트럼(Mel Cepstrum), 정규화 로그 에너지(normalized log energy), 영교차(Zero-Crossings)를 특징 파라미터로 사용하였다[l, 2, 3]. 특징공간은 GMM(Gaussian Mixture Model)에 의해 모델링 되었고, 오디오 신호의 분류는 각각 3가지 분류항목(음성, 음악, 음성+음악)과 2가지 분류항목(음성, 음악)을 적용하였다. 실험결과 3가지 분류항목 적용시와 2가지 분류항목 적용시 모두 멜캡스트럼을 사용하였을 때 가장 좋은 결과를 보였다.
Keywords