The Comparison of features for Speech/Music Discrimination

Lee Kyong Rok;Seo Bong Su;Kim Jin Young;

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

spring
/
Pages.157-160
/
2000

The Acoustical Society of Korea (한국음향학회)

The Comparison of features for Speech/Music Discrimination

음성/음악 분류를 위한 특징 비교

Lee Kyong Rok (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University) ;
Seo Bong Su (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University) ;
Kim Jin Young (Multimedia DSP Lab Dept. of Electronic Engineering, Chonnam National University)

이경록 (전남대 전자공학과 멀티미디어 DSP 연구실) ;
서봉수 (전남대 전자공학과 멀티미디어 DSP 연구실) ;
김진영 (전남대 전자공학과 멀티미디어 DSP 연구실)

Published : 2000.07.07

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 멀티미디어 정보에서 원하는 정보를 추출하는 멀티미디어 인덱싱 중 오디오 인덱싱의 전처리 부격인 음성/음악 분류실험을 하였다. 오디오 인덱싱에 있어서 음성/음악 분류기는 원 오디오 신호에서 정보를 가진 음성 부분을 분리하는 역할을 한다. 실험에서는 음성/음악 분류에서 널리 쓰이는 멜캡스트럼(Mel Cepstrum), 정규화 로그 에너지(normalized log energy), 영교차(Zero-Crossings)를 특징 파라미터로 사용하였다[l, 2, 3]. 특징공간은 GMM(Gaussian Mixture Model)에 의해 모델링 되었고, 오디오 신호의 분류는 각각 3가지 분류항목(음성, 음악, 음성+음악)과 2가지 분류항목(음성, 음악)을 적용하였다. 실험결과 3가지 분류항목 적용시와 2가지 분류항목 적용시 모두 멜캡스트럼을 사용하였을 때 가장 좋은 결과를 보였다.

Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)

The Comparison of features for Speech/Music Discrimination

음성/음악 분류를 위한 특징 비교

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)