A Robust Speech/Non-Speech Decision Using Voiced Characteristics of Speech

Lee, Sung-Joo;Jung, Ho-Young;Lee, Yun-Keun;Kim, Hyung-Soon;

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2007.05a
/
Pages.411-412
/
2007
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

A Robust Speech/Non-Speech Decision Using Voiced Characteristics of Speech

음성의 유성음 특성을 이용한 음성/비음성 판별 방법

Lee, Sung-Joo (Electronics and Telecommunications Research Institute (ETRI)) ;
Jung, Ho-Young (Electronics and Telecommunications Research Institute (ETRI)) ;
Lee, Yun-Keun (Electronics and Telecommunications Research Institute (ETRI)) ;
Kim, Hyung-Soon (Pusan National University (PNU))

이성주 (한국전자통신연구원) ;
정호영 (한국전자통신연구원) ;
이윤근 (한국전자통신연구원) ;
김형순 (부산대학교)

Published : 2007.05.11

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

자동음성인식 시스템을 이용하는 사용자 입장에서 보면 음성인식시스템을 사용하기 위하여 음성을 입력할 때마다 버튼을 눌러야 하는 Push-To-Talk (PTT) 방식은 여간 번거로운 일이 아닐 수 없다. 그리고 사용자가 원거리에서 음성을 입력하는 경우처럼 PTT 방식 자체가 용이하지 못 한 음성인식 응용분야에서는 Non-Push-To-Talk (NON-PTT) 방식의 필요성이 대두되게 된다. NON-PTT 방식의 음성 전처리를 위해서는 입력신호로부터 음성신호만을 구분해내는 음성판별기술이 필수적이다. 하지만 일상적인 잡음환경에서 음성신호만을 구분해내는 일은 매우 어려운 일이 아닐 수 없다. 본 논문에서는 일상적인 가정잡음환경에 강인한 음성판별방식을 제안한다. 여기서는 음성판별을 위해서 음성의 유성음 특성을 이용하였다. 즉, 일정구간 이상의 음성신호에는 일정구간이상의 유성음 구간이 존재하며 만약 잡음환경에서도 유성음 구간을 잘 검출할 수 있다면 이러한 음성의 특성을 이용하여 검출된 신호가 음성인지 아닌지를 판별할 수 있다. 이를 위하여 여기서는 가정잡음환경에서도 유성음을 잘 검출할 수 있도록 11 가지 유성음 특징들과 이를 이용한 음성판별방법을 제안하였다. 제안된 방법의 성능 평가를 위하여 음성의 끝점검출방법과 통합하여 음성/비음성 판별 테스트를 수행하였으며 테스트 수행결과 열악한 잡음환경에서 80%이상의 비음성을 거절하는 성능을 보였다.

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

A Robust Speech/Non-Speech Decision Using Voiced Characteristics of Speech

음성의 유성음 특성을 이용한 음성/비음성 판별 방법

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)