Speech Recognition in Noisy Environments Using Modified Gain Function

변형된 이득함수를 이용한 잡음 환경에서의 음성인식

  • Jin, Ho-Sung (School of Electrical Engineering and Computer Science, Kyungpook National University) ;
  • Lee, Sang-Ho (Samsung Electronics Co., LTD.) ;
  • Hong, Jae-Keun (College of IT Engineering, Kyungpook National University)
  • 진호성 (경북대학교 전자전기컴퓨터학부) ;
  • 이상호 ((주)삼성전자) ;
  • 홍재근 (경북대학교 IT대학 전자공학부)
  • Published : 2010.05.28

Abstract

본 논문에서는 2단계 잡음제거 방법의 이득함수를 이용한 고조파 복원 잡음제거 방법의 이득함수를 조정하여 기존의 방법보다 음성개선을 향상시켰고, 제안한 방법으로 개선된 음성을 음성인식 기술에 적용하였다. 본 논문에서는 기존 방법으로 음성개선 결과 묵음구간에서 음성구간으로 변화는 구간에서 이전 프레임의 추정된 음성신호로 스펙트럼의 이득함수가 구해져서 음성이 발생하는 구간에서 왜곡이 발생한다. 따라서 본 논문에서는 이러한 현상을 개선시키기 위해 2단계 잡음제거 방법의 이득함수를 추정된 a priori SNR과 비교하여 이득함수를 조정하고, 2단계 잡음제거 방법의 이득함수를 고조파 복원 방법의 이득함수와 비교하여 이득함수를 조정하여 음성을 개선하는 방법을 제안하였다. 그리고 음성인식을 위한 특징벡터 추출을 위해 제안한 방법으로 개선된 음성의 대수 에너지를 정규화 하는 대수 에너지 정규화 방법(Log Energy Normalization)을 음성인식 방법에 적용하였다.

Keywords