Speech Enhancement for Voice commander in Car environment

차량환경에서 음성명령어기 사용을 위한 음성개선방법

  • 백승권 (한국정보통신대학교 공학부 멀티미디어 그룹) ;
  • 한민수 (한국정보통신대학교 공학부 멀티미디어 그) ;
  • 남승현 (배제대학교 전자공학) ;
  • 이봉호 (한국전자통신연구원 무선방송 연구) ;
  • 함영권 (한국전자통신연구원 무선방송 연구부)
  • Published : 2004.03.01

Abstract

In this paper, we present a speech enhancement method as a pre-processor for voice commander under car environment. For the friendly and safe use of voice commander in a running car, non-stationary audio signals such as music and non-candidate speech should be reduced. Ow technique is a two microphone-based one. It consists of two parts Blind Source Separation (BSS) and Kalman filtering. Firstly, BSS is operated as a spatial filter to deal with non-stationary signals and then car noise is reduced by kalman filtering as a temporal filter. Algorithm Performance is tested for speech recognition. And the results show that our two microphone-based technique can be a good candidate to a voice commander.

본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다 특히 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단일 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman 필터를 이용하여 시간상 단구간 정적 잡음을 제거한다. 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다.

Keywords

References

  1. L. Parra and C. Spence, 'Convolutive blind separation of nonstationary sources,' IEEE Trans. Speech Audio Processing, vol. 8, pp. 320-327, May 2000
  2. S.Jeong and M. Hahn, 'Speech quality and recognition rate improvement in car noise environments,' Electronics Letters, vol. 37, No 12, pp. 800-801, June, 2001
  3. A.J. Bell and T.J. Sejnowski, 'An information-maximization approach to blind separation and blind deconvolution,' Neural Computation, vol. 7, no. 6, pp. 1129-1159, 1995
  4. C. Fancourt and L. Parra, 'Coherence function as a criterion for blind source separation,' in IEEE International Workshop on Neural Networks and Signal Processing 2001, 2001, pp. 303-312