Comparison of Two Speech Estimation Algorithms Based on Generalized-Gamma Distribution Applied to Speech Recognition in Car Noisy Environment

자동차 잡음환경에서의 음성인식에 적용된 두 종류의 일반화된 감마분포 기반의 음성추정 알고리즘 비교

  • 김형국 (광운대학교 전파공학과) ;
  • 이진호 (광운대학교 전파공학과)
  • Published : 2009.08.31

Abstract

This paper compares two speech estimators under a generalized Gamma distribution for DFT-based single-microphone speech enhancement methods. For the speech enhancement, the noise estimation based on recursive averaging spectral values by spectral minimum noise is applied to two speech estimators based on the generalized Gamma distribution using $\kappa$=1 or $\kappa$=2. The performance of two speech enhancement algorithms is measured by recognition accuracy of automatic speech recognition(ASR) in car noisy environment.

본 논문은 DFT기반의 단일마이크 음성향상 방식에 적용된 두 종류의 generalized-Gamma 분포기반의 음성추정 알고리즘을 비교한다. 음성향상 방식으로서는 최소잡음성분에 의한 회귀적인 평균스펙트럼 값으로부터 유도되는 잡음 추정을 각각 $\kappa$=1인 경우와 $\kappa$=2인 경우의 Gamma 분포를 이용한 음성추정 기법에 결합하여 음질을 향상시켰다. 각 방식에 의해 향상된 음성신호를 자동차 환경에서의 음성인식에 적용하여 그 성능을 비교하였다.

Keywords

References

  1. R. Martin, "Noise power spectral density estimation based on optimal smoothing and minimum statistics," IEEE Trans. Speech and Audio Proc., vol. 9, no 5, pp. 504-512, July 2001. https://doi.org/10.1109/89.928915
  2. I. Cohen and B. Berdugo, "Speech enhancement for non-stationary environments," Signal Processing, vol. 81, no. 11, pp. 2403-2418, Nov. 2001. https://doi.org/10.1016/S0165-1684(01)00128-1
  3. J. S. Erkelens, R. C. Hendriks, R. Heusdens, and J. Jensen, "Minimum mean-square error estimation of discrete Fourier coefficients with generalized Gamma priors," IEEE Trans. Audio, Speech and Language Proc., vol. 15, no. 6, pp. 1741-1752, Aug. 2007. https://doi.org/10.1109/TASL.2007.899233
  4. Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator," IEEE Trans. Acoustics, Speech and Signal Proc., vol. 33, no. 2, pp. 443-445, Dec. 1985. https://doi.org/10.1109/TASSP.1985.1164550
  5. 김형국, 신동, 이진호, “잡음에 강인한 음성인식을 위한 generalized Gamma 분포기반과 spectral gain floor를 결합한 음성향상기법,” 한국ITS학회 논문지, 제3권, 제2호, pp. 64-70, 2009. 6.