Robust Speech Enhancement Using HMM and $H_\infty$ Filter

HMM과 $H_\infty$필터를 이용한 강인한 음성 향상

  • 이기용 (숭실대학교 정보통신전자공학부) ;
  • 김준일 (숭실대학교 정보통신과)
  • Published : 2004.10.01

Abstract

Since speech enhancement algorithms based on Kalman/Wiener filter require a priori knowledge of the noise and have focused on the minimization of the variance of the estimation error between clean and estimated speech signal, small estimation error on the noise statistics may lead to large estimation error. However, H/sub ∞/ filter does not require any assumptions and a priori knowledge of the noise statistics, but searches the best estimated signal among the entire estimated signal by applying least upper bound, consequently it is more robust to the variation of noise statistics than Kalman/Wiener filter. In this paper, we Propose a speech enhancement method using HMM and multi H/sub ∞/ filters. First, HMM parameters are estimated with the training data. Secondly, speech is filtered with multiple number of H/sub ∞/ filters. Finally, the estimation of clean speech is obtained from the sum of the weighted filtered outputs. Experimental results shows about 1dB∼2dB SNR improvement with a slight increment of computation compared with the Kalman filter method.

칼만/위너 필터에 근거한 음성향상 알고리즘은 잡음의 선험적 지식을 요구하고, 음성신호와 추정신호의 오차분산을 최소화하는데 중점을 두고 있어, 잡음에 대한 통계적 추정에 오류가 있을 경우 결과에 악영향을 미칠 수 있다. 그러나 H/sub ∞/필터는 잡음에 대한 어떠한 가정이나 선험적 지식을 요구하지 않으며, 최소상계 (Least Upper Bound)를 적용하여 추정된 모든 신호들로부터 최소에러 신호를 갖는 최상의 추정신호를 찾아내므로 칼만/위너 필터보다 잡음의 변화에 강인하다. 본 논문에서는 학습 신호로부터 은닉 마코프 모델의 파라미터를 추정한 후, 오염된 신호를 고정된 개수의 H/sub ∞/필터를 통과시켜 각 출력에 가중된 합으로 향상된 음성 신호를 구하는 다중 H/sub ∞/필터에 의한 강인한 음성향상 방법을 제안한다. 제안된 방법의 성능 평가를 위하여 음성 향상 시간과 신호 대 잡음비를 비교한 결과, 기존의 방법에 비해 계산량은 다소 증가하지만 신호 대 잡음비는 약 1∼2dB 향상 되었다.

Keywords

References

  1. S. F. Boll, 'Suppression of acoustics noise in speech using spectral subtraction', IEEE Trans. Acoustic. Speech Signal Processing, 27, ppl13 120, 1979 https://doi.org/10.1109/TASSP.1979.1163209
  2. J. S. Lim and A. V. Oppenheim, 'All pole modeling of degraded speech,' IEEE Trans. Acoust., Speech, Signal Processing, ASSP 26, 197-210, 1978 https://doi.org/10.1109/TASSP.1978.1163086
  3. Ki Yong Lee, Katsuhiko Shirai, 'Efficient Recursive Estimation for Speech Enhancement in Colored Noise,' IEEE Signal Processing Letters, 3(7). 196-199, 1996 https://doi.org/10.1109/97.508163
  4. Y. Ephraim, D. Malah, 'Speech enhancement using a minimum mean square error short time amplitude estimator', IEEE Trans. Acoustic. Speech Signal Processing, 32(6), 1109~1121, 1984 https://doi.org/10.1109/TASSP.1984.1164453
  5. Y. Ephraim, D. Malah, and B. H. Juang, 'On the application' of hidden Markov models for enhancing noisy speech,' IEEE Trans. Acoustic. Speech Process. 37(12), 1846-1856, 1989 https://doi.org/10.1109/29.45532
  6. Y. Ephraim, 'A Bayesian approach for speech enhancement using hidden Markov models,' IEEE Trans. Signal Processing, 41, 725-735, 1992
  7. 이기용, '좌 우향 은닉 마코프 모델에서 상태결정을 이용한 음질향상', 한국음향학회지, 23(1), 47-53, 2004
  8. Ki Yong Lee, JaeYeal Rheem, 'Smoothing approach using forward backward Kalman filter with Markov Switching Parameters for Speech Enhancement,' Signal Processing, 80, 2579-2588, 2000 https://doi.org/10.1016/S0165-1684(00)00140-7
  9. C. E. de Souza, U. Shaked, and M. Fu, 'Robust Hoo filtering with parametric uncertainty and deterministic signal', in Proc. IEEE CDC'92, 2305~2310, 1992
  10. X. Shen and L. Deng, 'A Dynamic System Approach to Speech Enhancement Using the Hoo Filtering Algorithm', IEEE Trans. Speech and Audio Processing, 7(4), 391-399,1999 https://doi.org/10.1109/89.771261
  11. C.D. Souza, M. Gevers, and G. Goodwin, 'Riccati equations in optimal filtering of nonstabilizable systems having singular state transition matrices.' IEEE Trans. On Automatic control. 31(9), pp.831 838, 1986 https://doi.org/10.1109/TAC.1986.1104415