좌-우향 은닉 마코프 모델에서 상태결정을 이용한 음질향상

Efficient Speech Enhancement based on left-right HMM with State Sequence Decision Using LRT

  • 이기용 (숭실대학교 정보통신전자공학부)
  • 발행 : 2004.01.01

초록

본 논문에서는 좌-우향은닉 마코프 모델 (Left-Right Hidden Markov Model)에서 상태결정을 갖는 음성향상방법을 제안하였다. 은닉 마코프 모델에 기초를 둔 음질향상 방법은 성능은 우수하나, 모든 상태에 대해서 음질향상 알고리즘을 계산하므로, 계산량이 많고, 메모리가 많이 필요하여 실시간 처리에 부적절하다. 좌-우향 은닉 마코프 모델은 마코프 모델을 좌측에서 우측으로의 전이만 허용하는 모델로 단순화시켜 현재 상태에서 현재 상태나 다음 상태로 전이될 수 있는 특성을 가지고 있다. 본 논문에서는, 좌-우향 은닉 마코프 모델에서 유사도비 테스트 (Log-Likelihood Ratio Test)를 이용하여 현재 음성의 상태를 결정하는 알고리즘을 제안하였다. 현재 음성의 상태를 알고 있다면, 현재 상태에 대해서만 음질향상 알고리즘을 계산하므로, 계산량이 줄어든다. 제안된 방법의 성능 평가를 위하여 음질 향상 시간과 신호 대 잡음비를 비교하였다. 제안된 방법은 기존의 방법에 비해 음질향상의 결과는 약 0.2∼0.4 dB 정도 떨어졌지만, 계산량을 많이 줄일 수 있었다.

We propose a new speech enhancement algorithm based on left-right Hidden Markov Model (HMM) with state decision using Log-likelihood Ratio Test (LRT). Since the conventional HMM-based speech enhancement methods try to improve speech quality for all states, they introduce huge computational loads inappropriate to real-time implementation. In the left-right HMM, only the current and the next state are considered for a possible state transition so to reduce the computational complexity. In this paper, we propose a method to decide the current state by using the LRT on the previous state. Experimental results show that the proposed method improves the speed up to 60% with 0.2∼0.4 dB degradation of speech quality compared to the conventional method.

키워드

참고문헌

  1. IEEE Trans. Acoustic. Speech Signal Processing v.27 Suppression of acoustics noise in speech using spectral subtraction S.F.Boll
  2. IEEE Trans. Acoustic. Speech Signal Processing v.26 All-pole modeling of degraded speech J.S.Lim;A.V.Oppenheim
  3. IEEE Signal Processing Letters v.3 no.7 Efficient recursive estimation for speech enhancement in colored noise K.Y.Lee;K.Shirai
  4. IEEE Trans. Acoustic. Speech Signal Processing v.32 no.6 Speech enhancement using a minimum mean-square error short-time amplitude estimator Y.Ephraim;D.Malah
  5. IEEE Trans. Acoustic. Speech Signal Processing v.37 no.12 On the application of hidden Markov models for enhancing noisy speech Y.Ephraim;D.Malah;B.H.Juang
  6. IEEE Trans. Signal Processing v.41 A Bayesain approach for speech enhancement using hidden markov models Y.Ephraim
  7. Proceedings, 6th Australian International Conference on Speech Science and Technology Noise estimation for enhancement and recognition within an autoregressive Hidden-Markov-Model framework B.T.Logan;A.J.Robinson
  8. Signal Processing v.80 Smoothing approach using forward-backward Kalman filter with Markov Switching Parameters for Speech Enhancement K.Y.Lee;J.Y.Rheem
  9. AT&T Technical Journal v.64 no.6 Maximum-likelihood estimation for mixture multivariate stochastic observation of markov chains B.H.Juang
  10. IEEE Trans. Acoustic. Speech Signal Processing v.33 no.6 Mixture autoregressive Hidden Markov Models for speech signals B.H.Juang;L.R.Rabiner