Robust estimation of HMM parameters Based on the State-Dependent Source-Quantization for Speech Recognition

상태의존 소스 양자화에 기반한 음성인식을 위한 은닉 마르코프 모델 파라미터의 견고한 추정

  • 최환진 (시스템공학연구소 자연어정보처리연구부) ;
  • 박재득 (시스템공학연구소 자연어정보처리연구부)
  • Published : 1998.01.01

Abstract

최근 음성인식을 위한 대표적인 방법으로써 은닉 마르코프 모델이 사용되고 있으며, 이러한 방법은 음성의 특성을 잘 표현하도록 하는 음향적인 모델링 방법에 따라서 성능이 좌우된다. 본 논문에서는 상태에서의 출력확률은 견고히 추정하기 위한 방법으로 상태에서 의 출력활률을 소스들의 분포와 그들의 빈도로 가중한 출력분포로 표시하는 상태 의존 소스 양자화 모델링 방법을 제안한다. 이 방법은 한 상태 내에서 특징 파라미터들이 유사한 특성 을 가지며, 그들의 변이가 다른 상태에 있는 특징 파라미터들에 비해서 작다는 사실에 기반 한다. 실험결과에 의하면, 제안된 방법이 기존의 baseline시스템보다 단어 인식율의 경우는 2.7%, 문장 인식율의 경우 3.6%의 향상을 보였다. 이러한 결과로부터 제안된 SDSQ-DHMM이 인식율 향상면에서 유효하며, HMM에 있어서 상태별 출력확률의 견고한 추정을 위한 대안으로 사용될 수 있을 것으로 판단된다.

Keywords

References

  1. IEEE ASSP Magazine Continuous speech recognition using hidden Markov models J. Picone
  2. Computer Speech and Language v.3 no.1 On the use of some robust modeling techniques for speech recognition C. H. Lee
  3. AT & T Technical Journal v.65 A segmental k-means training procedure for hidden Markov models with continuous mixture densities L. R. Rabiner:J. G. Wilpon(et al.)
  4. Proc. of ICASSP Acoustic Markov Model used in the Tangora speech recognition system L. R. Bahl;P. F. Brown(et al.)
  5. Computer Speech and Language v.4 Corrective and reinforcement learning for speaker independent continuous speech recognition K. F. Lee;S. Mahajan
  6. Proc. of ICASSP Estimation of hidden Markov model parameters by minimizing rmpirical error rate A. Ljolje;Y. Ephraim(et al.)
  7. Proc. of ICASSP Explicit modeling of state occupancy in hidden Markov models for automatic speech recognition M. J. Russell;R. K. Moore
  8. AT & T Technical Journal v.64 Recognition of isolated digits using hidden Markov models with continuous mixture dinsities L. R. Rabiner;B. H. Juang(et al.)
  9. Computer Speech and Language v.3 Semi-continuous Hidden markov models for speech signals X. D. Huang;M. A. Jack
  10. IEEE ASSP Magazine v.1 Vector quantization R. M. Gray
  11. Linear prediction of speech J. D. Marke;A. H. Gray
  12. IEEE trans. on ASSP v.33 A modified K-means clustering algorithm for use in isolated word recogntion J. G. Wilpon;L. R. Rabiner
  13. IEEE trans. on Inform. Theory v.13 Error bounds for convolutional codes and an asymptotically optimum decoding algorithm A. Viterbi
  14. Bell Syst. Tech. J. v.62 no.4 An Introduction to the application of the theory of probabilistic functions of a Markov process to automatic speech recognition S. E. Levinson;L. R. Rabiner(et al.)
  15. Pattern Classification and Scene Analysis R. O. Duda;R. E. Hart
  16. IEEE trans. on Comm v.28 An algorithm for vector quantizer design Y. Linde;A. Buzo;R. M. Gray
  17. IEEE trans. on ASSP v.37 no.8 High Performance connected digit recognition using Hidden Markov Models L. R. Rabiner;J. G. Wilpon(et al.)
  18. IEEE trans. on ASSP v.32 no.2 The use of a one-stage Dynamic Programming algorithm for connected word recognition H. Ney
  19. IEEE trans. on Information Theory, IT-21 Design of a linguistic statistical decoder for the recognition of continuous speech F. Jelinek;L. R. Bahl(et al.)
  20. Computer Speech and Language v.6 On the use of inter-word context-dependent units for word juncture modeling E. P. Gialchin(et al.)