A Study on Hybrid Structure of Semi-Continuous HMM and RBF for Speaker Independent Speech Recognition

화자 독립 음성 인식을 위한 반연속 HMM과 RBF의 혼합 구조에 관한 연구

  • 문연주 (광운대학교 전자통신공학과) ;
  • 전선도 (광운대학교 전자통신공학과) ;
  • 강철호 (광운대학교 전자통신공학과)
  • Published : 1999.11.01

Abstract

It is the hybrid structure of HMM and neural network(NN) that shows high recognition rate in speech recognition algorithms. And it is a method which has majorities of statistical model and neural network model respectively. In this study, we propose a new style of the hybrid structure of semi-continuous HMM(SCHMM) and radial basis function(RBF), which re-estimates weighting coefficients probability affecting observation probability after Baum-Welch estimation. The proposed method takes account of the similarity of basis Auction of RBF's hidden layer and SCHMM's probability density functions so as to discriminate speech signals sensibly through the learned and estimated weighting coefficients of RBF. As simulation results show that the recognition rates of the hybrid structure SCHMM/RBF are higher than those of SCHMM in unlearned speakers' recognition experiment, the proposed method has been proved to be one which has more sensible property in recognition than SCHMM.

성 인식 알고리즘에서 높은 인식률을 보이는 방법은 hidden Markov mode1(HMM)과 신경망의 혼합 형태이다. 이것은 통계적인 모델과 신경망 모델의 장점을 혼용하는 방법이다. 본 연구에서 제안하는 인식 알고리듬은 반연속 HMM과 radial basis function(RBF)의 새로운 형태의 혼합 구조로써 반연속 HMM 파라미터 중에서 관측 확률을 결정하는 가중치(혼합확률밀도함수계수)확률을 Baum-Welch 추정 이후 RBF로로써 재 추정하는 인식 모델을 제안한다. 제안한 방법은 RBF의 은닉층(hidden layer)의 기본 함수(basis function)와 반연속 HMM의 확률 밀도 함수의 유사함을 고려한 것으로 RBF의 학습 및 추정된 가중치로써 보다 음성 파형을 분별력 있게 구분하고자 하는 것이다. 모의 실험 결과는 반연속 HM만을 사용 할 때 보다 제안한 반연속 HMM/RBF 혼합 구조가 비 학습 화자에 대한 인식률을 개선함으로써 단순히 반연속 HMM만을 사용하는 것 보다 훨씬 분별력이 높은 방법임을 보여준다.

Keywords

References

  1. Fundamentals of Speech Recognition Lawrence Rabiner;Biing-Hwang Juang
  2. IEEE Transactions on Speech and Audio Processing v.2 no.1 Combining TDNN and HMM in a Hybrid System for Improved Continuous-Speech Recognition Christian Dugast;Laurence Delvillers;Xavier Aubert
  3. 신호처리합동학술대회 v.4 no.1 TDNN 과 HMM을 결합한 새로운 단어 방식에 관한연구 방영조
  4. Proc. ICASSP A Speech Recognition Using Radial Basis Function Neural Networks In an HMM Framework Eliot Singer;Richard P. Lippmann
  5. Hidden Markov Models for Speech Recognition X.D. Huang;Y. Ariki;M.A. Jack
  6. Computer Speech and Language v.3 Semi-Continuous Hidden Markov Models for Speech Recognition X.D. Huang;M.A. Jack
  7. Ph.D. thesis, Department of Electrical Engineering, University of Edinburgh Semi-Continuous Hidden Markov models for speech recognition X.D. Huang
  8. Neural Networks Simon Haykin