화자적응화 연속음성 인식 시스템의 구현에 관한 연구

A Study on Realization of Continuous Speech Recognition System of Speaker Adaptation

  • 김상범 (섬유기능대학 전자계산기학과) ;
  • 김수훈 (동아대학교 전자공학과) ;
  • 허강인 (동아대학교 전자공학과) ;
  • 고시영 (경일대학교 전자정보공학과)
  • 발행 : 1999.04.01

초록

본 연구에서는 소량의 음성 데이터만으로 적응화가 가능한 MAPE(최대사후확률추정)을 이용한 연속음성 인식시스템 개발에 대해 연구하였다. 음절단위 모델을 구축한 후 적응화 하고자 하는 화자의 데이터를 연결학습법과 Viterbi 알고리즘으로 음절단위의 추출을 자동화 한 후 MAPE로 적응화하였다. 자동차 제어문에 대해 화자 적응화한 경우의 인식률(O(n)DP인 경우)은 77.18%로 적응화 전의 결과보다 약 6%향상되었다.

In this paper, we have studied Continuous Speech Recognition System of Speaker Adaptation using MAPE (Maximum A Posteriori Probability Estimation) which can adapt any small amount of adaptation speech data. Speaker adaptation is performed by the method of MAPB after Concatenation training which is making sentence unit HMM linked by syllable unit HMM and Viterbi segmentation classifies speech data to be adaptation into segmentation of syllable unit data automatically without hand labelling. For car control speech the recognition rates of adaptation of HMM was 77.18% which is approximately 6% improvement over that of unadapted HMM.(in case of O(n)DP)

키워드

참고문헌

  1. IEEE Trans. Acoust, Speech, Signal Processing v.ASSP-23 The DRAGON system-An overview J.K. Baker
  2. Proc. ICASSP Large-vocablary Speaker-Independent Continuous Speech Recognition using HMM: The SPHINX System K.-F. Lee;H.-W. Hon
  3. IEEE ASSP magazine An Introduction to Hidden Markov Models L. R. Rabiner;B. H. Juang
  4. IEEE Trans. Signal Processing v.39 no.4 A Study on Speaker Adaptation of the Parameters of Continuous Density Hidden Markov Models Chin-Hui Lee(et al.)
  5. Proc. DARPA Speech and Natural Language Workshop Bayesian Learninech of Mixture Densities for Hidden Markov Models Jean-Lue Gauvain;Chin-Hui Lee
  6. 한국음향학회지 HMM을 이용한 연속 음성 인식의 화자적응화에 관한 연구 김상범;이영재;고시영;허강인
  7. 音響學 會誌 v.47 no.7 確率出力分布型HMMの話 者適應化による日本語音節, 音節認識 巾川聖;平田好充