Speaker Adaptation Using Neural Network in Continuous Speech Recognition

연속 음성에서의 신경회로망을 이용한 화자 적응

  • Published : 2000.01.01

Abstract

Speaker adaptive continuous speech recognition for the RM speech corpus is described in this paper. Learning of hidden markov models for the reference speaker is performed for the training data of RM corpus. For the evaluation, evaluation data of RM corpus are used. Parts of another training data of RM corpus are used for the speaker adaptation. After dynamic time warping of another speaker's data for the reference data is accomplished, error back propagation neural network is used to transform the spectrum between speakers to be recognized and reference speaker. Experimental results to get the best adaptation by tuning the neural network are described. The recognition ratio after adaptation is substantially increased 2.1 times for the word recognition and 4.7 times for the word accuracy for the best.

RM 음성 Corpus를 이용한 화자 적응 연속 음성 인식을 수행하였다. RM Corpus의 훈련용 데이터를 이용해서 기준화자에 대한 HMM 학습을 실시하고 평가용 데이터를 이용하여 화자 적응 인식에 대한 평가를 실시하였다. 화자 적응을 위해서는 훈련용 데이터의 일부가 사용되었다. DTW를 이용하여 인식 대상화자의 데이터를 기준화자의 데이터와 시간적으로 일치시키고 오차 역전파 신경회로망을 사용하여 인식 대상화자의 스펙트럼이 기준화자의 스펙트럼 특성을 지니도록 변환시켰다. 최적의 화자 적응이 이루어지도록 하기 위해 신경회로망의 여러 요소들을 변화시키면서 실험을 실시하고 그 결과를 제시하였다. 학습을 거쳐 적절한 가중치를 지닌 신경회로망을 이용하여 기준화자에 적응시킨 결과 단어 인식율이 최대 2.1배, 단어 정인식율이 최대 4.7배 증가하였다.

Keywords

References

  1. 한국음향학회지 v.13 no.1 연속분포 HMM을 이용한 한국어 연속음성 인식 시스템 개발 김도영;박용규;권오욱;은종관;박성현
  2. 한국음향학회지 v.14 no.5 대용량 한국어 연속음성 인식 시스템 개발 최인정;권오욱;박종렬;박용규;김도영;정호영;은종관
  3. 한국음향학회지 v.14 no.6 분산 신경망을 이용한 고립단어 음성에 나타난 음소 인식 김선일;이행세
  4. 한국음향학회지 v.13 no.1 한국어 음소 인식을 위한 신경회로망에 관한 연구 최영배;양진우;이형준;김순협
  5. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing v.2 A study on speaker normalization using vocal tract normalization and speaker adaptive training L. Welling;R. Haeb-Umbach;X. Aubert;N. Haberland
  6. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing v.1 A study on speaker adaptation of continuous density HMM parameters C. Hee;C. Lin;B. Juang
  7. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing v.1 Fast speaker adaptation for speech recognition systems F. Class;A. Kaltenmeier;P. Regel;K. Trottler
  8. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing v.2 Fast Speaker Adaptation combined with soft vector quantization in an HMM speech recognition system F. Class;A. Kaltenmeier;P. Regel
  9. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing A Piecewise Linear Spectral Mapping for Supervised Speaker Adaptation H. Matsukoto;H. Inoue
  10. 한국음향학회지 v.15 no.2 음성 인식 시스템의 화자 적응 성능 향상을 위한 코드북 설계 양태영;신원호;김원구;윤대희
  11. 한국음향학회지 v.15 no.3 반연속 HMM의 화자 적응에 관한 연구 황영수
  12. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing A database for continuous speech recognition in a 1000word domain P. Price;W. Fisher;J. Bernstein;D. Pallett