HMM-based Speech Recognition using FSVQ and Fuzzy Concept

FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 음성 인식

  • 안태옥 (호원대학교 컴퓨터학부)
  • Published : 2003.11.01

Abstract

This paper proposes a speech recognition based on HMM(Hidden Markov Model) using FSVQ(First Section Vector Quantization) and fuzzy concept. In the proposed paper, we generate codebook of First Section, and then obtain multi-observation sequences by order of large propabilistic values based on fuzzy rule from the codebook of the first section. Thereafter, this observation sequences of first section from codebooks is trained and in case of recognition, a word that has the most highest probability of first section is selected as a recognized word by same concept. Train station names are selected as the target recognition vocabulary and LPC cepstrum coefficients are used as the feature parameters. Besides the speech recognition experiments of proposed method, we experiment the other methods under same conditions and data. Through the experiment results, it is proved that the proposed method based on HMM using FSVQ and fuzzy concept is superior to tile others in recognition rate.

본 논문은 FSVQ(first section vector quantization)와 퍼지 개념을 이용한 HMM(hidden Markov model)에 기초를 둔 음성인식을 제안한다. 제안된 연구 방법에서는 첫 번째 구간의 코드북(codebook)을 만든 후, 첫 번째 구간의 코드북으로부터, 퍼지 개념을 도입하여 확률값이 큰 순서에 의해 다중 관측열을 구한다. 그 다음, 코드북으로부터 첫 번째 구간의 관측열을 학습시키고 인식할 때에도 같은 개념으로 첫 번째 구간에서의 확률 값이 가장 높은 단어를 인식된 단어로 선택한다. 인식 대상 어휘로는 전철역명을 선택하였으며, 특징 파라메타로는 LPC ?스트럼을 사용하였다. 제안된 방법에 의한 인식 실험을 수행하는 것 이외에도 비교를 위하여 이전에 실험한 몇 가지 방법의 인식 실험을 같은 조건하에서 같은 데이터로 수행한다. 실험 결과, 본 연구에서 제안한 FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 방법이 다른 음성 인식방법들보다 인식률이 우수함을 입증하였다.

Keywords

References

  1. Hiroaki Sakoe and Seibi Chiba, 'Dynamic Programming Algorithm Optimization for Spoken Word Recognition', IEEE Trans. on Acoustics, Speech and Signal Processing, Vol. ASSP-26, No.1, pp.43-49, Feb. 1978
  2. F. K. Soong, A. E. Rosenberg, L. R. Rabiner and B. H. Juang, 'A Vector Quantization Approach to Speaker Recognition', IEEE Trans. of Acoustics, Speech Signal Processing, Vol. ASSP-33, No.4, Oct. 1985
  3. D. K. Burton and J. E. Shore, 'Speaker-Dependent Isolated Word Re-cognition using Speaker-Independent Vector Quantization Codebooks Augumented with Speaker-Specific Data', IEEE Trans. of Acoustics, Speech, and Signal Processing. ASSP-33, No.2. pp 440-443. Apr. 1985
  4. D. K. Burton, J. E. Shore and J. T. Buck, 'Isolated-Word Speech Recognition using Multisection Vector Qantization Codebooks', IEEE Trans. of Acoustics, Speech, Signal Processing, Vol.ASSP-33, No.4, Aug. 1985
  5. Tae Ock Ann and Sun hyub Kim, 'Anautomatic Speech Recognition of Computer Using Time Sequential Vector Quantization', The Korea Institute of Telematics and Electronics, Vol. 27. No.7, July. 1990
  6. L. R. Rabiner and B. H. Juang, 'An Intorduction to Hidden Markov Models', IEEE ASSP Magazine, JAN. 1986
  7. Masnaki OKOCHI, 'Speech Recognition Using Markov Models', The Institute of Electronics, Information and Communication Engineers, Vol. 70, No.4, Apr. 1987
  8. L.R. Rabiner, S.E. Levinson and M.M. Sandhi, 'On the Application of Vector Quantization and Hidden Markov Model to Speaker-independent, Isolated Word Recognition', Bell System Technical Journal, Vol. 62, No.4, Apr. 1983
  9. M. Niishmura, 'HMM-based Speech Recognition using Dynamic Spectral Feature,' Proc. ICASSP 89 pp 298-301, May 1989 https://doi.org/10.1109/ICASSP.1989.266424
  10. 안태옥, 변용규, 김순협, 'MSVQ를 이용한 HMM에 의한 단독어 인식', 대한전자공학회지, 제 27권, 제 9호, pp. 158-165, 1990. 9
  11. 안태옥, 김순협, '퍼지에 기초를 둔 HMM을 이용한 음성 인식', 대한전자공학회지, 제 28권, B편, 제 12호, pp. 68-74, 1991. 12
  12. 안태옥, 'FSVQ에 기초를 둔 HMM을 이용한 음성 인식', 한국컴퓨터산업교육학회, 제 2권, 제 5호, pp. 661-670, 2001. 5
  13. Shikano, K. and Kohda, M., 'On the LPC Distance Measures for Vowel Recognition in Continuous Utterance' Institute of Electrical and Communication Engineers of Japen, Trans. on D, J 63-D, May. 1900