On the Development of a Continuous Speech Recognition System using Continuous Hidden Markov Model for Korean Language

연속분포 HMM을 이용한 한국어 연속 음성 인식 시스템 개발

  • 김도영 (한국과학기술원 전기 및 전자공학과) ;
  • 박용규 (한국과학기술원 전기 및 전자공학과) ;
  • 권오욱 (한국과학기술원 전기 및 전자공학과) ;
  • 은종관 (한국과학기술원 전기 및 전자공학과)
  • Published : 1993.10.08

Abstract

본 논문에서는 연속분포 hidden Markov 모델을 이용한 화자독립 연속 음성 인식 시스템에 관해 기술한다. 연속분포 모델은 평균과 분산 벡터로 구성되며 음성신호를 직접 모델링하여 양자화 왜곡이 없어진다. 특징벡터는 filter bank 계수 및 그 1, 2차 미분계수를 사용하여 음성신호의 동적 특성을 반영하였다. Segmental K-means 알고리즘을 이용하여 학습하였으며, 연속어 인식에서 가장 문제가 되는 조음화 현상으로 인한 인식률 저하를 막기 위해 앞뒤의 음소를 고려해 주는 triphone을 인식단위로 사용하였다. Search 알고리즘으로는 시간 면에서 효율이 좋은 one-pass search 알고리즘을 사용하였다. 성능 평가를 위한 화자 독립 인식 실험에서 문법이 없을 경우 83%, finite state network율 적용한 경우에는 94%의 인식률을 나타내었다.

Keywords