음소 모델의 Back-Off 기법을 이용한 어휘독립 음성인식기의 성능개선

Performance Improvement of Vocabulary Independent Speech Recognizer using Back-Off Method on Subword Model

  • 구동욱 (한국과학기술원 전자전산학과 전산학전공) ;
  • 최준기 (한국과학기술원 전자전산학과 전산학전공) ;
  • 오영환 (한국과학기술원 전자전산학과 전산학전공)
  • Koo Dong-Ook (Division of Computer Science Department of Electrical Engineering & Computer Science Korea Advanced Institute of Science and Technology) ;
  • choi Joon Ju (Division of Computer Science Department of Electrical Engineering & Computer Science Korea Advanced Institute of Science and Technology) ;
  • Oh Yung-Hwan (Division of Computer Science Department of Electrical Engineering & Computer Science Korea Advanced Institute of Science and Technology)
  • 발행 : 2000.07.07

초록

어휘독립 음성인식이란 음향학적 모델 훈련에 사용하지 않은 어휘들을 인식하는 것이다. 단어모델을 이용한 어휘독립 음성인식 시스템은 발음표기로 변환된 인식대상어휘에 대하여 문맥 종속형 부단어(context dependent subword) 단위로 훈련된 모델을 연결하여 단어 모델을 만들고 이 단어 모델로 인식을 수행한다. 이러한 시스템의 경우 훈련과정에서 나타나지 않는 문맥 종속형 부단어가 인식대상어휘에서 나타나게 되고, 따라서 정확한 단어모델을 구성할 수 없다는 문제점이 있다 본 논문에서는 문맥 종속형 부단어 구분의 계층화를 통한 back-off 선택 방법을 이용하여 새롭게 나타난 문맥 종속형 부단어 대신 연결될 부단어 모델을 찾아내는 방법을 제안한다 제안된 선택 방법은 새롭게 나타난 문맥 종속형 부단어를 포함하는 상위의 부단어를 찾아내는 방법이다. 실험 결과 10단어 세트에서 $97.5\%$ 50단어 세트에서$90.16\%$ 100 단어 세트에서 $82.08\%$의 인식률을 얻었다.

키워드