Performance Improvement of Variable Vocabulary Speech Recognizer

가변어휘 음성인식기의 성능개선

  • Kim Seunghi (Multimodal Interface Team, Electronics & Telecommunications Research Institute) ;
  • Kim Hoi-Rin (Multimodal Interface Team, Electronics & Telecommunications Research Institute)
  • 김승희 (한국전자통신연구원 멀티모달 I/F 팀) ;
  • 김회린 (한국전자통신연구원 멀티모달 I/F 팀)
  • Published : 1999.11.06

Abstract

본 논문에서는 가변어휘 음성인식기의 성능개선 작업에 관한 내용을 기술하고 있다. 묵음을 포함한 총 40개의 문맥독립 음소모델을 사용한다. LDA 기법을 이용하여 동일차수의 특징벡터내에 보다 유용한 정보를 포함시키고, likelihood 계산시 가우시안 분포와 mixture weight에 대한 가중치를 달리 함으로써 성능향상을 볼 수 있었다. ETRI POW 3848 DB만을 사용하여 실험한 경우, $21.7\%$의 오류율 감소를 확인할 수 있었다. 잡음환경 및 어휘독립환경을 고려하여 POW 3848 DB와 PC 168 DB 및 PBW445 DB를 사용한 실험도 행하였으며, PBW 445 DB를 사용한 어휘독립 인식실험의 경우 $56.8\%$의 오류율 감소를 얻을 수 있었다.

Keywords