음향학적 파라미터의 변화 및 반복학습으로 작성한 언어모델에 대한 고찰

Language Models constructed by Iterative Learning and Variation of the Acoustical Parameters

  • 오세진 (영남대학교 정보통신공학과) ;
  • 황철준 (대구과학대학 정보전자통신계열) ;
  • 김범국 (대구과학대학 정보전자통신계열) ;
  • 정호열 (영남대학교 정보통신공학과) ;
  • 정현열 (영남대학교 정보통신공학과)
  • Oh Se-Jin (Dept. of Information & Communication Eng., Yeungnam Univ.) ;
  • Hwang Cheol-Jun (Informational Electronics & Communication Div., Taegu Science College) ;
  • Kim Bum-Koog (Informational Electronics & Communication Div., Taegu Science College) ;
  • Jung Ho-Youl (Dept. of Information & Communication Eng., Yeungnam Univ.) ;
  • Chung Hyun-Yeol (Dept. of Information & Communication Eng., Yeungnam Univ.)
  • 발행 : 2000.07.07

초록

본 연구에서는 연속음성인식 시스템의 성능 향상을 위한 기초 연구로서 시스템에 적합한 음향모델과 언어모델을 작성하고 항공편 예약 태스크를 대상으로 인식실험을 실시한 결과 그 유효성을 확인하였다. 이를 위하여 먼저 HMM의 출력확률분포의 mixture와 파라미터의 차원에 대한 정확한 분석을 통한 음향모델을 작성하였다. 또한 반복학습법으로 특정 태스크를 대상으로 N-gram 언어모델을 적용하여 인식 시스템에 적합한 모델을 작성하였다. 인식실험에 있어서는 3인의 화자가 발성한 200문장에 대해 파라미터 차원 및 mixture의 변화에 따른 음향모델과 반복학습에 의해 작성한 언어모델에 대해 multi-pass 탐색 알고리즘을 이용하였다. 그 결과, 25차원에 대한 mixture 수가 9인 음향모델과 10회 반복 학습한 언어모델을 이용한 경우 평균 $81.0\%$의 인식률을 얻었으며, 38차원에 대한 mixture 수가 9인 음향모델과 10회 반복 학습한 언어모델을 이용한 경우 평균 $90.2\%$의 인식률을 보여 인식률 제고를 위해서는 38차원에 대한 mixture 수가 9인 음향모델과 10회 반복학습으로 작성한 언어모델을 이용한 경우가 매우 효과적임을 알 수 있었다.

키워드