연속음성인식 시스템의 성능 향상을 위한 반복학습법을 이용한 언어모델

Language Models Using Iterative Learning Method for the Improvement of Performance of CSR System

  • 오세진 (영남대학교 정보통신공학과) ;
  • 황철준 (영남대학교 정보통신공학과) ;
  • 김범국 (대구과학대학 전자과) ;
  • 정호열 (영남대학교 정보통신공학과) ;
  • 정현열 (영남대학교 정보통신공학과)
  • Oh Se-Jin (Dept. of Information & Communication Eng., Yeungnam Univ) ;
  • Hwang Cheol-Jun (Dept. of Information & Communication Eng., Yeungnam Univ) ;
  • Kim Bum-Koog (Dept. of electronics, Taegu Science College) ;
  • Jung Ho-Ynul (Dept. of Information & Communication Eng., Yeungnam Univ) ;
  • Chung Hyun-Yeol (Dept. of Information & Communication Eng., Yeungnam Univ)
  • 발행 : 1999.07.01

초록

본 연구에서는 연속음성인식 시스템의 성능 향상을 위하여 음성의 채록환경 및 데이터량 등을 고려한 효과적인 언어모델 작성방법을 제안하고, 이를 항공편 예약시스템에 적용하여 성능 평가 실험을 실시한 결과 $91.6\%$의 인식률을 얻어 제안한 방법의 유효성을 확인하였다. 이를 위하여 소량의 200문장의 항공편 예약 텍스트 데이터를 이용하여 좀더 강건한 단어발생 확률을 가지도록 하기 위해 일반적으로 대어휘 연속음성인식에서 많이 이용되고 있는 단어 N-gram 언어모델을 도입하고 이를 다양한 발성환경을 고려하여 1,154문장으로 확장한 후 동일 문장'을 반복 학습하여 언어모델을 작성하였다. 인식에 있어서는 오인식과 문법적 오류를 최소화하기 위하여 forward - backward pass 방법의 stack decoding알고리즘을 이용하였다. 인식실험 결과, 평가용 3인의 200문장을 각 반복학습 회수에 따라 학습한 각 언어모델에 대해 평가한 결과, forward pass의 경우 평균 $84.1\%$, backward pass의 경우 평균 $91.6\%$의 문장 인식률을 얻었다. 또한, 반복학습 회수가 증가함에 따라 backward pass의 인시률의 변화는 없었으나, forward pass의 경우, 인식률이 반복회수에 따라 증가하다가 일정값에 수렴함을 알 수 있었고, 언어모델의 복잡도에서도 반복회수가 증가함에 따라 서서히 줄어들며 수렴함을 알 수 있었다. 이상의 결과로부터 소량의 텍스트 데이터를 이용한 제한된 태스크에서 언어모델을 작성할 때 반복학습 방법이 유효함을 확인할 수 있다.

키워드