A Study on PLU (Phone-Likely Unit) for Korean Continuous Speech Recognition

강건한 한국어 연속음성인식을 위한 유사음소단일에 대한 연구

  • Seo Jun-Bae (Dept. of information and Communication Eng., Yeungnam University) ;
  • Kim Joo-Gon (Dept. of information and Communication Eng., Yeungnam University) ;
  • Kim Min-Jung (Dept. of information and Communication Eng., Yeungnam University) ;
  • Jung Ho-Youl (Dept. of information and Communication Eng., Yeungnam University) ;
  • Chung Hyun-Yeol (Dept. of information and Communication Eng., Yeungnam University)
  • 서준배 (영남대학교 전자정보공학부) ;
  • 김주곤 (영남대학교 전자정보공학부) ;
  • 김민정 (영남대학교 전자정보공학부) ;
  • 정호열 (영남대학교 전자정보공학부) ;
  • 정현열 (영남대학교 전자정보공학부)
  • Published : 2004.05.01

Abstract

본 논문은 한국어 연속음성인식에 효율적인 문맥의존 음향모델 수에 대한 연구로써 유사음소단위 수에 따른 인식 성능을 비교, 평가하였다. 기존에 본연구실에서는 48음소를 기본인식단위로 이용하고 있으나 연속음성인식의 경우 문맥종속모델이 사용되고 문맥종속모델은 변이 음을 고려한 음소가 이미 포함되어 있어 이를 고려하면 기본 음소를 줄이므로서 계산량의 감소와 인식 성능 향상을 기대할 수 있을 것으로 생각된다. 따라서 , 본 논문에서는 기존의 48음소와 이를 39음소로 줄여 인식실험에 사용하여 그 성능을 비교 평가하기로 하였다. 이를 위하여 다양한 태스크의 데이터베이스를 통합하여 부족한 문맥요소들을 확장한 후 인식실험을 수행하였다. 실험결과 변이음의 개수를 줄이면서도 인식 성능저하가 없음을 확인할 수 있었으며 연속 음성의 경우 39음소를 이용한 경우가 $10\%$정도의 향상된 인식성능을 얻을 수 있음을 확인할 수 있었다.

Keywords