Performance Evaluation of Telephone Continuous Digit Recognition

전화망 환경에서의 연속숫자음 인식 성능평가

  • 김성탁 (한국정보통신대학교(ICU) 공학부) ;
  • 김상진 (한국정보통신대학교(ICU) 공학부) ;
  • 정호영 (한국전자통신연구원(ETRI) 음성정보연구센터) ;
  • 김회린 (한국정보통신대학교(ICU) 공학부) ;
  • 한민수 (한국정보통신대학교(ICU) 공학부)
  • Published : 2002.07.01

Abstract

한국어 숫자는 단음절로 이루어져 있고, 연속적으로 발음할 때 조음현상에 의해 발음이 심하게 변하고, 숫자간의 경계를 규정하기가 어려워진다. 특히 잡음환경에서는 한국어의 무성음인 자음구간의 주파수 특징이 많이 왜곡되어 성능이 저하된다. 본 논문에서는 전화망에서의 고성능 연속숫자음 인식기 개발을 위하여 그 첫 단계로서 다양한 조건에서 MFCC 특징계수를 구하는 방법들과 문맥독립 및 문맥종속 HMM의 상태수 및 각 상태에서의 mixture 수 변화에 대한 성능을 분석해본다. 음향모델로는 문맥독립 모델인 음소와 문맥종속 모델인 triphone 모델을 모두 평가하였다.

Keywords