A Study on Improvement of the Connected Digit Recognition Using Finite State Network and Demi-Syllable Pair Models

FSN과 반음절쌍 모델을 이용한 연결 숫자음 인식의 성능 향상에 관한 연구

  • 서은경 (광운대학교 컴퓨터공학과) ;
  • 최태웅 (광운대학교 컴퓨터공학과) ;
  • 김순협 (광운대학교 컴퓨터공학과)
  • Published : 2003.11.01

Abstract

본 논문에서는 숫자음과 단위음으로 구성된 한국어 연결 단위숫자음 인식의 성능 향상을 위하여 한국어 연결 단위숫자음의 특징을 분석하였다. 한국어의 단위숫자음은 숫자음 한음절과 단위음 한음절로 구성된 두음절의 연속적이고 반복적인 발성으로 나타난다. 숫자음에서의 인식 대상 어휘는 숫자음이라는 제한된 규칙을 갖는 가변 숫자음이다. 따라서 개수, 금액, 단위량, 거래량 등에서 나타날 수 있는 가변 숫자음을 인식하기 위하여 FSN(Finite State Network)을 구성하였다. 음향 모델은 한국어 숫자음과 같이 발성구간이 짧은 어휘의 연결음 (connected word)의 인식에서 효과적인 반음절쌍(demi-syllable pair) 모델을 이용하였다 실험결과, 화자 독립적인 가변 숫자음 60문장의 테스트 데이터에 대해서 문장 인식률 91.0%로 인식 성능을 향상시킬 수 있었다.

Keywords