An Experiment of a Spoken Digits-Recognition System

숫자음성 자동 인식에 관한 일실험

  • ;
  • 安居院猛
  • Published : 1978.12.01

Abstract

This paper describes a speech recognition system for ten isolated spoken digits. In this system, acoustic parameters such as zero crossing rate, log energy and three formant frequencies estimated by linear prediction method were extracted for classification and/or recognition purpose(s). The former two parameters were used for the classification of unvoiced consonants and the latter one for the recognition of vowels and voiced consonants. Promising recognition results were obtained in this experiment for ten digit utterances spoken by a male speaker.

본 논문은 복수화자를 대상으로 한 숫자음성자동 시스템의 개발을 위한 기초 실험 결과의 보고다. ZCR, 대수 에너지등의 파라메터에 의한 무성자음의 분류, 선형예측에 의한 formant 주파수의 추정 및 그를 이용한 모음 및 유성자음의 인식을 행했다. 성인 남성 한 사람의 숫자음에 대한 인식실험의 결과, 음소(phoneme) 결합시의 과도 부분이나, 음소 인식 단계에서의 국소적 오인식을 흡수 할 수 있는 algorithm을 채용함으로써 양호한 인식 결과를 얻을 수 있었다. 앞으로, 독수제자를 대상으로 한 인식실험, 인식시스템의 개선과 한께 국어의 음성학적 제성질의 연구를 해 나갈 예정이다.

Keywords