가변 어휘 음성 인식기의 음향모델 개선 및 성능분석

Acoustic Model Improvement and Performance Evaluation of the Variable Vocabulary Speech Recognition System

  • 발행 : 1999.11.01

초록

문맥독립형 음향모델을 채택하고 있는 기존의 가변어휘 음성인식기는 주변환경에 따른 음소의 변화를 모델링 할 수 없었다. 이러한 문제를 해결하기 위해서는 변이음을 이용한 문맥의존형 음향모델을 사용해야 한다. 본 논문은 가변어휘 음성인식기의 음향모델을 효과적으로 개선하기 위하여 적용한 방법에 대해서 기술하고 있다. 즉, 음향모델의 개선은 엔트로피를 이용한 군집화 기법을 적용하여 변이음의 개수를 변경시키면서 최적의 변이음 모델을 추출하는 방법을 사용하였다. 개선된 모델에 대한 성능은 POW(Phonetically Optimized Words) 3848 DB 및 SNR이 크게 다른 2종류의 PC168 DB를 이용하여 훈련 및 인식 실험을 수행하면서 평가하였다. 결론적으로 변이음의 개수를 낮추면서도 인식 성능의 저하를 가져오지 않는 최적의 변이음 모델을 얻을 수 있었으며 PC168 DB를 이용한 인식실험을 통하여 확인할 수 있었다.

Previous variable vocabulary speech recognition systems with context-independent acoustic modeling, could not represent the effect of neighboring phonemes. To solve this problem, we use allophone-based context-dependent acoustic model. This paper describes the method to improve acoustic model of the system effectively. Acoustic model is improved by using allophone clustering technique that uses entropy as a similarity measure and the optimal allophone model is generated by changing the number of allophones. We evaluate performance of the improved system by using Phonetically Optimized Words(POW) DB and PC commands(PC) DB. As a result, the allophone model composed of six hundreds allophones improved the recognition rate by 13% from the original context independent model m POW test DB.

키워드

참고문헌

  1. 국어 음운학 허웅
  2. 음향통신 및 신호처리 워크샵 v.13 no.1 음성학적 지식에 기반한 한국어 변이음 집단화 수형도 서영주(외)
  3. Proc. of ICASSP mplementation of the POW(Phonetically Optimized Words) algorithm for speech database eonja Lim;Youngjik Lee
  4. Proc. of ICASSP Modeling acoustic-phonetic detail in an HMM-based large vocabulary speech recognizer L. Deng;M. Lennig;V.N. Gupta;P. Mermelstein
  5. Proc. of ICASSP Speaker Stress-Resistant Continuous Speech Recognition Paul, D.B.;Martin, E.A.
  6. Automatic Speech Recognition Kai-Fu Lee
  7. 제 13회 음성통신 및 신호처리 위크샵 v.13 no.1 POW 3848 단어 인식기 구현 및 어휘 독립 실험 김희린;이항섭
  8. 제 15회 음성통신 및 신호처리 워크샵 v.15 no.1 잡음환경 및 어휘독립 환경에서의 가변어휘 음성인식기의 성능분석 이승훈