Comparison of Feature Extraction Methods for the Telephone Speech Recognition

전화 음성 인식을 위한 특징 추출 방법 비교

  • Published : 1998.10.01

Abstract

본 논문에서는 전화망 환경에서 음성 인식 성능을 개선하기 위한 특징 벡터 추출 단계에서의 처리 방법들을 연구하였다. 먼저, 고립 단어 인식 시스템에서 채널 왜곡 보상 방 법들을 단어 모델과 문맥 독립 음소 모델에 대하여 인식 실험을 하였다. 켑스트럼 평균 차 감법, RASTA 처리, 켑스트럼-시간 행렬을 실험하였으며, 인식 모델에 따른 각 알고리즘의 성능을 비교하였다. 둘째로, 문맥 독립 음소 모델을 이용한 인식 시스템의 성능 향상을 위하 여 정적 특징 벡터에 대하여 주성분 분석 방법(principal component analysis)과 선형 판별 분석(linear discriminant analysis)과 같은 선형 변환 방법을 적용하여 분별력이 높은 벡터 공간으로 변환함으로써 인식 성능을 향상시켰다. 또한 선형 변환 방법을 켑스트럼 평균 차 감법과 결합하여 더욱 뛰어난 성능을 보여주었다.

Keywords

References

  1. Proc. ICASSP v.Ⅰ Sources of Degradation of Speech Recognition in the Telephone Network P. J. Moreno;R. M. Stern
  2. IEEE Signal Processing Mag. Robust Speaker Recognition - A Feature-based Approach R. J. Mammone;X. Zhang;R. P. Ramachandran
  3. 한국음향학회지 v.16 no.4 전화망에서의 음성 인식을 위한 전처리 연구 전원석;신원호;양태영;김원구;윤대희
  4. Proc. ICASSP Environmental Robustness in Automatic Speech Recognition A. Acero;R. M. Stern
  5. IEEE Trans. Speech & Audio Processing v.4 no.1 Signal Bias Removal by Maximum Likelihood Estimation for Robust Telephone Speech Recognition M. G. Rahim;B. H. Juang
  6. Proc. ICASSP Robust Speech Recognition Based on Stochastic Matching A. Sankar;C. H. Lee
  7. Proc. ICSLP Estimation of Channel Bias for Telephone Speech Recognition J. T. Chien;H. C. Wang;L. M. Lee
  8. Proc. ICSLP Inclusion of Temporal Information into Features for Speech Recognition B. P. Milner
  9. Proc. ICASSP v.Ⅱ Subband or Cepstral Domain Filtering for Recognition of Lombard and Channel-Distorted Speech B. A. Hanson;T. H. Applebaum
  10. IEEE Trans. Speech & Audio Processing v.2 no.4 RASTA Processing of Speech H. Hermansky;N. Morgan
  11. Proc. EUROSPEECH An Analysis of Cepstral-Time Matrices for Noise and Channel Robust Speech Recogniton B. P. Milner;S. V. Vaseghi
  12. Proc. ICASSP A Comparative Study of Cepstral Lifters and Distance Measures for All Pole Models of Speech in Noise J. Junqua;H. Wakita
  13. IEEE Trans. Acoust., Speech, Signal Processing v.ASSP-35 no.10 A Weighted Cepstral Distance Measure for Speech Recognition Y. Tohkura
  14. Proc. EUROSPEECH Combination of Distortion-robust Feature Extraction and Neural Noise Reduction for ASR M. Trompf;R. Richter;H. Eckhardt;H. Hackbarth
  15. Proc. ICASSP On the Robustness of Linear Discriminant Analysis As a Preprocessing Step for Noisy Speech Recognition O. Siohan