Noise Processing for Speech Recognition in the Telephone Line

음성 인식을 위한 전화망에서의 잡음처리

  • Published : 1998.01.01

Abstract

본 논문에서는 다양한 전화선 채널을 통하여 수집된 음성 데이터에 포함된 잡음 및 채널 왜곡을 제거하여 음성인식 시스템의 성능을 향상시키는 방법에 관하여 연구하였다. 전 화선을 통과한 음성에 포함된 채널 잡음 및 왜곡을 제거하는 방법으로는 음성신호를 보상하 는 방법으로 CMS(Cepstral Mean Subtraction), SBR(Signal Bias Removal)과 SM(Stochastic Matching)의 성능을 비교 평가하였다. 잡음제거 방식의 성능을 평가를 위하 여 음소 단위의 반연속 HMM을 이용한 화자독립 단독음 인식을 수행하였다. 인식 실험 결 과, 멜 켑스트럼을 사용한 경우에 CMS가 가장 우수한 성능을 내었고 다음으로 SM과 SBR 순으로 나타났다. 또한 특징벡터를 주변 잡음에 강인하게 하는 가중함수(RPS, BPL)를 사용 한 켑스트럼 계수와 잡음제거 방식을 함께 사용한 경우에 인식 성능이 더욱 향상되었다.

Keywords

References

  1. Proc. ICASSP Enviromental Robustness in Automatic Speech Recognition A. Acero;R. M. Stern
  2. Fundamentals of Speech Recognition L. R. Rabiner;B. H. Juang
  3. Proc. ICASSP Perceptually Based Linear Predictive Analysis of Speech H. Hermansky;B. A. Hanson;H. Wakita
  4. IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-35 no.7 Spectral Slope Distance Measure with Linear Prediction Analysis for Word Recognition in Noise B. A. Hanson;H. Wakita
  5. IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-35 no.7 On the Use of Bandpass Liftering in Speech Recognition B. H. Juang;L. R. Rabiner;J. G. Wilpon
  6. IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-24 no.2 Suppression of Acoustic Noise in Speech Using Spectral Subtraction S. F. Boll
  7. Proc. ICASSP Recognition of Speech in Additive and Convolutional Noise based RASTA Spectral Processing H. Hermansky;N. Morgan;H. G. Hirsch
  8. Proc. ICASSP Integrating RASTA-PLP into Speech Recognition J. Koehler;N. Morgan;H. Hermansky;H. G. Hirsch;G. Tong
  9. Proc. EUROSPEECH v.3 Compensation for the Effect of the Communication Channel in Auditory-Like Analysis of Speech(RASTA-PLP) H. Hermansky;N. Morgan;A. Bayya;P. Kohn
  10. Speech Communication v.12 no.3 Root Cepstral Analysis: A Unified View. Application to Speech Processing in Car Noise Environments P. Alexadre;P. Lockwood
  11. Proc. ICASSP Root Adaptive Homomorphic Deconvolution Schemes for Speech Recognition in Noise P. Lockwood;P. Alexandre
  12. Proc. ICASSP Speech Parameter Extraction in Noisy Environment using A Masking Model T. Usagawa;M. Iwata;M. Ebata
  13. Proc. ICASSP Continuous Speech Recognition on Noise using Spectral Subtraction and HMM Adaptation J. A. N. Flores;S. J. Young
  14. IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-24 no.5 Distance Measures for Speech Processing A. H. Gray;Jr., J. D. Markel
  15. Proc. ICASSP Comparative Study of Several Distance Measures for Speech Recognition N. Nocerino;F. K. Soong;L. R. Rabiner;D. H. Klatt
  16. Proc. ICSLP Cepstral Channel Normalization Techniques for HMM-Based Speaker Verification Aaron E. Rosenberg;Chin-Hui Lee;Frank K. Soong
  17. IEEE Trans. Speech & Audio Processing v.4 no.1 Signal Bias Removal by Maximum Likelihood Estimation for Robust Telephone Speech Recognition Mazin G. Rahim;Biing-Hwang Juang
  18. IEEE Trans. Speech & Audio Processing v.4 no.3 A maximum-likelihood approach to stochastic matching for robust speech recognition A. Sankar;C. H. Lee