Noise Processing for Speech Recognition in the Telephone Line

;;;;;

한국음향학회지 (The Journal of the Acoustical Society of Korea)

제17권1호
/
Pages.4-8
/
1998
/
1225-4428(pISSN)
/
2287-3775(eISSN)

한국음향학회 (The Acoustical Society of Korea)

음성 인식을 위한 전화망에서의 잡음처리

Noise Processing for Speech Recognition in the Telephone Line

전원석 (연세대학교 전자공학과) ;
신원호 (연세대학교 전자공학과) ;
양태영 (연세대학교 전자공학과) ;
김원구 (연세대학교 전자공학과) ;
윤대희 (연세대학교 전자공학과)

발행 : 1998.01.01

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

본 논문에서는 다양한 전화선 채널을 통하여 수집된 음성 데이터에 포함된 잡음 및 채널 왜곡을 제거하여 음성인식 시스템의 성능을 향상시키는 방법에 관하여 연구하였다. 전 화선을 통과한 음성에 포함된 채널 잡음 및 왜곡을 제거하는 방법으로는 음성신호를 보상하 는 방법으로 CMS(Cepstral Mean Subtraction), SBR(Signal Bias Removal)과 SM(Stochastic Matching)의 성능을 비교 평가하였다. 잡음제거 방식의 성능을 평가를 위하 여 음소 단위의 반연속 HMM을 이용한 화자독립 단독음 인식을 수행하였다. 인식 실험 결 과, 멜 켑스트럼을 사용한 경우에 CMS가 가장 우수한 성능을 내었고 다음으로 SM과 SBR 순으로 나타났다. 또한 특징벡터를 주변 잡음에 강인하게 하는 가중함수(RPS, BPL)를 사용 한 켑스트럼 계수와 잡음제거 방식을 함께 사용한 경우에 인식 성능이 더욱 향상되었다.

키워드

참고문헌

Proc. ICASSP Enviromental Robustness in Automatic Speech Recognition A. Acero;R. M. Stern
Fundamentals of Speech Recognition L. R. Rabiner;B. H. Juang
Proc. ICASSP Perceptually Based Linear Predictive Analysis of Speech H. Hermansky;B. A. Hanson;H. Wakita
IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-35 no.7 Spectral Slope Distance Measure with Linear Prediction Analysis for Word Recognition in Noise B. A. Hanson;H. Wakita
IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-35 no.7 On the Use of Bandpass Liftering in Speech Recognition B. H. Juang;L. R. Rabiner;J. G. Wilpon
IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-24 no.2 Suppression of Acoustic Noise in Speech Using Spectral Subtraction S. F. Boll
Proc. ICASSP Recognition of Speech in Additive and Convolutional Noise based RASTA Spectral Processing H. Hermansky;N. Morgan;H. G. Hirsch
Proc. ICASSP Integrating RASTA-PLP into Speech Recognition J. Koehler;N. Morgan;H. Hermansky;H. G. Hirsch;G. Tong
Proc. EUROSPEECH v.3 Compensation for the Effect of the Communication Channel in Auditory-Like Analysis of Speech(RASTA-PLP) H. Hermansky;N. Morgan;A. Bayya;P. Kohn
Speech Communication v.12 no.3 Root Cepstral Analysis: A Unified View. Application to Speech Processing in Car Noise Environments P. Alexadre;P. Lockwood
Proc. ICASSP Root Adaptive Homomorphic Deconvolution Schemes for Speech Recognition in Noise P. Lockwood;P. Alexandre
Proc. ICASSP Speech Parameter Extraction in Noisy Environment using A Masking Model T. Usagawa;M. Iwata;M. Ebata
Proc. ICASSP Continuous Speech Recognition on Noise using Spectral Subtraction and HMM Adaptation J. A. N. Flores;S. J. Young
IEEE Trans. Acoust., Speech. Signal Processing v.ASSP-24 no.5 Distance Measures for Speech Processing A. H. Gray;Jr., J. D. Markel
Proc. ICASSP Comparative Study of Several Distance Measures for Speech Recognition N. Nocerino;F. K. Soong;L. R. Rabiner;D. H. Klatt
Proc. ICSLP Cepstral Channel Normalization Techniques for HMM-Based Speaker Verification Aaron E. Rosenberg;Chin-Hui Lee;Frank K. Soong
IEEE Trans. Speech & Audio Processing v.4 no.1 Signal Bias Removal by Maximum Likelihood Estimation for Robust Telephone Speech Recognition Mazin G. Rahim;Biing-Hwang Juang
IEEE Trans. Speech & Audio Processing v.4 no.3 A maximum-likelihood approach to stochastic matching for robust speech recognition A. Sankar;C. H. Lee

한국음향학회지 (The Journal of the Acoustical Society of Korea)

음성 인식을 위한 전화망에서의 잡음처리

Noise Processing for Speech Recognition in the Telephone Line

초록

키워드

참고문헌

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)