DOI QR코드

DOI QR Code

Implementation of Speech Recognition Filtering at Emergency

응급상황에서의 음성인식을 위한 필터기 구현

  • 조영임 (수원대학교 IT대학 컴퓨터학과) ;
  • 장성순 (수원대학교 IT대학 컴퓨터학과)
  • Received : 2009.11.30
  • Accepted : 2010.03.31
  • Published : 2010.04.25

Abstract

Generally, the mal factor for speech recognition is the background noise in speech recognition. The noise is the reason to reduce the speech recognition performance. Owing to the fact, the place to recognize is very important. To improve the recognition performance from the sound having noise, we implemented the noise filtered Wiener filter at the signal process step which adopted the FIR filter. In FIR filter, it deal with the filtered speech signal which is appropriate frequency range of human speech frequency range. Therefore, we make the recognition system distinguish between noise and speech sound from the incoming speech signal.

일반적으로 음성인식 시스템의 사용에 가장 저해되는 요소에는 배경 잡음을 들 수 있다. 잡음은 음성인식 시스템의 성능을 저하시키고, 이로 인해 사용 장소의 제약을 많이 받게 되는 이유가 된다. 이런 잡음의 영향을 해결하기 위해 본 논문에서는 음질 향상에 목적을 두고 신호단계에서부터 잡음성분을 제거하는 필터 중 FIR필터의 대역통과를 이용하여 일반적으로 사람의 음성 주파수 영역과 잡음 영역을 추출한 정보를 토대로 Wiener 필터를 구현, 그 성능을 향상하여, 전송되어지는 음성신호구간에서 잡음구간과 음성구간에 따라 잡음을 유연하게 처리하도록 구현하였다.

Keywords

References

  1. J. Allen, D. Byron, M. Dzikovska, G. Ferguson, L. Galescu, and A. Stent, "Toward Conversational Human-Computer Interaction", AI Magazine, vol. 22, no. 4, pp.27-37, 2001.
  2. H. Kruegle, "CCTV Surveillance", Analog and Digital Video Practices and Technology, Elsevier, pp.227-239, 2007.
  3. Y.Gong, "Speech Recognition in Noisy Environments: A Survey", Speech Communication, vol.16, no.3, pp.261-291 1995. https://doi.org/10.1016/0167-6393(94)00059-J
  4. C.-H.Lee, "On Stochastic Feature and Model Compensation Approaches to Robust", Speech Recognition, Speech Communication, pp.29-47. 1998. https://doi.org/10.1016/S0167-6393(98)00028-4
  5. 김경수, MATLAB 신호처리 및 이미지처리, 아진, pp.213-250, 2007
  6. 조영임, 장성순, "CCTV 응급상황에 따른 지능형 음성인식 시스템 구현 ", 한국지능시스템학회 논문지, 제19권, 제3호, pp.415-420, 2009. https://doi.org/10.5391/JKIIS.2009.19.3.415
  7. 김지곤, "최소 최대 추정량과 베이즈 추정량으로서 의 Kalman 필터에 관하여", 자연과학연구, 제5호, pp.21-30, 1995.
  8. 강점자, 강병옥, 정호영, 정훈, 이윤근, 신성장동력 산엉용 대어휘 음성인식 기술 및 응용. 전자통신동햑분석, vol. 23, no. 1, pp 70-76, 2008.
  9. Doclo, S., Rong Dong, Klasen, T.J., Wouters, J., Haykin, S., Moonen, M., "Extension of the multi-channel Wiener filter with ITD cues for noise reduction in binaural hearing aids", Applications of Signal Processing to Audio and Acoustics, vol. 16, no. 16, pp 70-73, 2005.
  10. 장준혁, 김동국, 김남수, "음성검출기의 설계에 있어 새로운 통계모델과 접근방법", Telecommu nications Review, 제15권, 1호, pp. 201-209, 2005.
  11. 류탁기, 박구현, 홍대식, 강찬언, "주파수 영역에서의 간단한 zero-forcing 기법을 이용한 속도 적응형 채널 추정기법", 한국통신학회논문지, 제31권, 제1호, pp.38-47, 2006
  12. 박윤식, 장준혁, " 주파수영역에서 Soft Decision 기반의 음향학적 반향 제거", Telecommunications Review, 19권, 5호, pp.837-844, 2009.
  13. Robert E.Morley, Jr. Gray E. Christensen, Thomas J. Sullivan, Orly Kamin, " The Design of a Bit-Serial Coprocessor to Perform Mulitiplication and Divison on a Massively Parallel Architecture", in Proc IEEE, The 2nd Syposium on the Frontiers of Massively Parallel Computation, Farifax, U.S.A, pp.419-422, 1998