DOI QR코드

DOI QR Code

Subband Based Spectrum Subtraction Algorithm

서브밴드에 기반한 스펙트럼 차감 알고리즘

  • Received : 2013.01.20
  • Accepted : 2013.04.22
  • Published : 2013.04.30

Abstract

This paper first proposes a classification algorithm which detects a voiced, unvoiced, and silence signal using distance measure, logarithm power and root mean square methods at each frame, then a spectrum subtraction algorithm based on a subband filter. The proposed algorithm subtracts spectrums of white noise and street noise from noisy signal based on the subband filter at each frame. In this experiment, experimental results of the proposed spectrum subtraction algorithm demonstrate using the speech and noise data of Aurora-2 database. Based on measuring the speech-to-noise ratio (SNR), experiments confirm that the proposed algorithm is effective for the speech by contaminated the noise. From the experiments, the improvement in the output SNR values was approximately 2.1 dB and 1.91 dB better for white noise and street noise, respectively.

본 논문에서는 거리측정, 로그전력, 실효치 방법에 의하여 유성음, 무성음, 묵음 구간을 검출하여, 서브밴드 필터에 의한 잡음제거 알고리즘을 제안한다. 제안한 알고리즘은 각 프레임에서 서브밴드 필터를 사용하여 잡음으로 오염된 음성신호로부터 백색잡음 및 도로잡음의 스펙트럼을 차감하는 방법이다. 본 실험에서는 Aurora-2 데이터베이스에 포함된 음성신호와 잡음신호를 사용하여 스펙트럼 차감 알고리즘의 결과를 나타낸다. 잡음에 의하여 오염된 음성신호에 대하여 신호대잡음비를 사용하여 본 알고리즘이 유효하다는 것을 확인한다. 실험으로부터 백색잡음에 대하여 평균 2.1 dB, 도로잡음에 대하여 평균 1.91 dB의 출력 신호대잡음비가 개선된 것을 확인할 수 있었다.

Keywords

References

  1. T. Hirahara and H. Iwamida, "Auditory spectrograms in HMM phoneme recognition," Proc. Int. Conf. Spoken Lang. Process., ICSLP-90, pp. 1381-1384, 1990.
  2. C. Y. Lee and Y. G. Lee, "Study of the noise processing to technique speech recognition system", Journal of the korea society of computer & information, Vol. 7, No. 2, pp. 73-78, June, 2002.
  3. 이창영, "FIR 필터링과 스펙트럼 기울이기가 MFCC를 사용하는 음성인식에 미치는 효과", 한국전자통신학회논문지, 5권, 4호, pp. 363-371, 2010.
  4. S. F. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. Acoust., Speech, Signal Processing. Vol. 27, No. 2, pp. 113-120, 1979. https://doi.org/10.1109/TASSP.1979.1163209
  5. 방동혁, 길세기, 강현덕 , 윤광섭, 이상민, "디지털 보청기에서 마이크로폰 어레이를 이용한 잡음제거", 전기학회논문지, 58권, 4호, pp. 857-866, 2009.
  6. Y. Wu and Y. Li, "Robust speech/non-speech detection in adverse conditions using the fuzzy polarity correlation method," IEEE International Conference on Systems, Man, and Cybernetics, Vol. 4, pp. 2935-2939, 2000.
  7. 최재승, "퍼셉트론 신경회로망을 사용한 유성음, 무성음, 묵음 구간의 검출 알고리즘", 한국전자통신학회논문지, 6권, 2호, pp. 237-242, 2011.
  8. J. Chen, K. K. Paliwal and S. Nakamura, "Sub-band based additive noise removal for robust speech recognition," in Proc. Eurospeech, pp. 571-574, 2001.
  9. L. Lin, W. H. Holmes and E. Ambikairajah, "Subband noise estimation for speech enhancement using a perceptual Wiener filter," IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol. 1, pp. I-80-I-80-3, 2003.
  10. 한영오, "GRNN을 이용한 동영상 움직임 예측 및 대역분할 부호화에 관한 연구", 한국전자통신학회논문지, 5권, 3호, pp. 256-261, 2010.
  11. 최재승, "멀티밴드 필터에 의한 환경잡음억압 알고리즘", 한국컴퓨터정보학회논문지, 17권, 8호, pp. 92-97, 2012. https://doi.org/10.9708/jksci.2012.17.8.091
  12. J. He, L. Liu, and G. Palm, "On the use of residual cepstrum in speech recognition," 1996 IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol. 1, pp. 5-8, 1996.
  13. H. Hirsch, and D. Pearce, "The AURORA experimental framework for the performance evaluations of speech recognition systems under noisy conditions", in Proc. ISCA ITRW ASR2000 on Automatic Speech Recognition: Challenges for the Next Millennium, Paris, France, pp. 181-188, September 2000.