Performance Improvement of Perceptual Filter Using Noise Energy Control

잡음 에너지 제어를 통한 지각 필터 성능 개선

  • 서정국 (숭실대학교 전자공학과) ;
  • 차형태 (숭실대학교 전자공학과)
  • Published : 2005.01.01

Abstract

In this paper, we propose an algorithm that improves a tone quality of a noisy audio signal in order to enhance a Performance of perceptual filter using noise energy control. Most of the algorithms which were proposed by the other researchers usually applied a filter using the noise energy acquired from a silent range. In this case. the improvement rate of tone quality decreases if the noise energy is changed by the magnitude or environment variation in a signal frame. But the Proposed method Provides the means to find a food estimated noise through energy control of the estimated noise which is obtained from a silent range. Also we can get the enhancement of tone qualify in low frequency band unlike other methods. To show the performance of the Proposed algorithm, various input signals which had a different signal-to-noise ratio (SNR) such as 5dB, l0dB, 15dB and 20dB were used to test the proposed algorithm. With the proposed algorithm, we could confirm the enhancement of tone quality in terms of segmental SNR (SSNR). noise-to-mask ration (NMR) and mean opinion score (MOS) test.

본 논문에서는 잡음 에너지 제어를 통한 지각 필터의 성능을 향상시킴으로써 잡음에 의해 열화 된 오디오 신호의 음질을 개선하는 알고리즘을 제안한다. 기존의 방식에서는 묵음 구간에서 획득한 잡음 에너지를 사용하여 필터를 구성하여 사용하지만, 신호 구간마다 달라지는 신호의 세기 및 잡음의 환경 정도에 많은 영향을 받아 잡음의 에너지가 급격하게 변화한다면 음질의 개선률이 감소함을 알 수 있다. 그러나 제안하는 방식에서는 묵음 구간에서 추정한 잡음의 에너지 제어를 통해 초기 추정 잡음보다 가까운 추정 잡음을 얻음으로써 잡음 에너지가 급격하게 변화하여도 음질 개선률에는 변화가 적음을 알 수 있었다. 또한 저 대역에 영향을 미치는 잡음의 경우에도 다른 방법들과는 달리 음질의 개선이 뚜렷하였다. 기존 방식과의 비교를 위해 다양한 신호 대 잡음 비 (signal-to-noise ratio, SNR)에서 열화 된 오디오 신호를 입력으로 사용하였다. 입력 SNR이 5dB, l0dE, 15dB와 20dB의 각각의 경우에 대하여 SSNR (Segmental SNR)과 잡음 대 마스킹 비 (Noise-to-mask ratio, NMR), 음질 테스트를 수행한 결과, 청감 테스트 (Mean Opinion Score, MOS Test)결과의 향상과 음질의 개선을 확인할 수 있었다.

Keywords

References

  1. S. F. Boll, 'Suppression of acoustic noise speech using spectral subtraction', IEEE Trans. ASSP 27, 1997
  2. R. J. MacAuly, 'Speech enhancement using a soft-decision noise suppression filter', IEEE Trans, 28. 1980
  3. Y. Ephrainm and D. Malah, 'Speech enhancement using a MMS error short-time spectral amplitude estimator', IEEE Trans, 32. 1984
  4. Y. Ephrainm, 'A Bayesian estimation approach for Speech enhancement using HMM', IEEE Trans, 40. 1992
  5. D. Tsoukalas, J. Mourjopoulos, and M. Paraskevas, 'Speech enhancement using Psychoacoustic Criteria', Journal of Audio Eng. Soc, 45 (1/2), pp. 22-35, IEEE ICASSP, 1994
  6. D. Tsoukalas, J. Mourjopoulos, and G. Kokkinakis, 'Perceptual filters for audio signal enhancement,' Journal of Audio Eng. Soc, 45 (1/2), pp. 22-35, Jan/Feb. 1997
  7. N. Virag, 'Single Channel Speech Enhancement Based on Masking Properties of the Human Auditory System,' IEEE Trans. Speech and Audio Processing, 7 (2), pp. 126-137, Mar. 1999 https://doi.org/10.1109/89.748118
  8. 김헌중, 차형태, '잡음 신호의 지각 패턴 제어를 통한 음질 개선 알고리즘 개발에 관한 연구', 한국음향학회 하계 학술대회 논문집 21 (1(s)), pp. 199-202, July. 2002
  9. 엄혜영, 한헌수, 홍민철, 차형태, '적응 지각 필터를 이용한 오디오 음질 개선 알고리즘', 한국음향학회 논문지 22 (8), pp. 687-693, Nov. 2003