음성통신을 위한 잡음처리 기술

  • 발행 : 2007.04.30


음성 통신을 할 때 배경 잡음이 존재하게 되면 일반적으로 음질이 저하된다. 이것은 잡음 자체가 듣기 싫다거나 음성을 더 작게 들리게 만들기 때문이기도 하고 음성 코덱이 잡음이 섞이지 않은 깨끗한 음성에 최적화되어 있어서 잡음이 섞인 음성에 대한 코딩 효율이 떨어지기 때문이기도 하다. 이 논문에서는 잡음에 의한 음성 통신의 품질 저하를 막기 위한 방법으로서 음성 향상(speech enhancement) 기술과 음성 강화(speech reinforcement) 기술에 대해 소개한다. 음성 향상 기술이란 전송부의 마이크에서 녹음된 잡음과 음성이 섞인 입력 음성으로부터 깨끗한 음성을 추정하는 기술을 말한다. 음성 향상 기술은 상당히 오랜 기간 동안 연구되어 온 기술이며, 최근에는 각 파라미터의 분포에 의존하는 방법보다 확률 모델에 기반한 방법이 각광을 받고 있으며 인간의 청각 특성을 고려한 음성 향상 방법도 제안되고 있다. 음성 강화 기술이란 수신단에서 주변 잡음에 따라 전송되어 온 음성을 주파수별로 증폭하여 더 잘 들리도록 만드는 기술이다. 음성 향상이 내 주위의 잡음이 상대방에게 들리는 음성에 미치는 영향 혹은 상대방 주변의 잡음이 나에게 들리는 소리에 미치는 영향을 줄여주는 기술이라면 음성 강화는 내 주위의 잡음이 나에게 들리는 음성에 미치는 영향을 상쇄해 주는 기술이다. 이 경우 주변 잡음은 어떤 전자 시스템도 거치지 않고 귀로 직접 들어오기 때문에 잡음 자체를 줄여 주는 것은 힘들고 전송되어 온 음성을 적절히 증폭 혹은 변형함으로써 귀에 들리는 음질 또는 명료성을 개선하게 된다. 이 논문에서는 통계 모델을 기반으로 한 음성 향상 기법과 인간의 청각 특성을 고려한 음성 향상 기법, 그리고 음성 강화 기법에 대해 설명한다.을 시도한 결과 안정적이고 반복 가능한 급성 심부전 모델을 얻을 수 있었다. bench scale실험결과와 같이 AOC는 배수관망에서의 박테리아 증식과 크게 상관관계를 갖고 있는 것으로 밝혀졌다.)', 'have a headache (2.10±0.79)', 'poor memory (2.09±0.83)', 'no appetite (1.99±0.85)', As for the correlation between iron parameter and clinical symptoms related to anemia, the hematocrit rate was negatively correlated with 'get a cold easily', 'pale face', 'feeling blue', 'difficult digestion' (p<0.05). The level of iron was negatively correlated with 'tired out easily', 'get a cold easily' (p<0.05) and TS (%) were negatively correlated with 'tired out easily (p<0.05)', 'get a cold easily (p<0.01). Our study resulted that the prevalence of a iron deficiency of a middle school girl is very high, therefore the guidelines for iron supplementation and nutritional education to improve their iron status should be provided.한 질소제거를 N-balance로부터



  1. J. S. Lim and A. V. Oppenheim, "Enhancement and bandwidth compression of noisy speech," Proceedings of the IEEE, vol, 67, no. 12,Dec. 1979
  2. Y. Ephraim and D. Malah, "Speechenhancement using a minimum mean-square error short-time spectral amplitude estimator," IEEE Transactions on Acoustics, Speech, and Signal Processing, vol, ASSP-32, no. 6,Dec. 1984
  3. Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator," IEEE Transactions on Acoustics, Speech, and Signal Processing, vol, ASSP-33, no. 2, pp. 443-445, Apr. 1985
  4. N. S. Kim and J. -H. Chang, "Spectral enhancement based on global soft decision," IEEE Signal Processing Letters, vol, 7, no. 5, pp. 108-110, May2000 https://doi.org/10.1109/97.841154
  5. R. Martin, "Speech enhancement using MMSE short time spectral estimation with Gamma distributed priors," Proc. IEEE Int. Conf. Acoustics, Speech, Signal Processing, Orlando, FL, USA, vol, 1, pp. I-253 - I-256, May2002
  6. S. Gazor and W. Zhang, "Speech probability distribution," IEEE Signal Processing Letters, vol, 10, no. 7, pp. 204-207,Jul. 2003 https://doi.org/10.1109/LSP.2003.813679
  7. J. W. Shin, J. -H. Chang and N. S. Kim, "Statistical modeling of speech signals based on generalized gamma distribution," IEEE Signal Processing Letters, vol, 12, no. 3, pp. 258-261, Mar. 2005
  8. J. -H. Chang, S. Gazor, N. S. Kim and S. K. Mitra, "Multiple statistical models for soft decision in noisy speech enhancement," Pattern Recognition, vol, 40, no. 3, pp. 1123-1134, Mar. 2007 https://doi.org/10.1016/j.patcog.2006.07.006
  9. I. Cohen, "Speech enhancement using super-Gaussian speech models and noncausal a priori SNR estimation," Speech Communication, vol, 47, issue 3, pp. 336-350, Nov. 2005
  10. R. Martin, "Speech enhancement based on minimum mean-square error estimation and supergaussian priors," IEEE Transactions on Speech and Audio Processing, voL 13, no. 5, pp. 845-856, Sep. 2005 https://doi.org/10.1109/TSA.2005.851927
  11. T. Lotter and P. Vary, "Speech enhancement by MAP spectral amplitude estimation using a super-Gaussian speech model," EURASIP Journal on Applied Signal Processing, vol. 7, pp. 1110-1126,2005
  12. Y. Ephraim and H. L. Van Trees, "A signal subspace approach for speech enhancement," IEEE Transactions on Speech and Audio Processing, vol. 3, no. 4, pp. 251-266, Jul. 1995 https://doi.org/10.1109/89.397090
  13. H. Lev-Ari and Y. Ephraim, "Extension of the signal subspace speech enhancement approach to colored noise," IEEE Signal Processing Letters, vol. 10, no. 4, pp. 104-106, Apr. 2003 https://doi.org/10.1109/LSP.2003.808544
  14. A. Rezayee and S. Gazor, "An adaptive KLT approach for speech enhancemen t," IEEE Transactions on Speech and Audio Processing, vol. 9, no. 2, pp. 87-95, Feb. 2001 https://doi.org/10.1109/89.902276
  15. F. Jabloun and B. Champagne, "Incorporating the human hearing properties in the signal subspace approach for speech enhancement," IEEE Transactions on Speech and Audio Processing, vol. 11, no. 6, pp. 700-708, Nov. 2003 https://doi.org/10.1109/TSA.2003.818031
  16. Y. Hu and P. C. Loizou, "Incorporating a psychoacoustical model in frequency domain speech enhancement," IEEE Signal Processing Letters, vol. 11, no. 2, pp. 270-273, Feb. 2004 https://doi.org/10.1109/LSP.2003.821714
  17. J. W. Shin, S. Y. Lee, H. S. Yun and N. S. Kim, "Speech enhancement based on residual noise shaping, " Interspeech 2006, pp. 1415-1418, September 2006
  18. E. Zwicker and H. Fastl, Psychoacoustics-Facts and Models, Berlin: Springer, 1990
  19. B. C. J. Moore, B. R. Glasberg, and T. Baer, "A model for the prediction of thresholds, loudness, and partial loudness," Journal of Audio Engineering Society, vol. 45, no. 4, pp. 224-240, Apr. 1997
  20. J.Niederjohn and J. H. Grotelueschen, "The enhancement of speech intelligibility in high noise levels by high-pass filtering followed by rapid amplitude compression," IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. ASSP-24, no. 4, Aug. 1976
  21. M. Tzur (Zibulski) and A. A. Goldin, "Sound equalization in a noisy environment," Audio Engineering Society 110th Convention, preprint no. 5364, May 2001
  22. A. A. Goldin, A. Budkin and S. Kib, Automatic volume and equalization control in mobile devices," Audio Engineering Society 121th Convention, Preprint No.6960, Oct. 2006
  23. B. Sauert and P. Vaty, "Near end listening enhancement: Speech intelligibility improvement in noisy environments,"Proc. IEEE Int. Conf. Acoustics, Speech, Signal Processing, vol. 1, pp. 1-493+496,2006
  24. J.w. Shin and N. S. Kim, "perceptual reinforcement of speech Signal based on partial specific loudness,"IEEE Signal Processing Letters, to appear