DOI QR코드

DOI QR Code

Distribution of the Slopes of Autocovariances of Speech Signals in Frequency Bands

음성 신호의 주파수 대역별 자기 공분산 기울기 분포

  • Received : 2013.02.01
  • Accepted : 2013.03.05
  • Published : 2013.05.31

Abstract

The frequency bands were discovered which maximize the slopes of autocovariances of speech signals in frequency domain to increase the possibility of segregation between speech signals and background noise signal. A speech signal is divided into blocks which include multiples of sampled data, then those blocks are transformed to frequency domain using Fast Fourier Transform(FFT). To find linear equation by Linear Regression, the coefficients of autocovariance within blocks of some frequency band are used. The slope of the linear equation which is called the slope of autocovariance is varied from band to band according to the characteristics of the speech signal. Using speech signals of a man which consist of 200 files, the coefficients of the slopes of autocovariances are analyzed and compared from band to band.

자기 공분산 기울기를 이용하여 음성 신호와 배경 잡음 신호를 구분할 때 구분 가능성을 높이기 위해 주파수 영역에서 음성 신호의 자기 공분산 기울기를 최대화하는 주파수 대역을 찾아내었다. 디지털 샘플링 된 음성 신호를 일정한 개수의 신호로 이루어진 블록으로 나눈 후 각 블록에 고속푸리에변환(Fast Fourier Transform, FFT)을 하여 주파수 영역으로 변환한 다음 임의의 주파수 대역에서 각 블록에서의 공분산을 구하고 이 공분산 값들을 연결하는 직선 근사를 한 후에 이 직선의 기울기를 자기 공분산 기울기로 사용하는데 이 값은 음성 신호의 특성 상 주파수 대역별로 차이가 있다. 따라서 어느 주파수 대역에서 자기 공분산 기울기가 크게 나타나는지 200개의 남성 음성 파일을 이용하여 주파수 대역별로 비교 분석하였다.

Keywords

References

  1. J. F. Cardoso, "Blind signal separation: statistical principles," Proc. IEEE, vol. 9, no. 10, pp. 2009-25, Oct., 1988.
  2. A. Hyvarinen and E. Oja, "Independent component analysis: algorithms and applications," Neural Networks, vol. 13, no. 4/5, pp. 411-430, 2000. https://doi.org/10.1016/S0893-6080(00)00026-5
  3. A. Hyvarinen, "Fast and Robust Fixed-Point Algorithms for Independent Component Analysis," IEEE Trans. On Neural Networks, vol. 10, no. 2, pp. 626-634, May, 1999. https://doi.org/10.1109/72.761722
  4. Pl. Conon, "Independent component analysis, A new concept?," Signal Processing, vol. 36, pp. 287-314, 1994. https://doi.org/10.1016/0165-1684(94)90029-9
  5. W. Liu, D. Mandic, and A. Cichocki, "Analysis and Online Realization of CCA Approach for Blind Source Separation," IEEE Transaction on Neural Networks, Vol. 18, No. 3, September 2007.
  6. 김선일 "정준 상관 분석을 이용한 잡음 섞인 음성신호의 분리," 한국정보통신학회 종합학술대회논문집, 춘계16권, 1호, pp. 164-167, 동명대학교, 2012.
  7. H. Saruwatari, K. Sawai, T. Nishikawa, A. Lee, K. Shikano, A. Kaminuma, M. Sakata and D. Saitoh. "Speech Enhancement Based on Blind Source Separation in Car Environments," Proc. 21st International Conference on Data Engineering. pp. 1205, 05-08 April, 2005.
  8. J. Lee, H, Jung, T. Lee and S. Lee, "SPEECH CODING AND NOISE REDUCTION USING ICA-BASED SPEECH FEATURES," International Workshop on independent component analysis and blind signal separation, pp. 417-422, 19-22 June, 2000, Helsinki, Finland.
  9. 김선일, "주파수 영역 자기 공분산 기울기를 이용한 음성과 자동차 소음 신호의 구분," 한국해양정보통신학회 논문지, 제15권, 10호, 10월, 2011. https://doi.org/10.6109/jkiice.2011.15.10.2093
  10. 김선일, "ICA로 분리한 신호의 분류," 대한전자공학회 논문지, 제47권, IE-4호, 12월, 2010.
  11. 김선일, "음성 및 음성 관련 신호의 주파수 및 Quefrency 영역에서의 자기공분산 변화," 해양정보통신 종합학술대회논문집, 춘계15권, 1호, pp. 340-343, 대구 EXCO, 2011.
  12. 김선일, 양성룡 "배경 잡음을 제거하는 음성 신호 잡음 제거기의 구현", 대한전자공학회 논문지, 제49권, IE-2호, pp. 24-29, 6월, 2012.
  13. R. Johnson, K. Tsui, Statistical Reasoning and Methods, John Wiley & Sons, Inc. 1998.