DOI QR코드

DOI QR Code

Performance Improvement of CPSP Based TDOA Estimation Using the Preemphasis

프리엠퍼시스를 이용한 CPSP 기반의 도달시간차이 추정 성능 개선

  • 권홍석 (삼성전자 무선사업부) ;
  • 배건성 (경북대학교 전자전기컴퓨터학부)
  • Published : 2009.07.31

Abstract

We investigate and analyze the problems encountered in frame-based estimation of TDOA (Time Difference of Arrival) using CPSP function. Spectral leakage occurring in framing of a speech signal by a rectangular window could make estimation of CPSP spectrum inaccurate. Framing with other windows to reduce the spectral leakage distorts the signal due to the asynchronous weighting around the frame specifically both ends of the frame. These problems degrade the performance of the CPSP-based TDOA estimation. In this paper, we propose a method to alleviate those problems by pre-emphasis of the speech signal. It reduces the influence of the spectral leakage by reducing dynamic range of the spectrum of a speech signal with pre-emphasis. To validate the proposed method of pre-emphasis, we carry out TDOA estimation experiments in various noise and reverberation conditions, Experimental results have shown that the framing of pre-emphasized microphone output by a rectangular window achieves higher success rate of TDOA estimation than any other framing methods.

본 연구에서는 CPSP (Cross Power Spectrum Phase) 함수를 이용한 프레임 기반의 TDOA (Time Difference of Arrival) 추정시 나타나는 문제점들을 분석하고 연구하였다. 구형 윈도우함수를 이용해서 음성신호의 프레임을 추출할 때 나타나는 스펙트럼 누설현상은 CPSP 스펙트럼의 추정을 부정확하게 한다. 또한 스펙트럼 누설을 줄이기 위하여 구형이 아닌 다른 윈도우함수를 사용하여 프레임을 추출하면 프레임의 끝부분에서 발생하는 윈도우함수 가중치의 불일치 때문에 신호를 왜곡시킨다. 이 문제점들은 CPSP 기반의 TDOA 추정성능을 감소시킨다. 본 논문에서는 음성신호의 프리엠퍼시스를 이용하여 이러한 문제점들을 완화시키는 방법을 제안한다. 프리엠퍼시스된 음성신호의 다이나믹 레인지를 줄여줌으로써 스펙트럼 누설을 감소 시킨다. 제안한 프리엠퍼시스 방법을 검증하기 위하여, 다양한 잡음 및 잔향환경에서 TDOA 추정실험을 수행하였다. 실험결과 프라엠퍼시스된 마이크 출력에 구형 윈도우함수를 적용시켜 CPSP를 구할 경우 프리엠퍼시스를 하지 않거나 다른 윈도우를 사용하는 경우에 비해 TDOA 추정성능이 향상됨을 확인하였다.

Keywords

References

  1. M. Branstein and D. Ward, Microphone Arrays-Signal Pro-cessing Technique and Applications, Springer, New York, 2001
  2. B.D. Van Veen, and K.M. Buckley, "Beamforming: a Versatile Approach to Spatial Filtering," IEEE Trans, on Acoustics, Speech, and Signal Processing, vol.5, no.2, pp.4-24, 1988 https://doi.org/10.1109/53.665
  3. E.D. Di Claudio, R. Parisi, and G. Orlandi, "Multi-source Localization in Reverberant Environment by ROOT-MUSIC and Clustering," IEEE International Conference on Acoustics, Speech, and Signal Processing pp.921-924, June, 2000 https://doi.org/10.1109/ICASSP.2000.859111
  4. C.H.Knapp and G.C.Carter, “The Generalized Correlation Method for Estimation of Time Delay,” IEEE Trans, on Acou-stics, Speech, and Signal Processing, vol.24, no.4, pp.320-327, 1976 https://doi.org/10.1109/TASSP.1976.1162830
  5. D.V. Rabinkin, R.J. Renomeron, J.C. French, and J.L. Flanagan, “Estimation of Wavefront Arrival Delay Using The Cross-power Spectrum Phase Technique,” 132nd Meeting of the Acou-stical Society of America, Honolulu, HI, USA, pp.1-10, Dece-mber 4, 1996
  6. A.V. Oppenheim and R.W. Schafer, Discrete-Time Signal Pro-cessing, Prentice Hall, New Jersey, 1989
  7. J.B. Allen and D.A. Bertey, "lmage Method for Efficiently Simulating Small-Room Acoustics," J. Acoust. Soc. Am. vol. 65, no.4, pp.943-950, 1979 https://doi.org/10.1121/1.382599
  8. H. Kuttruff, Room Acoustics, Elsevier, London, 1991
  9. W.H. Press, S.A. Teukolsky, W.T. Vetterling, and B.P. Flannery, Numerical Recipes in C:the art of scientific computing, press syndicate of the university of Cambridge, NewYork, 1992