An Enhancement of Speaker Location System Using the Low-frequency Phase Restoration Algorithm and Its Implementation

저주파 위상 복원 알고리듬을 이용한 화자 위치 추적 시스템의 성능 개선과 구현

  • 이학주 (연세대학교 전기전자공학과) ;
  • 차일환 (연세대학교 전기전자공학과) ;
  • 윤대희 (연세대학교 전기전자공학과) ;
  • 이충용 (연세대학교 전기전자공학과)
  • Published : 2001.05.01

Abstract

This paper describes the implementation of a robust speaker position location system using the voice signal received by microphone array. To be robust to the reverberation which is the major factor of the performance degradation, low-frequency phase restoration algorithm which eliminates the influence of reverberations using the low-frequency information of the CPSP function is proposed. The implemented real-time system consists of a general purpose DSP (TMS320C31 of Texas instruments), analog part which contains amplifiers and filters, and digital part which is composed of the external memory and 12-bit A/D converter. In the real conference room environment, the implemented system that was constructed by the proposed algorithms showed better performance than the conventional system. The error of the TDOA estimation reduced more than 15 samples.

본 논문에서는 마이크로폰 어레이를 통해 수신한 화자의 음성신호를 이용하여 추출된 공간정보를 통해 화자의 위치를 실시간으로 추적하는 알고리듬을 개선하고 이를 실시간으로 구현하였다. 기존의 대표적인 화자 위치 추정 알고리듬인 CPSP (Cross Power, Spectrum Phase) 함수는 상호 상관관계 (Cross Correlation)가 정규화 되어있는 형태를 갖는데, CPSP 함수의 최대값 인덱스로부터 화자의 공간정보인 TDOA(Time Difference Of Arrival)를 추출하게 된다. 그러나 CPSP함수를 이용한 공간정보 추정 알고리듬은 실내환경에서 심각하게 일어나는 반향신호에 대해서 취약한 단점을 갖고 있다. 본 논문에서 제안하는 저주파 위상 복원 알고리듬은 주파수 측면에서 반향신호가CPSP함수에 미치는 영향을 분석하여 반향으로 인하여 왜곡된 위상 성분을 복원함으로써 보다 신뢰도 있는 TDOA 추정을 가능하게 한다. 반향신호로 인한 CPSP의 위상은 저주파보다 고주파에서 심하게 왜곡되는데, 각각의 반향신호의 도달 시간을 기하학적 분포를 갖는 확률변수로 모델링하여 이를 수학적으로 증명하였다. 제안한 시스템의 성능분석을 위해 DSP를 이용한 실시간 시스템을 구현하여 기존 CPSP 알고리듬과 제안된 알고리듬을 적용한 시스템을 실제 환경에서 비교 실험을 수행한 결과 제안된 알고리듬을 적용한 시스템에서 약 15샘플 이상 TDOA 추정 오차가 줄어들고 있음을 확인하였다.

Keywords

References

  1. Optimum Sensor Placement for Microphone Arrays Daniel V. Rabinkin
  2. Proc. of the 2nd International Symposium on Computer-Aided Seismic Analysis and Discrimination Arrival Time Estimation Using Lterative Signal Reconstruction from the Phase of the Cross-Spectrum Y. T. Li;A. L. Kurkjian
  3. IEEE Trans. Acoust., Speech, Signal Processing v.24 no.4 The Generalized Correlation Method for Estimation of Time Delay Chales H. Knapp
  4. Spatially Selecive Sound Capture for Teleconferrncing Systems Richard James Renomeron
  5. 음향공학개론 차일환