DOI QR코드

DOI QR Code

An efficient space dividing method for the two-dimensional sound source localization

2차원 상의 음원위치 추정을 위한 효율적인 영역분할방법

  • 김환용 (대진대학교 전자공학과) ;
  • 최홍섭 (대진대학교 전자공학과)
  • Received : 2016.05.24
  • Accepted : 2016.08.04
  • Published : 2016.09.30

Abstract

SSL (Sound Source Localization) has been applied to several applications such as man-machine interface, video conference system, smart car and so on. But in the process of sound source localization, angle estimation error is occurred mainly due to the non-linear characteristics of the sine inverse function. So an approach was proposed to decrease the effect of this non-linear characteristics, which divides the microphone's covering space into narrow regions. In this paper, we proposed an optimal space dividing way according to the pattern of microphone array. In addition, sound source's 2-dimensional position is estimated in order to evaluate the performance of this dividing method. In the experiment, GCC-PHAT (Generalized Cross Correlation PHAse Transform) method that is known to be robust with noisy environments is adopted and triangular pattern of 3 microphones and rectangular pattern of 4 microphones are tested with 100 speech data respectively. The experimental results show that triangular pattern can't estimate the correct position due to the lower space area resolution, but performance of rectangular pattern is dramatically improved with correct estimation rate of 67 %.

음원의 위치를 찾는 SSL(Sound Source Localization)은 로봇과의 인터페이스, 화상회의, 스마트 자동차 등 여러 분야에서 꼭 필요한 기술이다. 일반적으로 음원의 위치 정보를 활용하는 기술들은 주로 측정 장치에 대한 음원의 각도 정보를 찾아서 이용하고 있다. 그러나 음원의 위치에 대한 각도를 추정할 때 이용하는 사인 역함수의 비선형적인 특성으로 추정된 각도에 오차가 발생하며, 이에 대한 방안으로 마이크가 담당하는 영역을 분할하는 방법이 제안되었다. 본 논문에서는 마이크 어레이 패턴에 따른 영역분할 방법을 제안하고 음원의 위치를 2차원상의 평면 좌표로 특정하는 방법으로 위치 추정 성능을 평가하였다. 실험에서 잡음에 강인한 GCC-PHAT(Generalized Cross Correlation Phase Transform) 방법을 사용했으며, 마이크 어레이의 패턴은 마이크 3개와 4개로 삼각형과 사각형 두 종류로 구성하였으며, 100개의 음성 데이터로 실험한 결과 실제 환경에서는 3개의 마이크 어레이를 사용해서는 영역 분할 해상도가 낮아서 음원의 위치를 정해진 특정 범위내로 추정하는데 실패했으나, 4개 마이크를 이용하여 해상도를 높였더니 위치추정 성공률이 67 %로 크게 향상됨을 확인할 수 있었다.

Keywords

References

  1. W. Rhee and J. S. Choi, "Experimental studies for noise source positioning using TDOA algorithm" (in Korean), KSNVE. Suppl.1(s) 5, 108-112 (2006).
  2. B. Jang, D. Y. Sim, C. D. Kim, C. B. Lee, and K. H. Cga, "A study for estimating absolute position of sound source using reference microphone and beamforming method" (in Korean), KSPC. Suppl.1(s) 10, 371-374 (1997).
  3. S. M. Hwang, Sound source localization using HRTF database, (Master's. thesis, KAIST, 2005).
  4. Y. J. Park, M. W. Lee, S. H. Min, and Y. H. Han, "Sound localization ased on LP residual and hilbert transform for intelligent robot" (in Korean), KIISS. 10, 382-385 (2008).
  5. J. S. Koo and H. J. Park, Sound source localization based on PCA (in Korean), (Master's thesis, University of Kwangwoon, 2014).
  6. Y. E. Kim, S. H. Cho, and J. G. Chung, "Efficient sound source localization system using angle division" (in Korean), KSPC. 46, 114-119 (2009).

Cited by

  1. A modified cross-correlation algorithm to achieve the time difference of arrival in sound source localization pp.0020-2940, 2019, https://doi.org/10.1177/0020294019827977