영역 분할을 이용한 효율적인 음원 위치 추정 시스템

Efficient Sound Source Localization System Using Angle Division

  • 김용은 (전북대학교 전자정보공학부) ;
  • 조수현 (전북대학교 전자정보공학부) ;
  • 정진균 (전북대학교 전자정보공학부)
  • Kim, Yong-Eun (Div. of Electronic & Information Engineering Chonbuk University) ;
  • Cho, Su-Hyun (Div. of Electronic & Information Engineering Chonbuk University) ;
  • Chung, Jin-Gyun (Div. of Electronic & Information Engineering Chonbuk University)
  • 발행 : 2009.03.25

초록

서비스 로봇에서 사용되는 음원인식 시스템은 사람이 로봇을 향해 말할 때 화자의 위치를 추정한다. 로봇용 음원인식 알고리즘들 중에서 복수개의 마이크로폰에 소리가 도착하는 시간지연 정보를 이용하여 음원을 추정하는 방법이 널리 이용된다. 마이크로폰에 도달하는 지연시간 정보를 구하기 위해서 상관관계 함수가 사용된다. 상관관계 함수에서 최대 값의 위치를 각도로 변환할 때 코사인 역함수가 사용되며 코사인 역함수의 비선형적인 특성 때문에 음원의 위치에 따라 마이크로폰 쌍에서 추정하는 각도의 정확성이 다르게 된다. 본 논문에서는 음원의 위치에 따라 각도를 가장 잘 추정할 수 있는 각도 영역을 구분하여 정확하게 음원의 위치를 인식하는 방법을 제안한다. 또한 제안한 방법을 이용하면 각 마이크 쌍에서 60도 범위에 대해서만 각도를 계산하므로 기존의 180도에 대한 방법에 비하여 연산이 1/2로 줄어든다. 테스트 환경을 구축하여 제안한 영역 분할 위치 추정 알고리즘과 기존 알고리즘의 성능을 비교한 결과 제안한 알고리즘의 기존 알고리즘에 의한 평균오차의 31%에 불과함을 보인다.

Sound source localization systems in service robot applications estimate the direction of a human voice. Time delay information obtained from a few separate microphones is widely used for the estimation of the sound direction. Correlation is computed in order to calculate the time delay between two signals. Inverse cosine is used when the position of the maximum correlation value is converted to an angle. Because of nonlinear characteristic of inverse cosine, the accuracy of the computed angle is varied depending on the position of the specific sound source. In this paper, we propose an efficient sound source localization system using angle division. By the proposed approach, the region from $0^{\circ}$ to $180^{\circ}$ is divided into three regions and we consider only one of the three regions. Thus considerable amount of computation time is saved. Also, the accuracy of the computed angle is improved since the selected region corresponds to the linear part of the inverse cosine function. By simulations, it is shown that the error of the proposed algorithm is only 31% of that of the conventional a roach.

키워드

참고문헌

  1. K. Nakadai, et al, "Active audition for humanoid," Proceedings of the 17th National Conference on Artificial Intelligence and 12th Conference on Innovative Applications of Artificial Intelligence, pp. 832-839, 2000
  2. 황성목, "머리전달함수를 이용한 로봇의 화자 위치 추정", 한국소음진동공학회 추계학술대회논문집, pp. 637-640, 2005
  3. Y. Sasaki, S. Kagami and H. Mizoguchi, "Multiple sound source mapping for a mobile robot by selfmotion triangulation," Proceedings of the 2006 IEEE/RSJ International Conference on Intelligent Robots and Systems, Beijing, China, 2006
  4. 권병호, 김경호, 박영진,"로봇 플랫폼에서 마이크로폰 위치를 고려한 음원의 방향 검지 방법" 한국소음진동공학회 2007년 추계학술대회 논문집, pp. 1080-1084, 2007
  5. M. S. Brandstein and H. Silverman, "A practical methodology for speech source localization with microphone arrays," Computer Speech and Language, 11(2): 91-126, 1997 https://doi.org/10.1006/csla.1996.0024
  6. C. H. Knnapp and G. C. Cater, "The generalized correlation method for estimation of time delay," IEEE Trnas. on Acoustics, Speech and Signal Processing, vol. Assp-24, no. 4, 1976
  7. C. H. Knnapp and G. C. Cater, "The generalized correlation method for estimation of time delay," IEEE Trnas. on acoustics, speech and signal processing, Vol. Assp-24, No. 4, 1976
  8. 황성목, 박윤식, 박영진, "머리전달함수를 이용한 로봇의 화자 위치 추정," 한국소음진동공학회 추계학술대회 논문집, pp.637-640, 2005