DOI QR코드

DOI QR Code

QRAS-based Algorithm for Omnidirectional Sound Source Determination Without Blind Spots

사각영역이 없는 전방향 음원인식을 위한 QRAS 기반의 알고리즘

  • Kim, Youngeon (R&D Center, DongOh Technology Co., Ltd.) ;
  • Park, Gooman (The Graduate School, Seoul National University of Science and Technology)
  • 김영언 (동오정밀(주)부설연구소) ;
  • 박구만 (서울과학기술대학교 나노IT디자인융합대학원)
  • Received : 2021.09.30
  • Accepted : 2022.01.03
  • Published : 2022.01.30

Abstract

Determination of sound source characteristics such as: sound volume, direction and distance to the source is one of the important techniques for unmanned systems like autonomous vehicles, robot systems and AI speakers. There are multiple methods of determining the direction and distance to the sound source, e.g., using a radar, a rider, an ultrasonic wave and a RF signal with a sound. These methods require the transmission of signals and cannot accurately identify sound sources generated in the obstructed region due to obstacles. In this paper, we have implemented and evaluated a method of detecting and identifying the sound in the audible frequency band by a method of recognizing the volume, direction, and distance to the sound source that is generated in the periphery including the invisible region. A cross-shaped based sound source recognition algorithm, which is mainly used for identifying a sound source, can measure the volume and locate the direction of the sound source, but the method has a problem with "blind spots". In addition, a serious limitation for this type of algorithm is lack of capability to determine the distance to the sound source. In order to overcome the limitations of this existing method, we propose a QRAS-based algorithm that uses rectangular-shaped technology. This method can determine the volume, direction, and distance to the sound source, which is an improvement over the cross-shaped based algorithm. The QRAS-based algorithm for the OSSD uses 6 AITDs derived from four microphones which are deployed in a rectangular-shaped configuration. The QRAS-based algorithm can solve existing problems of the cross-shaped based algorithms like blind spots, and it can determine the distance to the sound source. Experiments have demonstrated that the proposed QRAS-based algorithm for OSSD can reliably determine sound volume along with direction and distance to the sound source, which avoiding blind spots.

음원의 음량, 방향 및 음원까지의 거리와 같은 음원의 특성을 인식하는 것은 자율주행차, 로봇 시스템, AI 스피커 등 무인 시스템에서 중요한 기술 중의 하나이다. 음원의 방향이나 거리를 인식하는 방법은 레이다, 라이더, 초음파 및 고주파와 소리를 이용하는 방법이 있다. 그러나 이러한 방법은 신호를 발신하여야 하며, 장애물에 의한 비가시 영역에서 발생하는 음원은 정확하게 인식할 수 없다. 본 논문에서는 비가시 영역을 포함한 주변에서 발생하는 음원의 음량, 방향 및 음원까지의 거리를 인식하는 방법으로 가청 주파수 대역의 소리를 검출하여 인식하는 방법을 구현하고 평가하였다. 음원을 인식하기 위하여 주로 사용하는 교차형 기반의 음원인식 알고리즘은 음원의 음량과 방향을 인식할 수 있으나 사각영역이 발생하는 문제가 있다. 뿐만아니라 이 알고리즘은 음원까지의 거리를 인식할 수 없다는 제약이 있다. 이러한 기존 방법의 한계를 탈피하기 위하여, 본 논문에서는 교차형 기반의 알고리즘보다 더 발전된 직사각형 기법을 사용한 QRAS 기반의 알고리즘으로 음원의 음량, 방향 및 음원까지의 거리를 인식하여 음원의 특성을 파악할 수 있는 음원인식 알고리즘을 제안한다. 전방향 음원인식을 위한 QRAS 기반의 알고리즘은 직사각형으로 배치된 4개의 음향센서에 의하여 도출되는 6쌍의 음향 도착 시간차를 사용한다. QRAS 기반의 알고리즘은 기존 교차형 기반의 알고리즘으로 음원을 인식할 때 발생하는 사각영역과 같은 문제점을 해결할 수 있으며, 음원까지의 거리도 인식할 수 있다. 실험을 통하여 제안된 전방향 음원 인식을 위한 QRAS 기반의 알고리즘은 사각영역없이 음원의 음량, 방향 및 음원까지의 거리를 인식할 수 있음을 확인하였다.

Keywords

Acknowledgement

This research was supported by Brain Pool program funded by the Ministry of Science and ICT through the National Research Foundation of Korea(2020H1D3A2A02048280).

References

  1. Y. T. Cho, C. M. Park, Y. G. Kim, Y. Kim, and I. B. Jung, "Distance measurement system between sensor in the wireless sensor network", Korea information processing society, Vol. 13 No. 1, pp. 1263-1266, 2006.
  2. D. Lee, B. Jang, S. Im, and J. Song, "A new sound source localization approach using stereo directional microphones", International conference on information communication and signal processing", pp.504-508, 2019.
  3. H. Liu, J. Zhang, and Z. Fu, "A new hierarchical binaural sound source localization method based on interaural matching filter", International conference on robotics & automation, pp. 1598-1605, 2014.
  4. C. M. Zannini, R. Parisi, and A. Uncini, "Binaural sound source localization in the presence of reverberation", International conference on digital signal processing 2011, pp. 1-6, 2011.
  5. P. Parhizkari, "Binaural hearing human ability of sound source localization", Blekinge institute of technology, pp. 01-57, 2008.
  6. H. Gu, and S. Yang, "A sound-source localization system using three-microphone array and cross power spectrum phase", International conference on machine learning and computing, pp. 1-5, 2012.
  7. C. H. Adritya, and H. M. Saputra, "Azimuth estimation based on generalized cross correlation phase transform using equilateral triangle microphone array", International conference on radar, antenna, microwave, electronics and telecommunications, pp. 89-93, 2019.
  8. B. Rudzyn, W. Kadous, and C. Sammut, "Real time robot audition system incorporating both 3D sound source localization and voice characterization", International conference on robotics and automation, pp. 4733-4738, 2007.
  9. B. Al-Sheikh, A. Elshebli, A. Al-Assaf, S. Almashaqbeh, W. Alrawabdeh, and A. Al-Tahat, "Sound source direction estimation in horizontal plane using microphone array", International conference on applied electrical engineering and computing technologies, pp. 1-6, 2013.
  10. L. Rayleigh, "On our perception of sound direction", Philosophical magazine, pp. 214-232, 1907.
  11. B. Grothe, M. Pecka, and D. McAlpine, "Mechanisms of sound localization in mammals", The American physiological society, Physiol rev. 90, pp. 983-1012, 2010.
  12. M. Zohourian, and R. Martin, "Binaural speaker localization and separation based on a joint ITD/ILD model and head movement tracking", International conference on acoustics, speech, & signal processing 2016, pp. 430-434, 2016.
  13. M. Raspaud, H. Viste, and G. Evangelista, "Binaural source localization by joint estimation of ILD and ITD", Transactions on audio, speech, and language processing, vol. 18, pp. 68-77, 2010. https://doi.org/10.1109/TASL.2009.2023644
  14. E. Visser, M. P. Zwiers, C. C. Kan, L. Hoekstra, A. J. Opstal, and Jan K. Buitelaar, "A typical vertical sound localization and sound-onset sensitivity in people with autism spectrum disorders", Canadian medical association, pp. 398-406, 2013.
  15. J. D. Chen, J. Benesty, and Y. Huang, "Performance of GCC- and AMDF-based time-delay estimation in practical reverberant environments", European association for signal processing journal on applied signal processing, pp. 25-36, 2005.