DOI QR코드

DOI QR Code

Sound Source Localization Method Based on Deep Neural Network

깊은 신경망 기반 음원 추적 기법

  • Park, Hee-Mun (School of Electrical, Electronics and Communication Engineering, Korea University of Technology and Education) ;
  • Jung, Jong-Dae (School of Electrical, Electronics and Communication Engineering, Korea University of Technology and Education)
  • Received : 2019.12.13
  • Accepted : 2019.12.26
  • Published : 2019.12.31

Abstract

In this paper, we describe a sound source localization(SSL) system which can be applied to mobile robot and automatic control systems. Usually the SSL method finds the Interaural Time Difference, the Interaural Level Difference, and uses the geometrical principle of microphone array. But here we proposed another approach based on the deep neural network to obtain the horizontal directional angle(azimuth) of the sound source. We pick up the sound source signals from the two microphones attached symmetrically on both sides of the robot to imitate the human ears. Here, we use difference of spectral distributions of sounds obtained from two microphones to train the network. We train the network with the data obtained at the multiples of 10 degrees and test with several data obtained at the random degrees. The result shows quite promising validity of our approach.

본 논문은 모바일 로봇과 자동제어 시스템에 적용될 수 있는 음원 위치 추적 시스템(Sound Source Localization, SSL)을 보여준다. 대부분 SSL의 기법은 음원 도달 시간차(Interaural Time Difference, ITD)와 음압 레벨의 차이(Interaural Level Difference, ILD)를 구하고, 마이크로폰 배열의 기하학적 원리를 이용하여 위치를 찾게 된다. 하지만 본 논문에서는 음원의 수평 각도를 구하기 위해 깊은 인공 신경망을 기반으로 한 다른 접근법은 제안한다. 인간의 귀를 모방한 로봇의 양쪽 마이크로폰에서 음원의 신호를 채집하여 연구에 사용했다. Network를 학습시키기 위해 양쪽 마이크로폰에서 얻어진 음원의 스펙트럼 분포 차이를 이용하였다. 각 10도 마다 채집한 데이터로 네트워크를 학습시켰고 임의의 각도에서 얻어진 데이터로 결과를 확인했다. 실험 결과 제안한 SSL의 접근 방식은 상당히 가능성이 있는 결과를 보여주었다.

Keywords

References

  1. S. H. Oh and K. S. Park, "Optimal Acoustic Sound Localization System Based on a Tetrahedron- Shaped Microphone Array," Journal of KIISE, Vol.43, No.1, pp.13-26, 2016. DOI: 10.5626/JOK.2016.43.1.13
  2. Yalta, N. Nakadai, K, & Ogata, "Sound source localization using deep learning models," Journal of Robotics and Mechatronics, Vol.29, No.1, pp.37-48, 2017. DOI: 10.20965/jrm.2017.p0037
  3. Wikipidia, "Correlation and dependence," https://en.wikipedia.org/wiki/Correlation_and_dependence
  4. Wikipidia, "Sound localization," https://en.wikipedia.org/wiki/Sound_localization
  5. Ian Goodfellow, Deep Learning, MIT PRESS, 2016.
  6. Suvorov. Dmitry and Dong. Ge and Zhukov. Roman, "Deep Residual Network for Sound Source Localization in the Time Domain," Journal of Engineering and Applied Sciences, Vol.13, No.13, pp.5096-5104, 2018. DOI: 10.3923/jeasci.2018.5096.5104