DOI QR코드

DOI QR Code

Hardware Design of Enhanced Real-Time Sound Direction Estimation System

향상된 실시간 음원방향 인지 시스템의 하드웨어 설계

  • 김태완 (경희대학교 전자.전파공학과) ;
  • 김동훈 (LIG넥스원(주) 연구개발본부 Maritime 연구소) ;
  • 정연모 (경희대학교 전자.전파공학과)
  • Received : 2010.12.15
  • Accepted : 2011.03.31
  • Published : 2011.04.30

Abstract

In this paper, we present a method to estimate an accurate real-time sound source direction based on time delay of arrival by using generalized cross correlation with four cross-type microphones. In general, existing systems have two disadvantages such as system embedding limitation due to the necessity of data acquisition for signal processing from microphone input, and real-time processing difficulty because of the increased number of channels for sound direction estimation using DSP processors. To cope with these disadvantages, the system considered in this paper proposes hardware design for enhanced real-time processing using microphone array signal processing. An accurate direction estimation and its design time reduction is achieved by means of an efficient hardware design using spatial segmentation methods and verification techniques. Finally we develop a system which can be used for embedded systems using a sound codec and an FPGA chip. According to experimental results, the system gives much faster real-time processing time compared with either PC-based systems or the case with DSP processors.

본 논문에서는 십자 형태로 구성된 네 개의 마이크로폰을 이용하여 일반화된 상호 상관 기법을 적용한 음성 도달시간 지연을 측정하여 정확한 음원 방향을 실시간으로 계산하는 방식에 대해 제시하였다. 기존 시스템에서는 마이크로폰 어레이 신호처리를 위해 데이터 수집 장치를 필요로 하므로 시스템을 내장하기 힘들고, 또한 DSP 프로세서를 사용한 음원방향 인지는 마이크로폰의 채널의 수가 늘어날수록 실시간 처리가 어려워지는 두 가지 단점이 있다. 본 논문에서는 이러한 한계를 극복하기 위하여 마이크로폰 어레이 신호처리를 이용한 향상된 음원방향 인지 하드웨어의 개발을 제안하였다. 공간 구분 기법을 이용한 효율적인 설계 및 검증방식을 제안하였고 이를 통하여 보다 정확한 방향 추정과 설계시간 단축이 가능하다. 최종적으로 음성 코덱과 FPGA를 이용하는 임베디드 시스템을 위해서 사용이 가능한 시스템을 개발하였다. 실험 결과에 의하면 PC 기반이나 DSP 프로세서를 사용한 경우에 비해 보다 빠른 처리 시간을 보였다.

Keywords

References

  1. 구자현, "Rayleigh의 소리의 방향 지각연구에 대한 과학사적 고찰," 한국음향학회지, 21권, 8호, 695-702쪽, 2002.
  2. 구자현, "미국 음향학자 앨프레드 메이어의 음향학 연구," 한국음향학회지, 28권, 1호, 44-50쪽, 2009.
  3. Azizul H. Quazi, "An Overview on the Time Delay Estimate in Active and Passive System for Target Localization," IEEE Transactions on Acoustic, Speech, and Signal Processing, vol. ASSP-29, no. 3, pp. 527-533, 1981.
  4. Kim, Young Ik, "Spatial Hearing Algorithms Based on Binaural Zero-Crossings: Sound Source Localization, Segregation and Dereverberation," Doctoral thesis, KAIST, 2007.
  5. Jindong Chen, Jacob Benesty, and Yiteng Huang, "Time Delay Estimation in Room Acoustic Environments: An Overview," EURASIP J. Appl. Signal Processing, vol. 2006, pp. 1-19, 2006.
  6. Charles H. Knapp, "The Generalized Correlation Method for Estimation of Time Delay," IEEE Transactions on Acoustic, Speech, and Signal Processing, vol. ASSP-24, no. 4, pp. 320-327, 1976.
  7. Richard M.stern, "Models of Binaural Interaction," Chapter in Handbook of Perception and Cognition, volume 6: Hearing.
  8. Byoungho Kwon, Youngjin Park and Youn-sik Park, "Sound Source Localization Method Using Spatially Mapped GCC Functions," 한국소음진동공학회논문집, 19권, 4호, 355-362쪽, 2009.
  9. H Atmoko, D C Tan,G Y Yian and Bruno Fazenda, "Accurate Sound Source Localization in a Reverberant Environment using Multiple Acoustic Sensors," Meas. Sci. Technol. 19, 024001, 2008. https://doi.org/10.1088/0957-0233/19/2/024001
  10. Jean-Marc Valin, Francois Michaud, Jean Rouant and Dominic Letourneau, "Robust Sound Source Localization Using a Microphone Array on a Mobile Robot," Proceedings of the 2003 IEEE/RSJ intl. Conference on intelligent Robots and Systems, vol. 2, pp. 1228-1223, 2003.
  11. Russ Duren, Jeremy Stevenson and Mike Thompson, "A Comparison of FPGA and DSP Development Environments and Performance for Acoustic Array Processing," Circuits and Systems, MWSCAS 2007. 50th Midwest Symposium, pp. 1177-1180, 2007.