• 제목/요약/키워드: Sound Source Localization(SSL)

검색결과 6건 처리시간 0.016초

깊은 신경망 기반 음원 추적 기법 (Sound Source Localization Method Based on Deep Neural Network)

  • 박희문;정종대
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1360-1365
    • /
    • 2019
  • 본 논문은 모바일 로봇과 자동제어 시스템에 적용될 수 있는 음원 위치 추적 시스템(Sound Source Localization, SSL)을 보여준다. 대부분 SSL의 기법은 음원 도달 시간차(Interaural Time Difference, ITD)와 음압 레벨의 차이(Interaural Level Difference, ILD)를 구하고, 마이크로폰 배열의 기하학적 원리를 이용하여 위치를 찾게 된다. 하지만 본 논문에서는 음원의 수평 각도를 구하기 위해 깊은 인공 신경망을 기반으로 한 다른 접근법은 제안한다. 인간의 귀를 모방한 로봇의 양쪽 마이크로폰에서 음원의 신호를 채집하여 연구에 사용했다. Network를 학습시키기 위해 양쪽 마이크로폰에서 얻어진 음원의 스펙트럼 분포 차이를 이용하였다. 각 10도 마다 채집한 데이터로 네트워크를 학습시켰고 임의의 각도에서 얻어진 데이터로 결과를 확인했다. 실험 결과 제안한 SSL의 접근 방식은 상당히 가능성이 있는 결과를 보여주었다.

2차원 상의 음원위치 추정을 위한 효율적인 영역분할방법 (An efficient space dividing method for the two-dimensional sound source localization)

  • 김환용;최홍섭
    • 한국음향학회지
    • /
    • 제35권5호
    • /
    • pp.358-367
    • /
    • 2016
  • 음원의 위치를 찾는 SSL(Sound Source Localization)은 로봇과의 인터페이스, 화상회의, 스마트 자동차 등 여러 분야에서 꼭 필요한 기술이다. 일반적으로 음원의 위치 정보를 활용하는 기술들은 주로 측정 장치에 대한 음원의 각도 정보를 찾아서 이용하고 있다. 그러나 음원의 위치에 대한 각도를 추정할 때 이용하는 사인 역함수의 비선형적인 특성으로 추정된 각도에 오차가 발생하며, 이에 대한 방안으로 마이크가 담당하는 영역을 분할하는 방법이 제안되었다. 본 논문에서는 마이크 어레이 패턴에 따른 영역분할 방법을 제안하고 음원의 위치를 2차원상의 평면 좌표로 특정하는 방법으로 위치 추정 성능을 평가하였다. 실험에서 잡음에 강인한 GCC-PHAT(Generalized Cross Correlation Phase Transform) 방법을 사용했으며, 마이크 어레이의 패턴은 마이크 3개와 4개로 삼각형과 사각형 두 종류로 구성하였으며, 100개의 음성 데이터로 실험한 결과 실제 환경에서는 3개의 마이크 어레이를 사용해서는 영역 분할 해상도가 낮아서 음원의 위치를 정해진 특정 범위내로 추정하는데 실패했으나, 4개 마이크를 이용하여 해상도를 높였더니 위치추정 성공률이 67 %로 크게 향상됨을 확인할 수 있었다.

지능형 로봇을 위한 GCC-PHAT 기반 음원추적 기술의 성능분석 (Performance analysis of GCC-PHAT-based sound source localization for intelligent robots)

  • 박범철;반규대;곽근창;윤호섭
    • 로봇학회논문지
    • /
    • 제2권3호
    • /
    • pp.270-274
    • /
    • 2007
  • In this paper, we present a Sound Source Localization (SSL) based GCC (Generalized Cross Correlation)-PHAT (Phase Transform) and new measurement method of angle with robot auditory system for a network-based intelligent service robot. The main goal of this paper is to analysis performance of TDOA and GCC-PHAT sound source localization method and new angle measurement method is compared. We use GCC-PHAT for measuring time delays between several microphones. And sound source location is calculated by using time delays and new measurement method of angle. The robot platform used in this work is wever-R2, which is a network-based intelligent service robot developed at Intelligent Robot Research Division in ETRI.

  • PDF

Fast 360° Sound Source Localization using Signal Energies and Partial Cross Correlation for TDOA Computation

  • Yiwere, Mariam;Rhee, Eun Joo
    • Journal of Information Technology Applications and Management
    • /
    • 제24권1호
    • /
    • pp.157-167
    • /
    • 2017
  • This paper proposes a simple sound source localization (SSL) method based on signal energies comparison and partial cross correlation for TDOA computation. Many sound source localization methods include multiple TDOA computations in order to eliminate front-back confusion. Multiple TDOA computations however increase the methods' computation times which need to be as minimal as possible for real-time applications. Our aim in this paper is to achieve the same results of localization using fewer computations. Using three microphones, we first compare signal energies to predict which quadrant the sound source is in, and then we use partial cross correlation to estimate the TDOA value before computing the azimuth value. Also, we apply a threshold value to reinforce our prediction method. Our experimental results show that the proposed method has less computation time; spending approximately 30% less time than previous three microphone methods.

Model-based Clustering of DOA Data Using von Mises Mixture Model for Sound Source Localization

  • Dinh, Quang Nguyen;Lee, Chang-Hoon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.59-66
    • /
    • 2013
  • In this paper, we propose a probabilistic framework for model-based clustering of direction of arrival (DOA) data to obtain stable sound source localization (SSL) estimates. Model-based clustering has been shown capable of handling highly overlapped and noisy datasets, such as those involved in DOA detection. Although the Gaussian mixture model is commonly used for model-based clustering, we propose use of the von Mises mixture model as more befitting circular DOA data than a Gaussian distribution. The EM framework for the von Mises mixture model in a unit hyper sphere is degenerated for the 2D case and used as such in the proposed method. We also use a histogram of the dataset to initialize the number of clusters and the initial values of parameters, thereby saving calculation time and improving the efficiency. Experiments using simulated and real-world datasets demonstrate the performance of the proposed method.

에너지 기반 영역 선택과 TDOA에 의한 3차원 음원 위치 추정 (3-D Sound Source Localization using Energy-Based Region Selection and TDOA)

  • ;이은주
    • 한국정보통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.294-300
    • /
    • 2017
  • 본 논문에서는 에너지 기반 영역 선택과 TDOA에 의해 3차원에서 음원의 방위와 높이를 계산하여 음원 위치를 추정하는 방법을 제안한다. 본 연구의 목적은 음원 위치 추정에서 계산시간 감축으로, 수평면 3개 신호의 에너지 비교에 의한 영역 선택과 선택된 영역의 TDOA에 의해 방위각을 계산하고, 또 높이 계산을 위한 마이크로폰 신호와 가장 큰 에너지를 갖는 평면 신호와의 TDOA로 높이각을 추정하는 방법을 제안한다. 제안한 방법에 대한 음원 추정실험 결과 수평 방위각 추정에서 평균 $0.778^{\circ}$, 높이각 추정에서 $1.296^{\circ}$의 오류를 보여 기존의 방법과 정확도에서 유사하고, 추정은 1회 신호 에너지 비교와 2회의 TDOA계산으로 가능하여 처리 시간이 단축된다.