• 제목/요약/키워드: sound localization

검색결과 254건 처리시간 0.026초

PTZ 카메라 감시를 위한 실시간 위험 소리 검출 및 음원 방향 추정 소리 감시 시스템 (A Real-time Audio Surveillance System Detecting and Localizing Dangerous Sounds for PTZ Camera Surveillance)

  • 응웬비엣쿡;강호석;정선태;조성원
    • 한국멀티미디어학회논문지
    • /
    • 제16권11호
    • /
    • pp.1272-1280
    • /
    • 2013
  • 본 논문에서는 실시간으로 위험한 소리를 인식하고 그 방향을 파악하여 이를 통해 PTZ Camera가 위험한 소리 방향으로 회전하여 해당 지역 영상을 획득하여 전송할 수 있도록 지원하는 소리 감시 시스템을 제안한다. 제안 소리 감시 시스템은 적응 혼합 가우시안 모델(AGMM)을 사용하여 일상적인 배경 소리와는 비정상적인 소리를 전경 소리로 검출하고, AGMM 모델로 미리 학습된 전경 소리들 중의 하나로 분류한다. 분류된 소리가 위험한 소리에 속하는 경우, Dual delay-line 방법에 기반을 둔 음원 방향 추정 기법을 사용하여 그 방향을 파악한다. 최종적으로 방향 정보를 사용하여 PTZ 카메라를 조절하여 그 방향 지역의 해당 영상을 획득하고 전송될 수 있도록 지원한다. 제안하는 소리 감시 시스템은 전경 위험 소리들을 안정적으로 검출하고, 79%의 정확도로 위험소리들을 분류하고, 작은 오차범위 이내 음원 방향 추정 성능을 나타냄을 실험결과를 통해 확인하였다.

깊은 신경망 기반 음원 추적 기법 (Sound Source Localization Method Based on Deep Neural Network)

  • 박희문;정종대
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1360-1365
    • /
    • 2019
  • 본 논문은 모바일 로봇과 자동제어 시스템에 적용될 수 있는 음원 위치 추적 시스템(Sound Source Localization, SSL)을 보여준다. 대부분 SSL의 기법은 음원 도달 시간차(Interaural Time Difference, ITD)와 음압 레벨의 차이(Interaural Level Difference, ILD)를 구하고, 마이크로폰 배열의 기하학적 원리를 이용하여 위치를 찾게 된다. 하지만 본 논문에서는 음원의 수평 각도를 구하기 위해 깊은 인공 신경망을 기반으로 한 다른 접근법은 제안한다. 인간의 귀를 모방한 로봇의 양쪽 마이크로폰에서 음원의 신호를 채집하여 연구에 사용했다. Network를 학습시키기 위해 양쪽 마이크로폰에서 얻어진 음원의 스펙트럼 분포 차이를 이용하였다. 각 10도 마다 채집한 데이터로 네트워크를 학습시켰고 임의의 각도에서 얻어진 데이터로 결과를 확인했다. 실험 결과 제안한 SSL의 접근 방식은 상당히 가능성이 있는 결과를 보여주었다.

서브밴드 필터 뱅크를 이용한 강인한 음원 추적시스템에 대한 연구 (A Study on the Robust Sound Localization System Using Subband Filter Bank)

  • 박규식;박재현;온승엽;오상헌
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.36-42
    • /
    • 2001
  • 본 연구는 폐쇄된 사무 공간상에서 2개의 마이크로폰을 이용하여 임의의 위치에서 발생한 음성 및 음향의 방향성 (방향각)을 추적하는 새로운 알고리듬을 제안한다. 본 논문에서 제안한 Subband CPSP (Cross Power Spectrum Phase) 알고리듬은 기존의 CPSP 알고리듬을 개선한 것으로서, 마이크로폰에 수신된 2개의 입력 신호에 대해 서브밴드 필터 뱅크를 이 용하여 대역 분할하고 각 서브밴드 대역에서 구해지는 대역별 CPSP 결과의 평균값을 제공한다. 이러한 주파수 대역 분할방식은 잡음의 영향을 각 대역으로 한정 분산시켜 사무 공간내 잡음의 영향을 각 대역으로 한정하여 음원의 방향각 계산시 발생하는 오차를 최소화할 수 있는 보다 강인하고 정확한 음원 추적 시스템을 가능하게 한다. 제안된 알고리듬의 성능을 입증하기 위해 기존의 CPSP 와 Subband CPSP 알고리듬의 실시간 음원 추적 실험을 수행하였으며, 실험 결과 제안된 Subband CPSP가 CPSP에 비해 평균 5% 이상의 성능 향상을 가져옴을 확인할 수 있었다.

  • PDF

고역 주파수 영역에서 HRTF의 간략화에 관한 연구 (A study on the simplification of HRTF within high frequency region)

  • 이채봉
    • 융합신호처리학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-6
    • /
    • 2011
  • 본 연구에서는 머리전달함수(Head-Related Transfer Function : HRTF) 고역 주파수 영역에서의 간략화가 음상정위에 미치는 영향에 관하여 검토하였다. 이를 위해 HRTF를 측정하였으며 측정한 HRTF에 대하여 분석한 결과, 음원 반대편(음원에서 멀리 떨어진 귀)의 HRTF 고역 주파수 특성은 회절의 성질을 고려하면 머리에 의해 거의 감쇄가 된다. 이와 같이 감쇄된 주파수 영역에 대해서는 정위에 미치지 않는다고 가정하면 간략화가 가능하다. 간략화는 경계 주파수를 차단 주파수로 하는 지역통과 필터를 삽입하여 고역의 주파수 진폭특성을 평탄하게 함으로서 간략화를 하였다. 간략화를 한 HRTF를 평가하기 위하여 청취실험을 하였다. 청취실험의 결과, 정위오차에 대해서는 HRTF의 주파수 특성을 간략화 하여도 방향 지각에 영향이 없다는 것이 나타났다. 전후 혼란율에 대해서는 HRTF의 8kHz 이상의 주파수 특성을 간략화 하여도 영향이 없음이 나타났다. 최종적으로는 HRTF의 8kHz 이상의 주파수 특성에 본 연구의 간략화를 적용하여도 음상정위에 영향을 미치지 않는다는 것이 나타났다.

쿼드콥터의 음향 특성을 활용한 다수의 드론 위치 추정법 (A method for localization of multiple drones using the acoustic characteristic of the quadcopter)

  • 정인지;조완호;이정권
    • 한국음향학회지
    • /
    • 제43권3호
    • /
    • pp.351-360
    • /
    • 2024
  • 드론 기술의 발전으로 인해서 최근 다양한 분야에서 무인항공기가 활용되고 있으며, 이와 더불어 드론 사용 증가에 따르는 여러 가지 문제들이 발생하고 있다. 드론은 크기가 매우 작아서 레이더나 광학장비로 탐지하기 어려운 문제가 있으며, 따라서 최근에는 음향학적인 방법을 이용한 추적 방식이 적용되고 있다. 본 논문은 쿼드콥터 드론의 음향 특성을 활용하여 다수의 드론 위치를 추정하는 방법을 다루었다. 드론의 종류와 드론의 움직임 상태에 따라 각 로터로부터 유발되는 음향 특성이 구별되므로, 블레이드 통과 주파수 및 이에 대한 고조파 음원에 대한 위치 추정을 수행한 결과를 공간 군집화하여 드론의 음원을 재현하였다. 재현된 음원은, 위치 추정 알고리즘을 적용하여 최종적으로 다수의 드론 음원에 대한 위치를 결정하는데 사용된다. 쿼드콥터 드론의 음향 특성을 분석하기 위한 실험을 수행하였으며, 이때 측정한 음향 신호를 기반으로 서로 다른 세 종류의 드론에 대한 음원 위치 추정 시뮬레이션을 수행하였다. 이를 통해 드론의 음향 특성을 활용하여 다수의 드론 위치를 추정할 수 있음을 확인하였고, 분리된 드론 음원의 명확성과 음원 추정 알고리즘이 다수의 드론 위치 추정 정확도에 영향을 주는 것을 관찰하였다.

Model-based Clustering of DOA Data Using von Mises Mixture Model for Sound Source Localization

  • Dinh, Quang Nguyen;Lee, Chang-Hoon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.59-66
    • /
    • 2013
  • In this paper, we propose a probabilistic framework for model-based clustering of direction of arrival (DOA) data to obtain stable sound source localization (SSL) estimates. Model-based clustering has been shown capable of handling highly overlapped and noisy datasets, such as those involved in DOA detection. Although the Gaussian mixture model is commonly used for model-based clustering, we propose use of the von Mises mixture model as more befitting circular DOA data than a Gaussian distribution. The EM framework for the von Mises mixture model in a unit hyper sphere is degenerated for the 2D case and used as such in the proposed method. We also use a histogram of the dataset to initialize the number of clusters and the initial values of parameters, thereby saving calculation time and improving the efficiency. Experiments using simulated and real-world datasets demonstrate the performance of the proposed method.

방향심리인자를 이용한 최적 앰비소닉 패닝기법 (Optimized Ambisonic Panning Algorithm Using Directional Psychoacoustic Criteria)

  • 이신렬;이승래;성굉모
    • The Journal of the Acoustical Society of Korea
    • /
    • 제25권1E호
    • /
    • pp.8-13
    • /
    • 2006
  • In this paper, an Optimized Ambisonic Panning Algorithm (OAPA) which reduces sound localization error, is proposed. In the conventional Ambisonic Panning Algorithm (APA), sound localization is usually different from the panning angle, especially when listeners are not in an ideal listening position, because of low signal separation among other channels. To overcome this problem, an OAPA using window functions is proposed. A proper window function can be verified, comprising of higher harmonic components than 2M+1 and improved DPC and channel separation. Analysis results demonstrate that the proposed method results in higher signal separation among other channels and lower sound localization errors than the conventional APA.

휴대용 단말기에서 음원 위치 추적 기술 비교 연구 (A Comparative Study of Sound Source Localization Algorithms for Portable Devices)

  • 정재연;육동석
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 춘계 학술대회 발표논문집
    • /
    • pp.49-52
    • /
    • 2006
  • The performance of a sound source localization system degrades severely in reverberant and noisy environments. In addition, restriction on the distance between microphones, which is required by portable devices, also lower the system performance. This paper compares the sound source localization algorithms based on time delay of arrival, which are robust to reverberation and noises considering microphone sensor distance. As well, post filter which outputs maximum count time delay is adopted to increase the accuracy.

  • PDF

Remote Localization of an Underground Acoustic Source by a Passive Sonar System

  • Jarng, Soon-Suck
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1998년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.138-148
    • /
    • 1998
  • The aim of the work described in this paper is to develop a complex underground acoustic system which detects and localizes the origin of an underground hammering sound using an array of hydrophones located about loom underground. Three different methods for the sound localization will be presented, a time-delay method, a power-attenuation method and a hybrid method. In the time-delay method, the cross correlation of the signals received from the way of sensors is used to calculate the time delays between those signals. In the power-attenuation method, the powers of the received signals provide a measure of the distances of the source from the sensors. A new hybrid method has been developed for estimating the origin of the underground acoustic source by coupling both methods. The Nelder-Meade simplex search algorithm is then used to numerically estimate the position of the source in those methods. For each method the sound localization is carried out in three dimensions underground. The distance between the true and estimated origins of the source is in some cases less than 6m for a search area of radius 250m.

  • PDF

다점제어를 이용한 머리전달함수의 모의에 있어서의 물리적 모의정도와 청감상의 모의정도 (On the Physical and Perceptual Precision of the Multi-point Control Method in HRTF Simulation)

  • 김해영
    • 한국음향학회지
    • /
    • 제23권4호
    • /
    • pp.323-332
    • /
    • 2004
  • 음상정위를 제어하는 한 방법으로 음원으로부터 모의하고자 하는 두 귀까지의 머리전달함수 (HRTF)를 모의하는 방법이 유효하다. 그러나, 이 방법을 이용한 경우, 모의계를 설계할 때의 수음점과 청취시의 수음점이 완전하게 일치하는 경우에는 정밀한 모의가 가능하나, 청취시에 머리가 이동한 경우에는 모의정도가 크게 저하하는 문제점이 있다. 이러한 문제점을 해결하기 위해, 본 논문에서는 외이도의 입구뿐만 아니라 그 근방의 복수개의 점의 음압을 제어하는 것에 의해 머리가 다소 이동하더라도 제어가 가능하도록 한 모의계의 구성 방법을 제안한다. 본 논문에서는 이 방법을 이용해 머리전달함수를 모의한 경우에 대하여 물리적인 모의정도와 청감상의 음상정위의 정확도에 대하여 종래의 방법과 비교하여 실험했다. 그 결과 복수개의 점에 있어서의 온압을 제어하는 것에 의해 청취위치가 6 cm 정도까지 이동한 경우에도 수평면상에서 방향의 지각 오차를 종래의 방법보다 적게 할 수 있다는 것을 인간을 대상으로 한 청취실험을 통해 증명했다.