• 제목/요약/키워드: GCC-PHAT

검색결과 13건 처리시간 0.028초

비선형 전처리와 주파수 영역 저역 필터에 의한 임펄스성 잡음 환경에 강인한 위상 변환 일반 상호 상관 시간 지연 추정기 연구 (A study on robust generalized cross correlation-phase transform based time delay estimation in impulsive noise environment using nonlinear preprocessing and frequency domain low-pass filter)

  • 임준석;이근화
    • 한국음향학회지
    • /
    • 제43권4호
    • /
    • pp.406-413
    • /
    • 2024
  • 본 논문은 임펄스성 잡음에 견실한 시간 지연을 추정 방법을 제안한다. 제안하는 방법은 Generalized Cross Correlation - Phase Transform(GCC-PHAT) 방법에 비선형 전처리와 주파수 영역 저역 통과 필터를 사용한다. 본 논문에서는 GCC-PHAT의 연산 과정을 DFT로 다시 해석함으로써 GCC-PHAT에서 시간 지연 추정에 실제 사용되는 유효한 주파수 대역이 있음을 파악하고, 저역 통과 필터 사용하여 유효 대역만을 사용하면 잡음 성분을 줄여서 시간 추정 성능을 향상시킬 수 있음을 보인다. 제안한 방법을 임펄스성 잡음 환경에서 전통적인 GCC-PHAT와 비교함으로써 추정 견실성이 향상됨을 보인다.

지능형 로봇을 위한 GCC-PHAT 기반 음원추적 기술의 성능분석 (Performance analysis of GCC-PHAT-based sound source localization for intelligent robots)

  • 박범철;반규대;곽근창;윤호섭
    • 로봇학회논문지
    • /
    • 제2권3호
    • /
    • pp.270-274
    • /
    • 2007
  • In this paper, we present a Sound Source Localization (SSL) based GCC (Generalized Cross Correlation)-PHAT (Phase Transform) and new measurement method of angle with robot auditory system for a network-based intelligent service robot. The main goal of this paper is to analysis performance of TDOA and GCC-PHAT sound source localization method and new angle measurement method is compared. We use GCC-PHAT for measuring time delays between several microphones. And sound source location is calculated by using time delays and new measurement method of angle. The robot platform used in this work is wever-R2, which is a network-based intelligent service robot developed at Intelligent Robot Research Division in ETRI.

  • PDF

주파수영역 자기상관에 의한 위상 변환 일반 상호 상관 시간 지연 추정기 성능 개선 (Improved generalized cross correlation-phase transform based time delay estimation by frequency domain autocorrelation)

  • 임준석;정명준;김성일
    • 한국음향학회지
    • /
    • 제37권5호
    • /
    • pp.271-275
    • /
    • 2018
  • 두 개 센서에 도래하는 신호 간의 시간 지연을 추정 방법에는 여러 가지가 존재한다. 그중에서 두 센서에 입력되는 서로 다른 신호간의 상호 상관과 신호 백색화로부터 상대적인 지연을 추정하는 GCC-PHAT(Generalized Cross Correlation-Phase Transform) 방법은 안정적인 성능을 내는 전통적으로 유명한 방법이다. 본 논문에서는 GCC-PHAT의 연산 과정 중에서 주기성을 이용하여 잡음을 제거할 수 있는 부분을 파악하였다. 그리고 파악된 부분에 자기상관을 적용하였다. 제안한 방법을 기존의 방법과 비교하여, 백색 가우시안 신호원인 경우 신호 대 잡음비 0 dB 이상에서 평균 자승 추정 오차 5 dB ~ 15 dB까지의 향상이 있음을 보이고, 유색 신호원에서도 신호 대 잡음비 2 dB 이상에서 평균 자승 추정 오차가 성능 개선되어 15 dB까지의 성능 개선 효과가 있음을 보인다.

자동차 환경에서 TDOA를 이용한 화자위치추정 방법 (On the speaker's position estimation using TDOA algorithm in vehicle environments)

  • 이상헌;최홍섭
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권2호
    • /
    • pp.71-79
    • /
    • 2016
  • 본 논문에서는 차량 내부 환경에서 음성인식 성능을 향상시켜 안정적인 차량 제어를 위한 방법으로 사용하는 음원 위치추정방법의 성능 비교와 개선 방법을 제안하였다. 일반적으로 음원 위치추정에는 TDOA알고리즘을 사용하는데 여기에는 시간영역에서 상호상관함수를 이용하는 방법과, 주파수 영역에서 계산하는 GCC-PHAT 방법이 있다. 이중 GCC-PHAT 방법은 상호상관함수보다 반향과 잡음에 강한 특성을 보인다고 알려져 있다. 본 연구에서는 반향과 잡음이 많은 차량 환경에서 위 두 방법의 성능을 비교하고 추가로 미디언 필터 사용을 제안하여 음원위치 추정 성능과 시스템의 안정성을 나타내는 지표로 사용하는 분산값이 모두 향상됨을 확인하였다. 실험결과에서 음성을 사용한 실험에서는 두 방법의 성능 차이가 거의 없지만, 노래신호를 사용한 음원위치 추정에서는 GCC-PHAT 방법이 상호상관함수에 비해 인식률이 10% 우수함을 확인하였다. 또한 미디언 필터를 추가한 경우에는 상호상관함수 방법의 인식률을 최고 11%까지 향상시킬 수 있었고 분산값에서도 두 방법 모두 안정적인 성능을 보여주었다.

비음수 행렬 분해 및 일반화된 상호상관계수 기법을 이용한 TV시청 환경에서의 다중 음원 방향 추정 방법 (Direction Estimation of Multiple Sound Sources Using Non-negative Matrix Factorization and Generalized Cross-Correlation)

  • 유승우;전광명;박지현;김홍국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.16-17
    • /
    • 2015
  • 본 논문에서는 실내 환경 중 TV 시청환경에서 마이크로폰 어레이를 이용하여 다양한 다중 음원 방향을 추정하는 기법을 제안한다. 제안된 기법은 기존의 하나의 음원에 특화되어 있는 GCC-PHAT 기반의 방법을 GCC-PHAT 버퍼와 NMF를 도입하여 다중음원의 방향 추정을 가능하게 만들었다. 제안된 기법의 성능을 평가하기 위해서 실 거주 환경에서 발생하는 소음원과 TV 소리 방향 추정 결과에 대한 실측치와 추정치 간의 오차인 절대 평균오차를 측정하였으며, 실험 결과 제안한 기법이 기존의 방법인 GCC-PHAT보다 우수한 추정 성능을 보임을 확인하였다.

  • PDF

이동 목표물의 효율적인 위치 추정을 위한 파티클 필터 신호 처리의 GPU 기반 가속화 (GPU-based Acceleration of Particle Filter Signal Processing for Efficient Moving-target Position Estimation)

  • 김성섭;조정훈;박대진
    • 대한임베디드공학회논문지
    • /
    • 제12권5호
    • /
    • pp.267-275
    • /
    • 2017
  • Time of difference of arrival (TDOA) method using passive sonar sensor array has normally been used to estimate the location of a concealed moving target in underwater environment. Particle filter has been introduced for effective target estimation for non-Gaussian and nonlinear systems. In this paper, we propose a GPU-based acceleration of target position estimation using particle filter and propose efficient embedded system and software architecture. For the TDOA measurement from the passive sonar sensor, we use the generalized cross correlation phase transform (GCC-PHAT) method to obtain the correlation coefficient of the signal using FFT and we try to accelerate the calculation of GCC-PHAT based TDOA measurements using FFT with GPU CUDA. We also propose parallelization method of the target position estimation algorithm using the GPU CUDA to update the state of each particle for the target position estimation using the measured values. The target estimation algorithm was verified using Matlab and implemented using GPU CUDA. Then, we realized the proposed signal processing acceleration system using NVIDIA Jetson TX1 as the target board to analyze in terms of the execution time. The execution time of the algorithm is reduced by 55% to the CPU standalone-operation on the target board. Experiment results show that the proposed architecture is a feasible solution in terms of high-performance and area-efficient architecture.

반향음과 잡음 환경을 고려한 실시간 소리 추적 시스템 (Real-Time Sound Localization System For Reverberant And Noisy Environment)

  • 기창돈;김강호;이택진
    • 한국항공우주학회지
    • /
    • 제38권3호
    • /
    • pp.258-263
    • /
    • 2010
  • 소리를 이용한 위치 추적은 마이크로폰을 이용하여 신호를 수집하고 수집된 신호로 부터 마이크로폰 간의 신호 도달 시간차를 추정한 뒤 추정된 시간차를 이용하여 소리의 발생 위치를 추정하는 과정을 거치게 된다. 실내 환경에서 이를 활용하기 위해서는 잡음과 반향음에 대한 강건성을 확보해야만 하는 제약이 따른다. 특히 실시간으로 구현하기 위해서는 계산의 효율성까지 고려되어야 한다. 본 논문에서는 네 개의 저가 콘덴서 마이크로폰을 이용하여 비용적인 측면과 계산량에서의 효율성을 모두 추구하였다. 네 개의 마이크로폰을 이용하여 마이크로폰 간의 소리 도달 시간차를 구하는 계산량을 줄였고 GCC-PHAT(Generalized Cross Correlation-Phase Transform) 알고리즘을 이용해서 강건성을 높였으며 iterative least square 방식을 이용하여 높은 정확도의 위치 데이터를 얻을 수 있었다.

2차원 상의 음원위치 추정을 위한 효율적인 영역분할방법 (An efficient space dividing method for the two-dimensional sound source localization)

  • 김환용;최홍섭
    • 한국음향학회지
    • /
    • 제35권5호
    • /
    • pp.358-367
    • /
    • 2016
  • 음원의 위치를 찾는 SSL(Sound Source Localization)은 로봇과의 인터페이스, 화상회의, 스마트 자동차 등 여러 분야에서 꼭 필요한 기술이다. 일반적으로 음원의 위치 정보를 활용하는 기술들은 주로 측정 장치에 대한 음원의 각도 정보를 찾아서 이용하고 있다. 그러나 음원의 위치에 대한 각도를 추정할 때 이용하는 사인 역함수의 비선형적인 특성으로 추정된 각도에 오차가 발생하며, 이에 대한 방안으로 마이크가 담당하는 영역을 분할하는 방법이 제안되었다. 본 논문에서는 마이크 어레이 패턴에 따른 영역분할 방법을 제안하고 음원의 위치를 2차원상의 평면 좌표로 특정하는 방법으로 위치 추정 성능을 평가하였다. 실험에서 잡음에 강인한 GCC-PHAT(Generalized Cross Correlation Phase Transform) 방법을 사용했으며, 마이크 어레이의 패턴은 마이크 3개와 4개로 삼각형과 사각형 두 종류로 구성하였으며, 100개의 음성 데이터로 실험한 결과 실제 환경에서는 3개의 마이크 어레이를 사용해서는 영역 분할 해상도가 낮아서 음원의 위치를 정해진 특정 범위내로 추정하는데 실패했으나, 4개 마이크를 이용하여 해상도를 높였더니 위치추정 성공률이 67 %로 크게 향상됨을 확인할 수 있었다.

소형 마이크로폰 배열에 적용 가능한 음원 위치 추정법 비교 (Comparison of the sound source localization methods appropriate for a compact microphone array)

  • 정인지;이정권
    • 한국음향학회지
    • /
    • 제39권1호
    • /
    • pp.47-56
    • /
    • 2020
  • 음원위치추정 기술은 사물인터넷 시대에서 다양한 응용 분야를 가지고 있으며, 이로 인해 마이크로폰 프로브의 크기가 중요하게 고려되고 있다. 음향 인텐시티 벡터를 이용한 음원위치추정 방법은 마이크로폰 사이의 간격이 좁을수록 유한차분오차가 작기 때문에 배열을 소형화 할 수 있다는 장점이 있다. 본 논문에서는 음향 인텐시티 벡터 및 도달시간차 방법을 통해 원거리 음장에서 음원의 위치 추정 시 발생하는 오차를 비교한다. 정사면체 형태의 3차원 마이크로폰 배열을 통해 마이크로폰 사이의 간격 변화에 따라서 오차를 비교하였다. 실제 환경에서 음원위치추정 방법의 유효성을 검증하기 위해 잔향음장 내에서 잔향시간을 변화시켜 추가 실험을 수행하였다. 도달시간차를 계산하기 위해 Generalized Cross Correlation-Phase transform(GCC-PHAT) 알고리즘을 적용하였다. 실험 결과, T60 = 0.4 s일 때 음향인텐시티법에 의한 위치추정 오차는 2.9°, 그리고 GCC-PHAT를 적용했을 때는 7.3° 이며, T60 = 1.0 s일 때 오차는 각각 9.9°, 13.0°이다. 이를 통해 일반 잔향장이 고려되는 실제 환경에서도 소형의 마이크로폰 배열을 통한 음향 인텐시티법은 음원의 위치를 추정하는데 유효하게 적용될 수 있음을 알 수 있다.

이중 마이크로폰을 이용한 비음수 행렬분해 기반 다중음원 도래각 예측 (Nonnegative Matrix Factorization Based Direction-of-Arrival Estimation of Multiple Sound Sources Using Dual Microphone Array)

  • 전광명;김홍국;유승우
    • 전자공학회논문지
    • /
    • 제54권2호
    • /
    • pp.123-129
    • /
    • 2017
  • 본 논문에서는 이중 마이크로폰 배열을 이용하여 비음수 행렬분해(nonnegative matrix factorization, NMF) 기반으로 다중음원의 도래각을 추정하는 새로운 방법을 제안한다. 우선 이중 마이크로폰 배열에 들어온 음향 신호들을 연속된 분석프레임으로 분할한 후, 각 프레임에 대해 조향응답파워 위상변환(steered-response power phase transform, SRP-PHAT) 빔형성기를 적용하여 스테레오 신호들을 시간-방향 영역으로 표현한다. 이러한 SRP-PHAT의 시간-방향 출력값들은 사전에 정의된 프레임 수만큼 누적하여 시간-방향 블록으로 정의한다. 다음으로, 잡음에 강건한 도래각 추정을 위하여, 각 시간-방향 블록을 블록차감 기법을 사용하여 매 프레임에 대해 정규화한다. 이후, 다중음원 환경에서 각 음원의 방향을 클러스터링하기 위해 정규화된 시간-방향 블록에 비지도(unsupervised) NMF를 적용한다. 구체적으로, 음원의 개수와 이들의 도래각을 추정하는데 각각 활성 및 기저 행렬들을 사용한다. 제안된 방법의 도래각 추정 성능을 평가하기 위해 이중 마이크로폰 배열로부터 입력된 [$-35{\circ}$, 5m], [$12{\circ}$, 4m], 그리고 [$38{\circ}$, 4.m]에 각각 위치한 세 가지 음원들에 대한 추정 오차의 절대 평균(mean absolute error, MAE) 및 오차의 표준편차를 측정하였다. 실험 결과. 제안된 방법은 기존의 SRP-PHAT 기반 도래각 추정방법에 비해 상대적으로 MAE를 56.83% 줄일 수 있었다.