• 제목/요약/키워드: multi-channel Wiener filter

검색결과 11건 처리시간 0.078초

마이크로폰 어레이 신호의 잡음 제거를 위한 강인한 다채널 위너 필터 (Robust Multi-channel Wiener Filter for Suppressing Noise in Microphone Array Signal)

  • 정준영;김기백
    • 방송공학회논문지
    • /
    • 제23권4호
    • /
    • pp.519-525
    • /
    • 2018
  • 본 논문에서는 다채널 위너 필터를 이용하여 마이크로폰 어레이에서 취득된 신호의 잡음을 제거하는 방법을 다룬다. 다채널 위너 필터는 음성 신호의 방향에 대한 정보를 필요로 하지 않는 필터로서 단일 음성 음원의 경우, 음성 왜곡을 발생시키지 않는 MVDR (Minimum Variance Distortionless Response) 공간 필터와 단일 채널 스펙트럼 필터로 분리될 수 있다. MVDR의 방향벡터에 해당하는 단일 음성 음원과 마이크로폰 어레이 간의 음향 전달 함수는 다채널 위너 필터의 부공간 분해 (subspace decomposition)를 이용하여 추정할 수 있다. 이 때 상관 행렬 추정 과정에서 발생하는 오차로 인해 추정되는 음향 전달 함수에도 오차가 발생하게 되며 이에 따라 다채널 위너 필터를 구성하는 MVDR은 음성 왜곡을 발생시키게 된다. 이러한 음성 왜곡을 완화시키기 위해 diagonal loading을 적용하고 실험을 통해 그 효과를 검증한다. 실험에서는 7개의 선형 마이크로폰으로 수집된 데이터를 이용하였으며 잡음을 섞기 전 신호와 잡음을 섞은 후 필터를 통과시킨 신호 간의 MFCC 오차를 측정한다. 실험 결과, diagonal loading을 통해 MFCC 오차를 줄일 수 있음을 확인하였다.

다채널 위너 필터의 주성분 부공간 벡터 보정을 통한 잡음 제거 성능 개선 (Improved speech enhancement of multi-channel Wiener filter using adjustment of principal subspace vector)

  • 김기백
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.490-496
    • /
    • 2020
  • 본 논문에서는 잡음 환경에서 다채널 위너 필터의 성능을 향상시키기 위한 방법을 제안한다. 부공간(subspace) 기반의 다채널 위너 필터를 설계하는 경우, 목적 신호가 단일 음원인 경우는 음성 상관 행렬의 주성분 부공간에서 음성 성분을 추정할 수 있다. 이 때, 음성 상관 행렬은 음성과 간섭 잡음의 교차 상관도가 음성 상관 행렬에 비해 무시할만한 수준이라는 가정하에 신호 상관 행렬에서 간섭 잡음의 상관 행렬을 차감하여 추정하게 된다. 그러나 간섭 잡음 수준이 높아지게 되면 이러한 가정이 더 이상 유효하지 않게 되며 이에 따라 주성분 부공간 추정 오차도 증가하게 된다. 본 연구에서는 음성 존재 확률과 목적 신호의 방향 벡터를 이용하여 주성분 부공간을 보정하는 방법을 제안한다. 주성분 부공간에서 다채널 음성 존재 확률을 유도하고 주성분 부공간 벡터를 보정하는데 적용하였다. 실험을 통해 제안하는 방법이 잡음 환경에서 다채널 위너 필터의 성능을 향상시키는 것을 확인할 수 있다.

공간 필터와 결합된 음성 왜곡 가중 다채널 위너 필터에서의 신호 대 잡음 비에 의한 가중치 결정 방법 (SNR-based Weight Control for the Spatially Preprocessed Speech Distortion Weighted Multi-channel Wiener Filtering)

  • 김기백
    • 방송공학회논문지
    • /
    • 제18권3호
    • /
    • pp.455-462
    • /
    • 2013
  • 본 논문에서는 여러 개의 마이크를 이용하여 잡음을 제거하는 방법인 공간 필터로 전처리된 신호를 입력으로 하는 음성 왜곡 가중 다채널 위너 필터 (Spatially Preprocessed Speech Distortion Weighted Multi-channel Wiener Filter: SP-SDW-MWF)에 대해 소개하고, 가중치를 결정하는 방법을 제안한다. SP-SDW-MWF는 마이크로폰 어레이를 이용한 잡음 제거 알고리즘으로서 마이크로폰 불일치와 같은 오차에 강인한 것으로 알려져 있다. SP-SDW-MWF는 필터 계수를 최적화할 때 음성 왜곡과 잡음 제거에 대한 기준으로 나누어 가중치를 두고 있다. 이러한 가중치를 결정하기 위해, 본 논문에서는 전력 스펙트럼 밀도 오차를 평가 척도로 사용하여 마이크로폰으로부터 입력된 음성 신호와 잡음의 전력 스펙트럼 밀도의 비 (a priori SNR)를 이용하는 방법을 제안한다. 실험결과에서 나타난 바와 같이 a priori SNR에 따라 가변적인 가중치를 사용하는 것이 고정된 값을 가중치로 사용하는 것보다 향상된 성능을 보임을 알 수 있다.

시변 다중입출력 방송 채널을 위한 채널예측이 적용된 협력 빔형성 시스템 (Coordinated Beamforming Systems with Channel Prediction in Time-varying MIMO Broadcast Channel)

  • 김진;강진환;김상효
    • 한국통신학회논문지
    • /
    • 제36권5C호
    • /
    • pp.302-308
    • /
    • 2011
  • 본 논문에서는 시변 다중 입출력 (multiple-input multiple-output) 방송(broadcast) 채널에서 피드백 양자화와 지연을 고려한 협력 빔형성 (coordinated beamforming: CBF) 시스템을 제안한다. 다중 데이터 스트림을 전송하는 CBF 시스템에 피드백 양자화 기법을 적용하고, 구현 복잡도와 피드백 오버헤드 측면에서 효율적인 CBF 시스템을 제시한다. 또한, 실제적인 무선통신 환경에서 발생하는 피드백 지연에 의한 오류를 최소화하기 위하여 사용자 단말에 선형 채널 예측기를 적용한다. 선형 예측기로 Wiener 필터를 이용하여 피드백 지연시간 후의 미래 채널을 예측하교 이를 토대로 피드백 정보를 생성함으로써 지연된 피드백 정보를 이용하는 CBF 시스템의 성능을 향상시킨다. 모의실험을 통해 다양한 도플러 (Doppler) 주파수의 MIMO 방송 채널에서 양자화와 Wiener 필터를 적용한 CBF 시스템의 향상된 심볼 오율과 합 전송률 성능을 확인한다.

앙상블 기법을 이용한 잡음 환경에서의 화자인식 방법에 관한 연구 (A Study on Noise-Robust Speaker Recognition Methods Based on Ensemble of Decision Scores)

  • 양준영;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.457-459
    • /
    • 2018
  • 화자인식 기술은 주어진 임의의 두 발화로부터 발화자의 일치 여부를 판단하여 등록된 화자의 목록으로부터 임의로 입력된 발화의 발화자를 식별하는 기술이다. 그러나, 배경잡음이나 반향이 존재하는 경우에는 음성신호가 왜곡되어 화자인식 성능이 저하될 수 있기 때문에 별도의 음성신호 전처리 알고리즘을 함께 사용할 수 있다. 본 논문에서는 배경잡음이 존재하는 환경에서 다수의 마이크로폰을 통해 수집한 음성신호에 대해 화자인식을 수행하는 방법으로써 parametric multi-channel Wiener filter (PMWF)를 이용한 화자일치 점수 앙상블 기법을 제안한다. 입력신호의 신호대잡음비를 기준으로 점수 결합 시 사용되는 결합계수를 정하고, Wiener filter 로 잡음을 제거하여 얻은 점수와 minimum variance distortionless response (MVDR) 빔포머를 통해 잡음을 제거하여 얻은 정수를 가중결합하는 방식으로 동일오류율을 측정한 결과, 각 전처리 알고리즘을 독립적으로 사용하여 점수를 계산한 경우보다 우수한 성능을 보임을 확인할 수 있었다.

유사색 모집단을 이용한 개선된 분광 반사율 추정 (Advanced surface spectral-reflectance estimation using a population with similar colors)

  • 이철희;김태호;류명춘;오주환
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2001년도 춘계학술대회논문집:21세기 신지식정보의 창출
    • /
    • pp.280-287
    • /
    • 2001
  • The studies to estimate the surface spectral reflectance of an object have received widespread attention using the multi-spectral camera system. However, the multi-spectral camera system requires the additional color filter according to increment of the channel and system complexity is increased by multiple capture. Thus, this paper proposes an algorithm to reduce the estimation error of surface spectral reflectance with the conventional 3-band RGB camera. In the proposed method, adaptive principal components for each pixel are calculated by renewing the population of surface reflectances and the adaptive principal components can reduce estimation error of surface spectral reflectance of current pixel. To evacuate performance of the proposed estimation method, 3-band principal component analysis, 5-band wiener estimation method, and the proposed method are compared in the estimation experiment with the Macbeth ColorChecker. As a result, the proposed method showed a lower mean square ems between the estimated and the measured spectra compared to the conventional 3-band principal component analysis method and represented a similar or advanced estimation performance compared to the 5-band wiener method.

  • PDF

Multi-channel Speech Enhancement Using Blind Source Separation and Cross-channel Wiener Filtering

  • Jang, Gil-Jin;Choi, Chang-Kyu;Lee, Yong-Beom;Kim, Jeong-Su;Kim, Sang-Ryong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권2E호
    • /
    • pp.56-67
    • /
    • 2004
  • Despite abundant research outcomes of blind source separation (BSS) in many types of simulated environments, their performances are still not satisfactory to be applied to the real environments. The major obstacle may seem the finite filter length of the assumed mixing model and the nonlinear sensor noises. This paper presents a two-step speech enhancement method with multiple microphone inputs. The first step performs a frequency-domain BSS algorithm to produce multiple outputs without any prior knowledge of the mixed source signals. The second step further removes the remaining cross-channel interference by a spectral cancellation approach using a probabilistic source absence/presence detection technique. The desired primary source is detected every frame of the signal, and the secondary source is estimated in the power spectral domain using the other BSS output as a reference interfering source. Then the estimated secondary source is subtracted to reduce the cross-channel interference. Our experimental results show good separation enhancement performances on the real recordings of speech and music signals compared to the conventional BSS methods.

유사색 모집단을 이용한 물체의 분광 반사율 추정 (Estimation of Surface Spectral Reflectance using A Population with Similar Colors)

  • 이철희;서봉우;안석출
    • 한국멀티미디어학회논문지
    • /
    • 제4권1호
    • /
    • pp.37-45
    • /
    • 2001
  • 다대역(multi-band) 카메라 시스템으로 물체의 분광 반사율을 추정하여 피사체의 고유한 색자극을 기록하기 위한 연구가 활발하다. 그러나 다대역 카메라 시스템은 대역 수에 따라 추가적인 색필터가 필요하며 중복촬영으로 인하여 시스템의 복잡성이 증가하는 단점이 있다. 따라서 본 논문에서는 기존의 3대역 RGB 카메라를 이용하여 분광 반사율의 추정 오차를 개선하는 방법을 제안한다. 제안된 방법에서는 화소 단위로 반사광의 모집단을 갱신하여 각 입력색에 대해 적응적인 주성분 벡터를 구하였으며 이를 이용하여 해당 화소의 분광반사율 추정시 오차를 줄였다. 제안된 반사율 추정 방법의 유용성을 평가하기 위하여 제안된 방법과 3대역 주성분 분석(principal component analysis) 방법 및 5대역 위너 추정(Wiener estimation) 방법에 대하여 각각 Macbeth ColorChecker에 대한 분광 반사율 추정 실험을 하였다. 결과, 제안한 방법은 색차 및 분광 반사율 평균자승오차가 기존의 3대역 주성분 분석 방법보다 적었으며 5대역 카메라를 이용한 분광 반사율 추정 방법과 근사하건, 개선되었음을 확인하였다.

  • PDF

자동차 주행 환경에서의 화자인식 시스템 개발에 관한 연구 (A Study on Developing Speaker Recognition System In Driving Car Environment)

  • 양준영;장준혁;이창원;박기희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.934-936
    • /
    • 2017
  • 화자인식 기술은 등록된 화자 목록 내 화자 또는 사칭 화자의 발화로부터 발화자를 식별하는 기술로써, 음성 소스를 기반으로 동작하는 디바이스의 개인화를 위해 필요한 기술이다. 본 논문에서는 차량 잡음이 존재하는 자동차 주행 환경을 타겟으로 하는 화자인식 시스템 개발 방법을 제안한다. 차량 잡음에 의해 오염된 음성신호로부터 잡음 성분을 제거하기 위해 parametric multi-channel Wiener filter (PWMF)를 이용하여 실험한 결과, 남성화자 조건에서는 PMWF의 내부 파라미터 조절을 통해 필터를 minimum variance distortionless response (MVDR) 빔포머로 동작하도록 설정하였을 때, 여성화자 조건에서는 잡음을 제거하지 않았을 때 가장 낮은 동일오류율을 보임을 확인할 수 있었다.

빔포밍 및 DOA 기반의 마스킹을 이용한 2채널 잡음제거 (Two-Channel Noise Reduction Using Beamforming and DOA-Based Masking)

  • 김영일;정상배
    • 한국정보통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.32-40
    • /
    • 2013
  • 본 논문에서는 빔포밍과 입사각분석 기반 마스킹을 이용한 다채널 음성개선 알고리즘이 제안된다. 제안된 알고리즘에서는 LCMV 빔포밍을 수행한 후에 입사각 분석을 이용한 멜-주파수 위너필터가 적용되어 잔존하는 잡음을 제거한다. 성능 향상을 위해서 빔포밍의 적응 필터 학습률과 목표 음성 스펙트럼 검출을 위한 입사각 임계치가 최적화된다. 성능 지수로서 PESQ와 출력 SNR이 측정되었으며 실험 결과 제안한 알고리즘이 종전의 최소분산 빔포밍 기법보다 PESQ 관점에서 0.09, 출력 SNR 관점에서 5.75 dB의 성능 향상시킴을 알 수 있었다.