• 제목/요약/키워드: Speech Enhancement

검색결과 340건 처리시간 0.029초

음성강화를 위한 시간 및 주파수 도메인의 분산정규화 기반 잡음예측 및 저감방법 (Nose Estimation and Suppression methods based on Normalized Variance in Time-Frequency for Speech Enhancement)

  • 이수정;김순협
    • 대한전자공학회논문지SP
    • /
    • 제46권1호
    • /
    • pp.87-94
    • /
    • 2009
  • 잡음예측 및 저감방법은 음성통신과 인식분야의 중요한 핵심기술이다. 본 논문에서는 다양한 잡음환경에 적용할 수 있는 새로운 잡음예측 및 저감 방법을 제안한다. 제안된 알고리즘은 시간 및 주파수영역의 noisy power spectrum 의 분산과 그 값의 정규화 ratio를 기반으로 한다. 제안한 방법은 다양한 잡음환경에서 잘 동작 할 수 있도록 적응추적 임계값을 사용하며, 이 임계값은 음성왜곡과 잔여잡음 사이의 trade-off를 제어한다. 새로운 알고리즘의 성능은 다양한 잡음환경에서 ITU-T P.835(SIG) and segment (SNR) 의해 평가하여 기존의 방법에 비해 향상된 결과를 나타냈다.

잡음 환경 분류 알고리즘을 이용한 IMCRA 기반의 음성 향상 기법 (Speech Enhancement Based on IMCRA Incorporating noise classification algorithm)

  • 송지현;박규석;안홍섭;이상민
    • 전기학회논문지
    • /
    • 제61권12호
    • /
    • pp.1920-1925
    • /
    • 2012
  • In this paper, we propose a novel method to improve the performance of the improved minima controlled recursive averaging (IMCRA) in non-stationary noisy environment. The conventional IMCRA algorithm efficiently estimate the noise power by averaging past spectral power values based on a smoothing parameter that is adjusted by the signal presence probability in frequency subbands. Since the minimum of smoothing parameter is defined as 0.85, it is difficult to obtain the robust estimates of the noise power in non-stationary noisy environments that is rapidly changed the spectral characteristics such as babble noise. For this reason, we proposed the modified IMCRA, which adaptively estimate and updata the noise power according to the noise type classified by the Gaussian mixture model (GMM). The performances of the proposed method are evaluated by perceptual evaluation of speech quality (PESQ) and composite measure under various environments and better results compared with the conventional method are obtained.

차량환경에서 음성인식 성능 향상을 위한 마이크로폰 어레이 빔형성 기법 (A Microphone Array Beamformer for the Performance Enhancement of Speech Recognizer in Car)

  • 한철희;강홍구;황영수;윤대희
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.423-430
    • /
    • 2005
  • 본 논문에서는 차량환경에서 잔향과 근접장 효과에 의해 발생하는 목적 음성 신호의 왜곡을 감소시킬 수 있는 마이크로폰 어레이 빔형성 기법을 제안하였다. 온라인으로 추정하기 어려운 소스와 마이크간의 전달함수 대신 상대적으로 추정이 용이한 기준 마이크와 다른 마이크간의 상대전달함수를 조향 벡터로 이용함으로써, 원격장 모델의 조향 벡터를 이용한 빔형성기에 비해 목적 음성 신호의 왜곡을 감소시킬 수 있는 준최적 빔형성 기법을 제안하였다. 제안된 방법의 성능을 검증하기 위해, 실제 차량에서 녹음된 음성 DB를 구축하고, 이를 이용하여 HTK를 통한 음성인식 실험을 수행하였다. 음성인식 실험 결과 원격장 모델을 이용한 방법보다 인식률이 최대 $15\%$까지 향상됨을 확인하였다.

스펙트럼 변이를 이용한 Soft Decision 기반의 음성향상 기법 (Robust Speech Enhancement Based on Soft Decision Employing Spectral Deviation)

  • 최재훈;장준혁;김남수
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.222-228
    • /
    • 2010
  • 본 논문에서는 비정상적인 배경 잡음 환경에서 음성향상을 위한 신호의 스펙트럼 변이 (Spectral Deviation)을 적용한 Soft Decision 기반의 잡음전력 수정 기법을 제안한다. 기존의 Soft Decision 기반의 잡음전력 추정에 있어서 잡음신호의 정상성(Stationarity)을 가정한 스무딩 파라미터를 사용하여 잡음전력을 추정하고 갱신하였지만, 잡음신호의 주파수적인 특성이 상대적으로 빠르게 변하는 비정상적인 환경에서는 강인하지 못한 단점을 가지게 된다. 본 논문에서는 신호의 스펙트럼 변이를 추정하여 정상적인 잡음 환경과 비정상적인 잡음 환경에 따라 적응적으로 잡음전력을 추정하고 갱신하여 잡음신호에 의해 오염된 음성신호를 향상시킨다. 제안된 알고리즘은 다양한 배경 잡음 환경에서 객관적인 음질측정 방법인 ITU-T P.862 perceptual evaluation of speech quality (PESQ)에 의해서 평가되었으며, 기존의 Soft Decision 기반의 음성 향상 기법과 비교하여 보다 향상된 성능을 보여주었다.

2차 조건 사후 최대 확률 기반 최소값 제어 재귀평균기법을 이용한 음성향상 (Speech Enhancement based on Minima Controlled Recursive Averaging Technique Incorporating Second-order Conditional Maximum a posteriori Criterion)

  • 금종모;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.132-138
    • /
    • 2009
  • 본 논문에서는 기존의 Minima Controlled Recursive Averaging (MCRA)에 2차 조건 사후 최대 확률기법을 적용한 음성 향상 기법을 제안한다. 기존의 MCRA 방법은 현제 프레임의 음성 신호 존재 확률로 잡음 추정을 조정하기 때문에 음성 활동의 프레임간의 상호 연관성을 배제 하였다. 본 논문에서 제안한 알고리즘은 직전 2 프레임에서의 음성의 존재와 부재에 대한 조건을 부여해 주어 현제 프레임의 음성 신호 존재 확률을 수정하는 음성향상 기법을 적용한다. 제안된 2차 조건 사후 최대 확률기법을 적용한 MCRA 방법이 기존의 MCRA 방법보다 향상된 음성향상 결과를 나타내었다.

잔류잡음 감소를 위한 백색화 스펙트럼 차감법 (Spectral Subtraction Usnig Whitening Filter for Reducing Residual Noise)

  • 오태호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.411-414
    • /
    • 1998
  • 음성의 음질 향상(Speech Enhancement)을 위한 여러 가지 방법 중에서 주파수 차감법(Spectral Subtraction)은 계산량이 적기 때문에 현재 실시간으로 Speech Enhancement를 할 수 있는 가장 적절한 방법이다. 그러나, 이 방법은 원래의 입력음성에 없던 새로운 잡음을 만들어내는 큰 단점이 있는데, 이를 제거하기 위해 많은 연구가 되어오고 있다. 이러한 연구의 방향은 대부분 주변프레임 또는 주변의 주파수 성분과의 평균을 통해 피크값을 무디게 해 줌으로써 새로 생긴 튀는 잡음을 감소시키는 것이다. 이런 방법은 음성자체의 정보 또한 평균이 되어버리게 하는 새로운 단점을 낳는데, 이런 현상은 무성음구간에서 특히 심각해진다. 본 논문에서는 입력음성의 LPC 분석으로 백색필터(Whitening Filter)를 구성하여 이를 통과시킨 잔류신호(Residual)를 주파수 차감하여 얻은 새로운 잔류신호를 역 필터링하여(Synthesis Filter) 개선된 음성을 얻는 방법을 제안하였다. 제안된 알고리듬은, 주파수 차감시 포만트(Formant)의 정보가 더 유지 될 수 있기 때문에 잔류잡음을 줄일 수 있다. 청취 테스트 결과 제안한 방법이 기존의 방법보다 잔류잡음을 더 줄이는 사실을 확인할 수 있었다.

  • PDF

Application of Block On-Line Blind Source Separation to Acoustic Echo Cancellation

  • Ngoc, Duong Q.K.;Park, Chul;Nam, Seung-Hyon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제27권1E호
    • /
    • pp.17-24
    • /
    • 2008
  • Blind speech separation (BSS) is well-known as a powerful technique for speech enhancement in many real world environments. In this paper, we propose a new application of BSS - acoustic echo cancellation (AEC) in a car environment. For this purpose, we develop a block-online BSS algorithm which provides robust separation than a batch version in changing environments with moving speakers. Simulation results using real world recordings show that the block-online BSS algorithm is very robust to speaker movement. When combined with AEC, simulation results using real audio recording in a car confirm the expectation that BSS improves double talk detection and echo suppression.

음질향상을 위해 비선형 함수와 사전 음성부재확률을 이용한 최소통계법의 잡음전력편의 보상방법 (Noise-Biased Compensation of Minimum Statistics Method using a Nonlinear Function and A Priori Speech Absence Probability for Speech Enhancement)

  • 이수정;이강성;김순협
    • 한국음향학회지
    • /
    • 제28권1호
    • /
    • pp.77-83
    • /
    • 2009
  • 본 논문에서는 비정상 잡음환경에서 음질향상을 위한 비선형 함수와 사전 음성부재 확률을 이용한 최소 통계치(MS) 방법의 잡음전력편의 보상 방법을 제안한다. 비정상 잡음환경에서 잡음전력추정을 위해 최소 통계치 방법이 잘 알려져 있지만, 예측된 잡음전력 추정 값은 실제 잡음 전력 값보다 하향 편의 되는 특성을 나타낸다. 제안한 방법은 비선형 함수를 적용한 적응보상파라미터와 사전 음성부재 확률 값을 혼용하는 잡음전력편의 보상방법이다. 특히, 적응보상 파라미터는 사후 SNR을 이용한 비 선형함수를 적용하여 잡음수준의 증감에 따라 파라미터 값을 조절한다. 또한, 사전 음성부재확률 값이 1로 수렴할 경우, 적응보상파라미터 값은 각 주파수별로 최대치까지 증가하지만, 확률 값이 0에 가까워지면 반대의 특성을 나타낸다. 제안한 알고리즘의 잡음전력추정 및 음질향상의 성능평가를 위해 다양한 종류의 잡음과 비정상적인 극심한 잡음환경을 설정하여 실험하고, 음질향상을 위해 주파수 차감법과 결합하였다. 알고리즘의 성능은 다양한 잡음환경의 신호 대 잡음비 (SNR)와 Itakura-Saito 음질왜곡 평가법을 이용하여 기존 최소 통계치 (MS)방법에 비해 우수한 결과를 나타냈다.

GMM을 이용한 응급 단어와 비응급 단어의 검출 및 인식 기법 (Detection and Recognition Method for Emergency and Non-emergency Speech by Gaussian Mixture Model)

  • 조영임;이대종
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.254-259
    • /
    • 2011
  • 일반적으로 어떤 순간에 발생할지 모르는 응급 상황을 CCTV의 영상 정보만으로 상황을 항상 모니터링하기에는 인력과 비용의문제점이 발생되고 있다. 본 논문에서는 응급상황을 동적으로 보여주는 CCTV환경에서 감지하기 위해 GMM을 이용한 응급단어와 비응급단어의 검출 및 인식기법을제안하고자 한다. 제안된 방법은 Global GMM 모델에 의해 응급단어와 일반단어를 검출하고 이 모델에 의해 응급단어라 판정된 경우에는 Local GMM 모델에 응급단어 인식을 수행하게 된다. 제안된 방법은 다양한 환경하에서 취득한 응급단어와 일반단어에 대해 적용하여 타당성을 검증하였다.

이동통신 시스템을 위한 음성 부호화기와 결합된 적응 반향제거기에 관한 연구 (Adaptive echo canceller combined with speech coder for mobile communication systems)

  • 이인성;박영남
    • 한국통신학회논문지
    • /
    • 제23권7호
    • /
    • pp.1650-1658
    • /
    • 1998
  • 본 논문에서는 이동통신 시스템의 반향을 제거하기 위해 음성부호화기에서 얻은 음성 분석 정보를 이용하여 반향을 제거하는 방법을 제시하였다. 반향 제거기 적응 알고리즘의 입력 신호로서 기존의 방법인 음성부호화기의 출력 음성신호를 사용하지 않고 음성 부호화기 디코더 과정에서 제공되어지는 여기 신호, 선형 예측 오차 신호를 사용하였다. 모의 실험을 위해 Normalized Least Mean Square(NLMS) 알고리즘을 이용한 적응 반향 제거기를 구성하였고, 기존의 음성신호를 사용하는 반향제거기에 비해 음성 부호화기에서 제공되어지는 음성의 여기 신호 성분을 적응 알고리즘 입력신호로 사용함으로써 40 dB Echo Return Loss Enhancement(ERLE)를 얻는데 걸리는 시간에 있어서 약 4배 정도의 빠른 속도를 얻을 수 있다.

  • PDF