초록
본 논문에서는 비정상 잡음환경에서 음질향상을 위한 비선형 함수와 사전 음성부재 확률을 이용한 최소 통계치(MS) 방법의 잡음전력편의 보상 방법을 제안한다. 비정상 잡음환경에서 잡음전력추정을 위해 최소 통계치 방법이 잘 알려져 있지만, 예측된 잡음전력 추정 값은 실제 잡음 전력 값보다 하향 편의 되는 특성을 나타낸다. 제안한 방법은 비선형 함수를 적용한 적응보상파라미터와 사전 음성부재 확률 값을 혼용하는 잡음전력편의 보상방법이다. 특히, 적응보상 파라미터는 사후 SNR을 이용한 비 선형함수를 적용하여 잡음수준의 증감에 따라 파라미터 값을 조절한다. 또한, 사전 음성부재확률 값이 1로 수렴할 경우, 적응보상파라미터 값은 각 주파수별로 최대치까지 증가하지만, 확률 값이 0에 가까워지면 반대의 특성을 나타낸다. 제안한 알고리즘의 잡음전력추정 및 음질향상의 성능평가를 위해 다양한 종류의 잡음과 비정상적인 극심한 잡음환경을 설정하여 실험하고, 음질향상을 위해 주파수 차감법과 결합하였다. 알고리즘의 성능은 다양한 잡음환경의 신호 대 잡음비 (SNR)와 Itakura-Saito 음질왜곡 평가법을 이용하여 기존 최소 통계치 (MS)방법에 비해 우수한 결과를 나타냈다.
This paper proposes a new noise-biased compensation of minimum statistics(MS) method using a nonlinear function and a priori speech absence probability(SAP) for speech enhancement in non-stationary noisy environments. The minimum statistics(MS) method is well known technique for noise power estimation in non-stationary noisy environments. It tends to bias the noise estimate below that of true noise level. The proposed method is combined with an adaptive parameter based on a sigmoid function and a priori speech absence probability (SAP) for biased compensation. Specifically. we apply the adaptive parameter according to the a posteriori SNR. In addition, when the a priori SAP equals unity, the adaptive biased compensation factor separately increases ${\delta}_{max}$ each frequency bin, and vice versa. We evaluate the estimation of noise power capability in highly non-stationary and various noise environments, the improvement in the segmental signal-to-noise ratio (SNR), and the Itakura-Saito Distortion Measure (ISDM) integrated into a spectral subtraction (SS). The results shows that our proposed method is superior to the conventional MS approach.