• 제목/요약/키워드: Nonlinear speech enhancement

검색결과 12건 처리시간 0.024초

음성 향상을 위한 NPHMM을 갖는 IMM 알고리즘 (IMM Algorithm with NPHMM for Speech Enhancement)

  • 이기용
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.53-66
    • /
    • 2004
  • The nonlinear speech enhancement method with interactive parallel-extended Kalman filter is applied to speech contaminated by additive white noise. To represent the nonlinear and nonstationary nature of speech. we assume that speech is the output of a nonlinear prediction HMM (NPHMM) combining both neural network and HMM. The NPHMM is a nonlinear autoregressive process whose time-varying parameters are controlled by a hidden Markov chain. The simulation results shows that the proposed method offers better performance gains relative to the previous results [6] with slightly increased complexity.

  • PDF

음성 통계 모형에 따른 음성 왜곡량 감소를 위한 비선형 음성강조법 (Nonlinear Speech Enhancement Method for Reducing the Amount of Speech Distortion According to Speech Statistics Model)

  • 최재승
    • 한국전자통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.465-470
    • /
    • 2021
  • 잡음이 존재하는 실제 환경에서 음성인식을 실시하는 경우에 음성인식의 성능 열화 및 음성의 품질이 저화되지 않는 강건한 음성인식 기술이 필요하다. 이러한 음성인식 기술을 개발함으로써 사람의 음성 스펙트럼과 유사한 잡음 환경에서도 안정되고 높은 음성인식률이 실현되는 어플리케이션이 요구된다. 따라서 본 논문에서는 최소 평균 제곱의 오차를 기반으로 한 단시간 스펙트럼 진폭 방법인 MMSA-STSA 추정 알고리즘에 기초한 잡음억압을 처리하는 음성강조 알고리즘을 제안한다. 이 알고리즘은 단일 채널 입력에 기초한 효과적인 비선형 음성강조 알고리즘이며, 높은 잡음억제 성능을 가지고 있으며 음성의 통계적인 모델에 기초하여 음성의 왜곡량을 줄이는 기법이다. 본 실험에서는 MMSA-STSA 추정 알고리즘의 유효성을 확인하기 위하여 입력 음성파형과 출력 음성파형을 비교하여 제안한 알고리즘의 효과를 확인한다.

Least Squares 기반의 Volterra Filter를 이용한 비선형 반향신호 억제기 (Nonlinear Acoustic Echo Suppressor based on Volterra Filter using Least Squares)

  • 박지환;이봉기;장준혁
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.205-209
    • /
    • 2013
  • 기존의 반향신호 억제기는 스피커와 마이크 사이의 선형 관계만을 고려하여, 마이크로 입력된 신호로 부터 반향신호를 억제한다. 하지만 실제적으로 스피커는 비선형성을 가지고 있으며, 이 때문에 기존의 반향신호 억제기는 비선형 반향신호 환경에서 그 성능이 저하된다. 본 논문에서는 스피커의 비선형성을 모델링하기에 적합한 주파수영역상의 Least square 방식의 Volterra filter를 적용한 비선형 반향신호 억제기를 제안하였다. 객관적 성능평가 방법인 Echo Return Loss Enhancement (ERLE)와 Speech Attenuation(SA)를 도입하여 제안된 알고리즘의 성능 검증에 사용하였다. 제안된 알고리즘이 기존의 반향신호 억제기보다 선형 및 비선형 반향 신호 환경에서 우수한 성능을 보이는 것을 확인하였다.

배경잡음하에서의 감음신경성난청과 정상청력자의 어음인지향상 연구 (Effects on the Speech Enhancement Algorithms for Sensorineural Hearing Impairment and Normal Listeners)

  • 김동욱;김인영;윤길원
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1998년도 추계학술대회
    • /
    • pp.171-172
    • /
    • 1998
  • Recent development of digital technology has offered new possibilities for noticeable advances of hearing aids. Using the digital technology, it is possible to equip hearing aids with powerful features such as multi-channel nonlinear compression amplification and the feedback cancellation, these are often difficult to implement with analog circuits. Still, speech in noise is one of the major complaints of not only hearing impaired persons but also normal listeners. This paper describes speech intelligibility in background noise for both normal and hearing impaired listeners. Speech enhancement algorithms were implemented and compared for normal and sensorineural hearing impairment listeners.

  • PDF

Multi-channel Speech Enhancement Using Blind Source Separation and Cross-channel Wiener Filtering

  • Jang, Gil-Jin;Choi, Chang-Kyu;Lee, Yong-Beom;Kim, Jeong-Su;Kim, Sang-Ryong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권2E호
    • /
    • pp.56-67
    • /
    • 2004
  • Despite abundant research outcomes of blind source separation (BSS) in many types of simulated environments, their performances are still not satisfactory to be applied to the real environments. The major obstacle may seem the finite filter length of the assumed mixing model and the nonlinear sensor noises. This paper presents a two-step speech enhancement method with multiple microphone inputs. The first step performs a frequency-domain BSS algorithm to produce multiple outputs without any prior knowledge of the mixed source signals. The second step further removes the remaining cross-channel interference by a spectral cancellation approach using a probabilistic source absence/presence detection technique. The desired primary source is detected every frame of the signal, and the secondary source is estimated in the power spectral domain using the other BSS output as a reference interfering source. Then the estimated secondary source is subtracted to reduce the cross-channel interference. Our experimental results show good separation enhancement performances on the real recordings of speech and music signals compared to the conventional BSS methods.

Split Model Speech Analysis Techniques for Speech Signal Enhancement

  • Park, Young-Ho;You, Kwang-Bock;Bae, Myung-Jin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.1135-1138
    • /
    • 1999
  • In this paper, The Split Model Analysis Algorithm, which can generate the wideband speech signal from the spectral information of narrowband signal, is developed. The Split Model Analysis Algorithm deals with the separation of the 10$\^$th/ order LPC model into five cascade-connected 2$\^$nd/ order model. The use of the less complex 2$\^$nd/ order models allows for the exclusion of the complicated nonlinear relationships between model parameters and all the poles of the LPC model. The relationships between the model parameters and its corresponding analog poles is proved and applied to each 2$\^$nd/ order model. The wideband speech signal is obtained by changing only the sampling rate.

  • PDF

음질향상을 위해 비선형 함수와 사전 음성부재확률을 이용한 최소통계법의 잡음전력편의 보상방법 (Noise-Biased Compensation of Minimum Statistics Method using a Nonlinear Function and A Priori Speech Absence Probability for Speech Enhancement)

  • 이수정;이강성;김순협
    • 한국음향학회지
    • /
    • 제28권1호
    • /
    • pp.77-83
    • /
    • 2009
  • 본 논문에서는 비정상 잡음환경에서 음질향상을 위한 비선형 함수와 사전 음성부재 확률을 이용한 최소 통계치(MS) 방법의 잡음전력편의 보상 방법을 제안한다. 비정상 잡음환경에서 잡음전력추정을 위해 최소 통계치 방법이 잘 알려져 있지만, 예측된 잡음전력 추정 값은 실제 잡음 전력 값보다 하향 편의 되는 특성을 나타낸다. 제안한 방법은 비선형 함수를 적용한 적응보상파라미터와 사전 음성부재 확률 값을 혼용하는 잡음전력편의 보상방법이다. 특히, 적응보상 파라미터는 사후 SNR을 이용한 비 선형함수를 적용하여 잡음수준의 증감에 따라 파라미터 값을 조절한다. 또한, 사전 음성부재확률 값이 1로 수렴할 경우, 적응보상파라미터 값은 각 주파수별로 최대치까지 증가하지만, 확률 값이 0에 가까워지면 반대의 특성을 나타낸다. 제안한 알고리즘의 잡음전력추정 및 음질향상의 성능평가를 위해 다양한 종류의 잡음과 비정상적인 극심한 잡음환경을 설정하여 실험하고, 음질향상을 위해 주파수 차감법과 결합하였다. 알고리즘의 성능은 다양한 잡음환경의 신호 대 잡음비 (SNR)와 Itakura-Saito 음질왜곡 평가법을 이용하여 기존 최소 통계치 (MS)방법에 비해 우수한 결과를 나타냈다.

잡음 환경에서 압신을 이용한 인공 와우 환자의 언어 인지 향상 시뮬레이션 연구 (A simulation study of speech perception enhancement for cochlear implant patients using companding in noisy environment)

  • 이영우;지윤상;이종실;김인영;김선일;홍성화;이상민
    • 대한전자공학회논문지SP
    • /
    • 제43권5호
    • /
    • pp.79-87
    • /
    • 2006
  • 본 연구에서 인공 와우 환자의 잡음 상황에서 음성 신호 강조와 잡음 제거를 위한 전 처리로서 companding strategy를 적용하고 이를 평가하였다. Companding은 인간의 청각 특성인 two tone suppression에 기반하며 이는 음성 스펙트럼 피크를 강화하고 배경 잡음을 감소시킨다. 하지만 companding은 잡음 제거와 스펙트럼 피크의 강화에 효과적인 반면, 제한된 채널의 수와 비선형 블록으로 인한 음성 정보 손실의 교환 특성을 가진다. 따라서 본 연구에서는 잡음 제거와 음성 정보 손실의 정도가 상대적인 두 companding 구조를 설계하여 개인마다 잡음 상황에서 언어 인지 특성차이에 따른 적절한 필터 뱅크를 도출하였으며, 낮은 신호 대 잡음 비 환경에서 인공 와우 환자의 언어 인지 향상을 위한 방법을 제시하였다. 제안된 알고리즘은 잡음 밴드 시뮬레이션을 이용하여 정상인 5명에게 평가되었다. 모든 피실험자에게서 효과적인 언어 인지의 향상이 관측되었고, 각 피실험자가 선호하는 필터 뱅크는 다르게 나타났다.

선형 위상 특성을 갖는 적응 마이크로폰 어레이 (An Adaptive Microphone Array with Linear Phase Response)

  • 강홍구;윤대희;차일환
    • 한국음향학회지
    • /
    • 제11권3호
    • /
    • pp.53-60
    • /
    • 1992
  • 원거리 회의나 대강당 등의 회의에서 주변의 간섭 잡음을 제거하고 정해진 발언자의 음성 신호를 얻기 위하여 적응 빔 형성 기법을 이용한 방법이 연구되어 왔다. 음성 신호에 이용되는 적응 빔 기법은 레이더, 소나, 지진파 신호의 경우와는 달리 어느 정도 왜곡이 있더라도 출력 신호가 인간의 청각 특성에 적합해야 한다. Sondhi는 인간의 귀가 음성 신호의 위상에는 민감하지 않다는 성질을 이용하여 음성의 크기에 약한 제한 조건을 갖는 cost 함수를 정의하고, 이를 gradient 탐색 알고리즘을 사용하여 최적화된 필터계수를 구했다. 본 논문에서는 Sondhi가 제안한 빔 형성기의 위상 왜곡에 따른 음절 저하를 극복하기 위해 원하는 신호 방향에 대해서 선형 위상 응답 특성을 갖는 빔 형성기를 제안하였으며, 실제로 시스템을 구현할 경우 효과적으로 이용할 수 있는 샘플 처리 알고리듬을 제안하였다. 제안된 알고리듬의 성능 평가를 위하여 컴퓨터 시뮬레이션을 수행하였다.

  • PDF