• 제목/요약/키워드: Log MMSE

검색결과 15건 처리시간 0.023초

보청기를 위한 IMCRA 기반 저연산 음성 향상 알고리즘 (Low-Complexity Speech Enhancement Algorithm Based on IMCRA Algorithm for Hearing Aids)

  • 전유용;이상민
    • 재활복지공학회논문지
    • /
    • 제11권4호
    • /
    • pp.363-370
    • /
    • 2017
  • 본 논문에서는 향상된 최소값 제어 재귀 평균 (improved minima controlled recursive averaging, IMCRA) 알고리즘과 로그 최소값 평균 제곱 오차 (log minimum mean square error, logMMSE)를 기반으로 한 저연산 음성 향상 알고리즘을 제안한다. IMCRA 알고리즘은 버퍼를 이용하여 일정 구간에서 입력 신호 전력의 최소값을 추적하고 최소값과 입력 신호의 비율을 통해 음성 존재를 확인한다. 이러한 과정에서 많은 연산이 필요하며 연산량을 줄이기 위해서 음성 존재 확률을 기반으로한 주파수 밴드별 시변 스무딩으로 최소값을 추적한다. 제안된 알고리즘은 0dB, 5dB, 10dB 그리고 15dB 신호 대 잡음비에서 평균 2.778%, 3.481%, 2.980% 그리고 2.162% 음성 품질이 향상되었으며, 평균 9.570% 연산량이 감소한 것을 확인하였다.

주파수 영역 MMSE 등화방식 기반의 SC-FDMA 시스템을 위한 개선된 LLR 생성 기법 (An Improved LLR Generation Technique for SC-FDMA Systems Using Frequency Domain MMSE Equalization)

  • 김진민;임태호;김재권;이주현;조용수
    • 한국통신학회논문지
    • /
    • 제34권12C호
    • /
    • pp.1197-1207
    • /
    • 2009
  • Orthogonal Frequency Multiple Access (OFDMA) 방식은 차세대 이동통신을 위한 다중접속 방식으로 널리 고려되고 있으나 Peak-to-Average Power Ratio (PAPR)이 높다는 단점이 있다. 따라서, 송신전력에 민감한 상향링크에서는 PAPR이 낮은 Single Carrier Frequency Division Multiple Access (SC-FDMA) 방식이 OFDMA 방식보다 더 적합한 것으로 여겨지고 있다. 본 논문에서는 주파수 영역 MMSE 등화방식을 기반으로 한 SC-FDMA 시스템의 성능향상 기법을 제안한다. 제안된 기법은 채널의 다이버시티 특성과 수신신호로부터 얻는 쌍방향성 특성을 활용하여 채널복호기의 입력이 되는 Log-likelihood Ratio (LLR) 의 신뢰도를 향상시키는 방식이다. 본 논문에서는 제안된 방식에 의해 추가적으로 증가하는 복잡도를 분석하고, 이에 따른 성능이득을 모의실험을 통해 검증한다.

잡음음성 음향모델 적응에 기반한 잡음에 강인한 음성인식 (Noise Robust Speech Recognition Based on Noisy Speech Acoustic Model Adaptation)

  • 정용주
    • 말소리와 음성과학
    • /
    • 제6권2호
    • /
    • pp.29-34
    • /
    • 2014
  • In the Vector Taylor Series (VTS)-based noisy speech recognition methods, Hidden Markov Models (HMM) are usually trained with clean speech. However, better performance is expected by training the HMM with noisy speech. In a previous study, we could find that Minimum Mean Square Error (MMSE) estimation of the training noisy speech in the log-spectrum domain produce improved recognition results, but since the proposed algorithm was done in the log-spectrum domain, it could not be used for the HMM adaptation. In this paper, we modify the previous algorithm to derive a novel mathematical relation between test and training noisy speech in the cepstrum domain and the mean and covariance of the Multi-condition TRaining (MTR) trained noisy speech HMM are adapted. In the noisy speech recognition experiments on the Aurora 2 database, the proposed method produced 10.6% of relative improvement in Word Error Rates (WERs) over the MTR method while the previous MMSE estimation of the training noisy speech produced 4.3% of relative improvement, which shows the superiority of the proposed method.

위상 정보를 고려한 로그멜 영역에서의 2단계 선험 SNR 추정 (Two-step a priori SNR Estimation in the Log-mel Domain Considering Phase Information)

  • 이윤경;권오욱
    • 말소리와 음성과학
    • /
    • 제3권1호
    • /
    • pp.87-94
    • /
    • 2011
  • The decision directed (DD) approach is widely used to determine a priori SNR from noisy speech signals. In conventional speech enhancement systems with a DD approach, a priori SNR is estimated by using only the magnitude components and consequently follows a posteriori SNR with one frame delay. We propose a phase-dependent two-step a priori SNR estimator based on the minimum mean square error (MMSE) in the log-mel spectral domain so that we can consider both magnitude and phase information, and it can overcome the performance degradation caused by one frame delay. From the experimental results, the proposed estimator is shown to improve the output SNR of enhanced speech signals by 2.3 dB compared to the conventional DD approach-based system.

  • PDF

Speech Enhancement Using Phase-Dependent A Priori SNR Estimator in Log-Mel Spectral Domain

  • Lee, Yun-Kyung;Park, Jeon Gue;Lee, Yun Keun;Kwon, Oh-Wook
    • ETRI Journal
    • /
    • 제36권5호
    • /
    • pp.721-729
    • /
    • 2014
  • We propose a novel phase-based method for single-channel speech enhancement to extract and enhance the desired signals in noisy environments by utilizing the phase information. In the method, a phase-dependent a priori signal-to-noise ratio (SNR) is estimated in the log-mel spectral domain to utilize both the magnitude and phase information of input speech signals. The phase-dependent estimator is incorporated into the conventional magnitude-based decision-directed approach that recursively computes the a priori SNR from noisy speech. Additionally, we reduce the performance degradation owing to the one-frame delay of the estimated phase-dependent a priori SNR by using a minimum mean square error (MMSE)-based and maximum a posteriori (MAP)-based estimator. In our speech enhancement experiments, the proposed phase-dependent a priori SNR estimator is shown to improve the output SNR by 2.6 dB for both the MMSE-based and MAP-based estimator cases as compared to a conventional magnitude-based estimator.

공간다중화 MIMO 시스템을 위한 효율적 계산량의 신호검출 기법 (A Computationally Efficient Signal Detection Method for Spatially Multiplexed MIMO Systems)

  • 임태호;김재권;이주현;윤상보;조용수
    • 한국통신학회논문지
    • /
    • 제32권7C호
    • /
    • pp.616-626
    • /
    • 2007
  • 무선통신 채널에서 높은 전송 속도를 가능하게 하는 공간다중화 MIMO 시스템 수신부에서 다중화된 신호를 검출하는 것은 어려운 작업이며, 최근 다양한 신호검출 기법들이 개발되어졌다. 다양한 신호검출 기법 중 maximum likelihood detection with QR decomposition and M-algorithm (QRM-MLD), sphere decoding (SD)과 같은 기존 기법들은 maximum likelihood (ML)기법과 유사한 성능을 가진 것으로 보고되었다. 본 논문에서는 ML 기법과 거의 동일한 성능을 가지면서 낮은 연산복잡도를 보이는 새로운 신호검출 기법을 제안한다. 모의실험을 통하여 제안된 기법은 ML 기법과 거의 동일한 성능을 보이면서 MMSE-OSIC와 유사한 연산복잡도를 가지는 것을 보인다. 또한 기존의 QRM-MLD, SD 기법들의 경우 hard decision 후 추가적인 연산을 통해 soft decision을 위한 log likelihood ratio(LLR) 값을 생성하는 반면, 제안된 기법에서는 추가적인 연산 없이 LLR 값을 성공적으로 생성할 수 있음을 보인다.

자동 음성 인식기를 위한 단채널 음질 향상 알고리즘의 성능 분석 (Performance Analysis of a Class of Single Channel Speech Enhancement Algorithms for Automatic Speech Recognition)

  • 송명석;이창헌;이석필;강홍구
    • The Journal of the Acoustical Society of Korea
    • /
    • 제29권2E호
    • /
    • pp.86-99
    • /
    • 2010
  • This paper analyzes the performance of various single channel speech enhancement algorithms when they are applied to automatic speech recognition (ASR) systems as a preprocessor. The functional modules of speech enhancement systems are first divided into four major modules such as a gain estimator, a noise power spectrum estimator, a priori signal to noise ratio (SNR) estimator, and a speech absence probability (SAP) estimator. We investigate the relationship between speech recognition accuracy and the roles of each module. Simulation results show that the Wiener filter outperforms other gain functions such as minimum mean square error-short time spectral amplitude (MMSE-STSA) and minimum mean square error-log spectral amplitude (MMSE-LSA) estimators when a perfect noise estimator is applied. When the performance of the noise estimator degrades, however, MMSE methods including the decision directed module to estimate a priori SNR and the SAP estimation module helps to improve the performance of the enhancement algorithm for speech recognition systems.

SNR 기반 가중 KL 거리를 활용한 화자 변화 검증에 관한 연구 (The Study on Speaker Change Verification Using SNR based weighted KL distance)

  • 조준범;이지은;이경록
    • 융합정보논문지
    • /
    • 제7권6호
    • /
    • pp.159-166
    • /
    • 2017
  • 본 논문에서는 방송 뉴스에서 화자 변화 검증 성능 향상을 위해서 입력소음음성 향상과 SNR(Signal to Noise Ratio)기반 가중 함수 $w_m$를 적용한 KL 거리 $D_s$를 실험하였다. GMM-UBM(Gaussian Mixture Model-Universal Background Model) 기반 KL(Kullback Leibler) 거리 D를 이용한 화자 변화 검증 시스템(실험 0)을 기본 시스템으로 한다. 실험 1은 실험 0의 입력소음음성 향상을 위해 MMSE Log-STSA(Minimum Mean Square Error Log-Spectral Amplitude Estimator)를 적용하였다. 실험 2는 실험 1의 기존 KL거리 D 대신에 $D_s$를 적용하였다. 실험 데이터베이스는 다양한 소음을 반영하기 위해 스포츠 뉴스와 실외 인터뷰를 중심으로 구축하였다. 실험은 화자 변화 정보의 누락을 막기 위해 MDR(Missed Detection Rate) 0%를 기준으로 하였다. 실험 0은 FAR(False Alarm Rate) 71.5%의 성능을 보였다. 실험 1은 FAR 67.3%로 실험0에 비해 4.2% 향상되었고, 실험 2는 FAR 60.7%로 10.8% 향상되었다.

셀룰러 네트워크상의 D2D 통신 시스템에서 간섭 억제 및 제거를 위한 연판정 기반 향상된 수신기 (Soft Decision based Advanced Receiver to Suppress and Cancel the Interference in D2D Communication Underlaying Cellular Network)

  • 문상미;추명훈;김한종;김대진;김철성;황인태
    • 전자공학회논문지
    • /
    • 제52권12호
    • /
    • pp.10-21
    • /
    • 2015
  • 셀룰러 네트워크에서 기지국의 과부하를 줄이고 주파수 부족 현상을 완화시킬 수 있는 D2D(Device-to-Device) 통신에 대한 연구가 활발히 진행되고 있다. 하지만 셀룰러 네트워크의 상향링크 주파수 자원을 공유함으로써 상호간의 간섭은 증가하게 된다. 본 논문에서는 셀룰러와 D2D 사이의 간섭을 줄이기 위하여 연판정 기반의 향상된 수신기를 제안한다. 제안한 수신기는 MMSE (Minimum Mean Square Error) 또는 IRC (Interference Rejection Combing) 수신기를 통해 간섭 신호의 불편 추정 (unbiased estimation) 값을 계산 하고 간섭 신호를 억제 및 제거한다. 간섭 신호는 LLR (Log-Likelihood Ratio)로 표현되는 소프트 정보를 통해 업데이트 한다. 시스템 레벨 시뮬레이션은 3GPP LTE-A 시스템의 20MHz 대역을 기반으로 이루어 졌으며, 시뮬레이션 결과 제안한 수신기를 통해 기존 수신기보다 SINR, 전송률 및 스펙트럼 효율 측면에서 성능 향상을 가져다주는 것을 확인하였다.

백홀 시스템에서 시스템 레벨 시뮬레이션 기반 하이브리드 수신기 설계 및 성능 분석 (Design and Performance Analysis of Hybrid Receiver based on System Level Simulation in Backhaul System)

  • 문상미;추명훈;김한종;김대진;황인태
    • 전자공학회논문지
    • /
    • 제52권11호
    • /
    • pp.3-11
    • /
    • 2015
  • 폭발적으로 증가하고 있는 모바일 데이터 트래픽을 수용하기 위하여 셀 간 간섭을 제어할 수 있는 향상된 수신기에 대한 연구가 필요하다. 이를 위해 3GPP(3rd Generation Partnership Project) 에서는 인접 셀의 간섭 신호를 억제 및 제거하여 수신기의 SINR(Signal-to-Noise-plus-Interference Ratio)을 향상시켜 수신 성능을 올리는 NAICS(Network Assisted Interference Cancellation and Suppression)가 표준에서 논의되고 있다. 본 논문에서는 이웃셀로 부터 간섭의 영향을 줄이기 위하여 연판정 기반의 향상된 수신기를 제안한다. 제안한 수신기는 MMSE (Minimum Mean Square Error) 또는 IRC (Interference Rejection Combing) 수신기를 통해 간섭 신호의 불편 추정 (unbiased estimation) 값을 계산 하고 간섭 신호를 억제 및 제거한다. 간섭 신호는 LLR (Log-Likelihood Ratio)로 표현되는 소프트 정보를 통해 업데이트 한다. 시스템 레벨 시뮬레이션은 3GPP LTE-Advanced 하향링크 시스템의 20MHz 대역을 기반으로 이루어 졌으며, 시뮬레이션 결과 제안한 수신기를 통해 기존 수신기보다 SINR, 전송률 및 스펙트럼 효율 측면에서 성능 향상을 가져다주는 것을 확인하였다.