• 제목/요약/키워드: SNR enhancement

검색결과 190건 처리시간 0.029초

2-Layer SNR 계층부호화에서 고급계층에 대한 에러은닉 기법 (An Error Concealment Method for Enhancement Layer in the 2-Layer SNR Layer Coding)

  • 정정균;박성찬;이귀상
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.303-307
    • /
    • 2002
  • 디지털 영상압축 방법인 ITU-T H.263++ 부호화기법 중에는 계층 모드(scalability mode)를 지원한다. 계층 모드는 한 개의 송신 영상에 대해서도 복호기와 전송로에 따라서 여러 가지 화질의 재생 영상을 얻을 수 있게 한다. 계층 모드는 시간적, 공간적, SNR(signal-to-noise ratio)로 나누어진다. 그 중에서 SNR 계층 모드는 고급계층에 따라서 다양한 해상도를 가질 수 있다. 계층부호화에는 크게 기본계층과 고급계층으로 나누어지는데, 기본계층은 QoS를 보장하여, 화질은 떨어지나 에러 없이 영상을 전송하고, 고급계층에서는 기본계층에 해상도 에러에 대한 나머지 정보를 전송한다. 고급계층으로 전송되는 정보는QoS가 보장되지 않으므로 비트에러나, 팻킷 에러가 발생 할 수 있다. 따라서 고급계층에 에러가 발생하게 되고, 에러 전파 현상이 일어난다. 본 논문에서는 단일계층부호화와 2 Layer 계층부호화에서 발생되는 에러의 차이점을 알아보고, 데이터 손실 없는 기본계층과 에러가 발생하는 고급계층에 상관관계를 분석하여, SNR계층부호화에서 맞는 고급계층 에러은닉 기법을 제안한다.

  • PDF

다양한 손실 함수를 이용한 음성 향상 성능 비교 평가 (Performance comparison evaluation of speech enhancement using various loss functions)

  • 황서림;변준;박영철
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.176-182
    • /
    • 2021
  • 본 논문은 다양한 손실 함수에 따른 Deep Nerual Network(DNN) 기반 음성 향상 모델의 성능을 비교 평가한다. 베이스라인 모델로는 음성의 위상 정보를 고려할 수 있는 복소 네트워크를 사용하였다. 손실 함수는 두 가지 유형의 기본 손실 함수, Mean Squared Error(MSE)와 Scale-Invariant Source-to-Noise Ratio(SI-SNR)를 사용하였으며 두 가지 유형의 지각 기반 손실 함수 Perceptual Metric for Speech Quality Evaluation(PMSQE)과 Log Mel Spectra(LMS)를 사용한다. 성능은 각 손실 함수의 다양한 조합을 사용하여 얻은 출력을 객관적인 평가와 청취 테스트를 통해 측정하였다. 실험 결과, 지각기반 손실 함수를 MSE 또는 SI-SNR과 결합하였을 때 전반적으로 성능이 향상되며, 지각기반 손실함수를 사용하면 객관적 지표에서 약세를 보이는 경우라도 청취 테스트에서 우수한 성능을 보임을 확인하였다.

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.

2채널 마이크로폰을 이용한 청각 기기에서의 빔포밍에 대한 객관적 검증 (Objective Evaluation of Beamforming Techniques for Hearing Devices with Two-channel Microphone)

  • 조경원;한종희;홍성화;이상민;김동욱;김인영;김선일
    • 대한의용생체공학회:의공학회지
    • /
    • 제32권3호
    • /
    • pp.198-206
    • /
    • 2011
  • Hearing devices like cochlear implant, vibrant soundbridge, etc. try to offer better sound for people. In hearing devices, several beamformers including conventional directional microphone are applicable to noise reduction. Each beamformer has different directional response and it could change sound intelligibility or quality for listeners. Therefore, we investigated the performance of three beamformers, which are first and second order directional microphone, and broadband beamformer(BBF) with a computer simulation assuming hearing device microphone configuration. We also calculated objective measurements which have been used to evaluate speech enhancement algorithms. In the simulation, a single speech and a single babble noisewere propagated from the front and $135^{\circ}$ azimuth degrees respectively. Microphones were configured in an end-fire array and the spacing was varied in comparison. With 3 cm spacing, BBF had about 3 dB higher enhanced SNR than that of directional microphones. However, enhancement of segmental SNR and frequency weighted segmental SNR were similar between the first order directional microphone and broadband beamformer. In addition when steady state noise was used, broadband beamformer showed the increased performance and had the highest enhanced SNR, and segmental SNR.

근거리 전자장 스캐닝 시스템의 잡음 대 성능 비 향상 기술 (Enhancement Technologies of Signal-to-Noise Ratio in the Near-Field Scanning Systems)

  • 신영산;이성수
    • 전기전자학회논문지
    • /
    • 제22권2호
    • /
    • pp.510-513
    • /
    • 2018
  • 최근 전자파 적합성(EMC: electromagnetic compatibility)의 중요성이 매우 높아짐에 따라 칩 수준에서의 전자파 간섭(EMI: electromagnetic interference) 측정이 자주 요구되고 있다. IEC 61967 및 IEC 62508에서 규정된 근거리 전자장 스캐닝(NFS: near-field scanning) 시스템은 칩 레벨에서의 전자파 간섭을 분석하는 대표적인 방법이다. 칩이 점점 고속화되면서 근거리 전자장 스캐닝 시스템의 측정 주파수는 광대역화되어야 하지만 근거리 전자장 탐침(NFP: near-field probe)의 신호 대 잡음 비(SNR: signal-to-noise ratio)가 저하된다는 문제가 있다. 본 논문에서는 근거리 전자장 스캐닝 시스템에서 광대역 특성을 가지면서도 잡음 대 성능 비를 향상시키는 기술에 대해 살펴본다.

무선링크에서 기본 계층의 반복과 HARQ를 적용한 H.264 SVC의 성능 (Performance of H.264 SVC with Base Layer Repetition and HARQ over Wireless Link)

  • 안성균;한동하;황승훈
    • 한국통신학회논문지
    • /
    • 제37권8A호
    • /
    • pp.689-697
    • /
    • 2012
  • 본 논문은 무선 채널 환경에서 H.264 스케일러블 비디오 코딩으로 부호화된 비디오 데이터의 전송 성능 개선과 신뢰성 향상을 위해 기본계층 반복 전송과 HARQ를 제안하고 그 성능을 확인하고 있다. 제안 방법은 향상계층을 제외하고 기본계층에만 적용되기 때문에, 무선자원의 부족과 전송 지연의 문제들도 해결해 줄 수 있다. 수치 결과 제안 방법은 SNR=3.4dB 기준으로 $1.5{\times}10^{-5}$의 BER 성능을 보였고, 동일 SNR에서 $1.2{\times}10^{-3}$의 성능을 보여 주었다. 또한 실험 영상 결과를 통해서도 제안 방법이 무선 링크에서 SVC 성능을 개선함을 확인하였다.

다해상도 신호해석 방법을 이용한 음성개선 (Speech Enhancement Using Multiresolutional Signal Analysis Methods)

  • 석종원;한미경;배건성
    • 전자공학회논문지S
    • /
    • 제36S권7호
    • /
    • pp.134-135
    • /
    • 1999
  • 본 논문에서는 최근에 널리 연구되고 잇는 다해상도 신호해석 방법인 웨이브렛 변환, 웨이브렛 패킷, 그리고 코사인 패킷 알고리듬을 잡음음성의 음질개선에 이용하여 각각의 성능을 비교하였으며, 또한 이를 기존의 스펙트럼 차감법의 성능과 비교 분석하였다. 성능비교의 척도로는 SNR과 켑스트럼 거리를 이용하였다. 실험결과 SNR면에서는 코사인 패킷이 가장 좋은 결과를 보였고 켑스트럼 거리의 경우 코사인 패킷과 웨이브렛 패킷이 훨씬 나은 결과를 보였다. 주관적인 청취결과 역시 코사인 패킷이 가장 좋은 결과를 보였으며, 기존의 스펙트럼 차감법은 musical noise의 영향으로 인해 상대적으로 다른 방식에 비해 합성음의 음질이 많이 떨어짐을 확인할 수 있었다.

  • PDF

ATSC DTV 수신기에서 피드백을 갖는 트렐리스 복호기 (A recursive trellis decoder using feedback data in ATSC DTV receivers)

  • 오영호;이경원;김대진
    • 방송공학회논문지
    • /
    • 제12권6호
    • /
    • pp.641-648
    • /
    • 2007
  • 최신 ATSC DTV 수신기는 최적의 복호 기술을 사용하고 있어 AWGN에서 TOV를 만족하는 최소 SNR 14.6 dB가 더 이상 줄일 수 없는 최적의 성능으로 여겨지고 있다. 그러나 DTV 수신기에서 샤논 용량을 만족하는 SNR은 11.76 dB로 현재 수신기의 TOV를 만족하는 SNR 14.6dB 사이에 약 2.8dB 간격이 존재한다. 본 논문에서는 샤논 용량에 한 걸음 다가가기 위하여 RS 복호기에서 구한 오류가 없는 데이터를 부궤환시켜 반복적으로 복호하는 트렐리스 복호기를 제안한다. 제안된 복호 방법은 기존의 방법에 비해 AWGN 채널에서 0.8 dB의 이득을 갖는다.

심리음향 특성을 이용한 음성 향상 알고리즘 (A Speech Enhancement Algorithm based on Human Psychoacoustic Property)

  • 전유용;이상민
    • 전기학회논문지
    • /
    • 제59권6호
    • /
    • pp.1120-1125
    • /
    • 2010
  • In the speech system, for example hearing aid as well as speech communication, speech quality is degraded by environmental noise. In this study, to enhance the speech quality which is degraded by environmental speech, we proposed an algorithm to reduce the noise and reinforce the speech. The minima controlled recursive averaging (MCRA) algorithm is used to estimate the noise spectrum and spectral weighting factor is used to reduce the noise. And partial masking effect which is one of the human hearing properties is introduced to reinforce the speech. Then we compared the waveform, spectrogram, Perceptual Evaluation of Speech Quality (PESQ) and segmental Signal to Noise Ratio (segSNR) between original speech, noisy speech, noise reduced speech and enhanced speech by proposed method. As a result, enhanced speech by proposed method is reinforced in high frequency which is degraded by noise, and PESQ, segSNR is enhanced. It means that the speech quality is enhanced.

Binary Mask Criteria Based on Distortion Constraints Induced by a Gain Function for Speech Enhancement

  • Kim, Gibak
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제2권4호
    • /
    • pp.197-202
    • /
    • 2013
  • Large gains in speech intelligibility can be obtained using the SNR-based binary mask approach. This approach retains the time-frequency (T-F) units of the mixture signal, where the target signal is stronger than the interference noise (masker) (e.g., SNR > 0 dB), and removes the T-F units, where the interfering noise is dominant. This paper introduces two alternative binary masks based on the distortion constraints to improve the speech intelligibility. The distortion constraints are induced by a gain function for estimating the short-time spectral amplitude. One binary mask is designed to retain the speech underestimated (T-F) units while removing the speech overestimated (T-F)units. The other binary mask is designed to retain the noise overestimated (T-F) units while removing noise underestimated (T-F) units. Listening tests with oracle binary masks were conducted to assess the potential of the two binary masks in improving the intelligibility. The results suggested that the two binary masks based on distortion constraints can provide large gains in intelligibility when applied to noise-corrupted speech.

  • PDF