• 제목/요약/키워드: PESQ

검색결과 84건 처리시간 0.029초

HMM 기반의 한국어 합성음에 대한 PESQ 및 MOS 평가의 상관도 분석 (Correlation Analysis of PESQ and MOS Evaluation for HMM-based Synthetic Korean Speech)

  • 임창송;배건성
    • 말소리와 음성과학
    • /
    • 제2권1호
    • /
    • pp.71-75
    • /
    • 2010
  • The PESQ is an objective speech quality evaluation measure that is known to have a high correlation with a subjective speech quality measure such as MOS. To examine whether it could be useful as an objective quality measure of synthetic speech, we carried out both subjective evaluation tests with MOS and DMOS and an objective evaluation test with PESQ for HMM-based Korean synthetic speech signals and analyzed the correlation between them. Experimental results have shown that the PESQ has correlations of 0.87 with MOS and 0.92 with DMOS. It means that the PESQ holds much promise for evaluating the quality of synthetic Korean speech.

  • PDF

FDBM의 음원분리 성능평가 (Evaluation of a signal segregation by FDBM)

  • 이채봉
    • 한국전자통신학회논문지
    • /
    • 제8권12호
    • /
    • pp.1793-1802
    • /
    • 2013
  • 음원분리 방법으로는 여러 가지가 제안되고 있으나 그 중에서도 주파수영역 두 귀 모델(Frequency Domain Binaural Model : FDBM)은 저 연산량과 울림 제거에 효과적이다. FDBM에 의한 두 귀 보청 시스템은 SNR이나 기여도 함수(Coherence function)에 의한 평가로 하기 때문에 인간의 청취특성을 고려하지 않고 있다. 본 논문에서는 음질의 문제 해결을 위하여 FDBM의 음원분리 성능평가를 하였다. SNR, 기여도 함수, PESQ의 세 가지 수법을 이용하여 기본 특성에 대하여 시뮬레이션을 통하여 확인하였다. 모든 결과가 FDBM에 의해 좌우 채널간 평가치의 차가 작게 되었고, 좌우 채널이 거의 같은 레벨까지 개선되었음을 확인하였다. 그리고 음원방향을 바꾸고 음원 수를 증가시킨 경우에도 일정한 개선이 보였다. SNR과 기여도 함수, PESQ의 결과를 비교하면 PESQ의 평가에서는 입력 SNR를 변동시킨 경우에도 거의 모든 조건에서 분리에 의한 평가가 개선되었다.

모바일 VoIP 음성통신을 위한 대화음질 측정 시스템 (Conversational Quality Measurement System for Mobile VoIP Speech Communication)

  • 조재만;김형국
    • 한국ITS학회 논문지
    • /
    • 제10권4호
    • /
    • pp.71-77
    • /
    • 2011
  • 본 논문에서는 고품질 모바일 VoIP 음성통신에 대한 객관적인 QoS를 제공하는 대화음질 측정시스템을 구현하였다. 대화음질 측정을 위해서 VoIP로 연결된 두 대의 스마트폰에 에코 및 잡음 제거, 음성 인코딩 및 디코딩, RTP (Real-TimeProtocol)을 적용한 패킷 생성, 지터버퍼 콘트롤, LC (Loss Concealment)를 포함한 POS (Play-out Schedule)로 구성된 VoIP음성 통화시스템을 구현하였다. 대화음질 측정 시스템은 VoIP로 연결된 두 스마트폰의 마이크, 그리고 스피커와 연결되어 각 화자별로 음성신호를 녹음한 후에, 녹음된 음성신호를 이용하여 CE (Conversational Efficiency), CS (Conversational Symmetry) 및 PESQ (Perceptual Evaluation of Speech Quality)를 측정하고, CE-CS-PESQ에 대한 상관관계를 측정한다. 본 논문에서는 다양한 SNR, IP 네트워크망 변동에 따른 지연, 손실 변화에 따른 CE, CS, PESQ를 측정하여 대화음질 측정시스템을 검증하였다.

네트워크 시뮬레이터를 이용한 PESQ 기반 VoIP QoS 보장 네트워크 조건 모델링 (VoIP QoS Network Modeling using Network Simulator)

  • 김선미;김종성;안석환
    • 한국정보전자통신기술학회논문지
    • /
    • 제5권3호
    • /
    • pp.110-116
    • /
    • 2012
  • 인터넷이 급속도로 발달함에 따라 기존의 PSTN 망과 최근에 널리 보급되고 있는 인터넷 망의 연계를 통해 VoIP 서비스가 제공되고 있다. 또한, 인터넷 망을 통한 VoIP의 보급으로 인해 서비스 품질에 대한 관심이 증가하고 있다. 기존에는 주로 제공업체의 관점에서 서비스 품질 개선을 위해서 연구가 진행되었으나, 최근에는 소비자들의 관심이 증가함에 따라 서비스 제공업체가 소비자들에게 제시할 수 있는 객관적인 기준이 필요하게 되었다. 본 논문에서는 서비스 품질 파라미터인 PESQ를 기준으로 분석을 하였다. 마지막으로 현재 한국정보통신기술협회에서 이상적인 지표로 제시한 데이터와 실제 측정을 통한 데이터의 비교 분석을 통해서 실험의 유의성을 검증하고, 최종적으로 통화품질 조건 모델링을 제시한다.

빔포밍 및 DOA 기반의 마스킹을 이용한 2채널 잡음제거 (Two-Channel Noise Reduction Using Beamforming and DOA-Based Masking)

  • 김영일;정상배
    • 한국정보통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.32-40
    • /
    • 2013
  • 본 논문에서는 빔포밍과 입사각분석 기반 마스킹을 이용한 다채널 음성개선 알고리즘이 제안된다. 제안된 알고리즘에서는 LCMV 빔포밍을 수행한 후에 입사각 분석을 이용한 멜-주파수 위너필터가 적용되어 잔존하는 잡음을 제거한다. 성능 향상을 위해서 빔포밍의 적응 필터 학습률과 목표 음성 스펙트럼 검출을 위한 입사각 임계치가 최적화된다. 성능 지수로서 PESQ와 출력 SNR이 측정되었으며 실험 결과 제안한 알고리즘이 종전의 최소분산 빔포밍 기법보다 PESQ 관점에서 0.09, 출력 SNR 관점에서 5.75 dB의 성능 향상시킴을 알 수 있었다.

인지 모델과 웨이블릿 패킷 변환을 이용한 잡음 제거기 설계 (Design of the Noise Suppressor Using the Perceptual Model and Wavelet Packet Transform)

  • 김미선;박서영;김영주;이인성
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.325-332
    • /
    • 2006
  • 본 논문은 인지 모델과 웨이블릿 패킷 변환을 이용하여 단일 채널에서 유색잡음 또는 비정지적 성격의 잡음을 제거하는데 목적을 두고 있다. 이러한 잡음은 부대역을 나누어 접근해야하며, 잔여잡음과 음성의 왜곡으로 인한 문제를 해결하기 위해 웨이블릿 패킷 변환 후 웨이블릿 계수 문턱값을 적절히 개선해야 한다. 본 논문에서 부대역은 웨이블릿 패킷변환 후에 스케일과 임계대역을 매칭하여 설계하였으며, 웨이블릿 계수 문턱값은 세그멘탈 신호대잡음비 (seg_SNR)와 노이즈마스킹 임계값 (Noise Masking Threshold W)을 이용하여 적응적으로 계산했다. 결과적으로 TTA 표준인 EVRC 잡음 제거기와 유사한 성능을 가졌으며, 웨이블릿 변환 후 웨이블릿 계수에 Universal 문턱값을 적용하는 것보다 PESQ-MOS 값이 0.29 높았다. 인코딩과 디코딩 후 PESQ-MOS 값은 EVRC 잡음 제거기보다 0.23 정도 우수한 성능을 가졌다.

다중 주파수 밴드 간섭함수와 스펙트럼 차감법을 이용한 음성 향상 시스템 (Speech enhancement system using the multi-band coherence function and spectral subtraction method)

  • 오인규;이인성
    • 한국음향학회지
    • /
    • 제38권4호
    • /
    • pp.406-413
    • /
    • 2019
  • 본 논문은 두 개의 마이크로폰 환경에서 다중 주파수 대역 이득함수와 주파수 차감법을 결합하여 배경잡음을 억제하는 방법을 제안하였다. 다중 주파수 대역 신호대잡음비 추정을 통해 이득 함수를 얻는 음성 향상 방법은 두 채널 간 잡음신호의 상관성이 큰 경우 잡음 제거 성능이 떨어지는 단점을 가지고 있다. 하나의 채널 에서 스펙트럼 차감법을 통해 얻은 이득함수와 간섭함수 기반의 신호대잡음비 추정을 통해서 얻은 이득함수를 결합하여 가중된 이득함수를 사용하는 음성 향상 방법을 제안하였다. 제안된 방법은 ITU-T(International Telecommunications Union Telecommunication)의 객관적인 품질 평가 방법인 PESQ(Perceptual Evaluation of Speech Quality) 시험과 스펙트로그램을 사용하여 성능 평가 되어졌고 PESQ시험에서 최대 MOS 0.217의 음질 향상을 얻을 수 있었다.

난청인의 난청 정도에 따른 비대칭 청각 필터 구현의 객관적 평가 (An Objective Estimation for Simulating of Asymmetrical Auditory Filter of the Hearing Impaired According to Hearing Loss Degree)

  • 주상익;전유용;송영록;이상민
    • 재활복지공학회논문지
    • /
    • 제3권1호
    • /
    • pp.27-34
    • /
    • 2009
  • 난청인의 청력 손실은 개인별로 다양하므로 기존의 대칭적으로 주파수 밴드별 청각 필터를 구현하는 방법은 다양한 형태의 난청인의 청력 손실을 적절하게 모사해주지 못한다. 각 중심주파수와 음성의 입력크기에 따라 청각 필터의 형태가 비대칭적으로 바뀌고 청력손실이 있는 난청인은 청력 손실에 따라 청각필터의 형태가 정상인들과는 다른 형태로 바뀌게 되며 음질에도 차이가 있다. 본 연구에서는 난청인의 난청 정도에 따라 변하는 비대칭 청각 특성을 잘 반영한 청각필터를 구현하여 몇 가지 실험을 통해 각 구현된 청각 필터의 성능을 객관적으로 평가하였다. 실험은 구현된 청각 필터를 통한 음성의 perceptual evaluation of speech quality (PESQ) 와 log likelihood ratio (LLR)를 사용하였으며 그 값을 통해 처리된 음성의 객관적인 음질과 왜곡정도를 평가 하였다. 청력 손실을 주었을 때 대칭과 비대칭 청각 필터사이의 PESQ 와 LLR 값을 실험해 본 결과 청각 필터 간의 큰 차이를 보였다. 위 실험 결과들로 대칭과 비대칭 청각 필터의 형태에 따라서 음성의 음질에 영향을 받는다는 것을 알 수 있었다. 특히, 난청이 있을 때 중심 주파수별 청각 필터의 비대칭적 형태 변화가 난청인이 받아들이는 음질에 영향이 있었다.

  • PDF

G.729 코덱의 패킷 손실 영향 모델을 이용한 비 침입적 음질 예측 기법 (Non-Intrusive Speech Quality Estimation of G.729 Codec using a Packet Loss Effect Model)

  • 이민기;강홍구
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.157-166
    • /
    • 2013
  • 본 논문은 패킷 손실의 영향을 이용한 비 침입적 음질 평가 방법을 제안한다. 패킷 손실은 패킷 기반의 통신 시스템에서 음질을 저하시키는 주된 요소이며 그 영향은 코덱에 내장된 패킷 손실 은닉 알고리듬에 의해 결정된다. 패킷 손실 영향을 반영한 음질평가 시스템을 위해 VoIP 에서 협대역 코덱으로 사용되는 코덱 중 하나인 G.729를 선택하였으며, 음성 특징에 따른 패킷 손실 영향을 구분하기 위해서 G.729 코덱의 음성 파라미터를 이용한 한 음성 특성 분류기를 설계하였다. 이후, 각각의 패킷 특성에 따른 음질 저하의 정도를 수치화하기 위해 원 PESQ-LQ점수와 상관계수를 최대화하는 음질 저하 가중치를 반복적으로 구하였으며, 최종 음질 저하는 가중합으로 구하였다. 그 결과 제안한 모델과 PESQ-LQ의 상관계수는 칩입 모델 에서는 0.8950를, 비 침입 모델 에서는 0.8911의 결과를 나타내었다.

전역 음성 부재 확률 기반의 향상된 최소값 제어 재귀평균기법을 이용한 음성 향상 기법 (Speech Enhancement Based on Improved Minima Controlled Recursive Averaging Incorporating GSAP)

  • 송지현;방동혁;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.104-111
    • /
    • 2012
  • 본 논문에서는 향상된 최소값 제어 재귀 평균 기법 (improved minima controlled recursive averaging, IMCRA) 알고리즘의 잡음 전력 추정성능을 향상 시키기 위한 알고리즘을 제안한다. 기존의 IMCRA은 주파수 특성이 빠르게 변화하는 비정상적인 환경과 낮은 SNR을 갖는 상황에서 잡음 전력 추정에 직접적으로 영향을 미치는 음성 검출기의 성능이 강인하지 못한 단점이 있다. 본 연구에서는 강인한 음성 검출 성능을 위해서 기존 IMCRA의 음성 검출기에 전역 음성 부재 확률을 적용한 음성 향상 기법을 제안한다. 제안된 알고리즘의 성능 평가는 음성의 perceptual evaluation of speech quality (PESQ)와 composite measure를 통한 음질을 평가하였다. 실험 결과 다양한 잡음 환경 (car, white, babble)에서 전역 음성 부재 확률을 적용한 IMCRA의 음성 향상 기법이 향상된 결과를 보여주었다. 특히, 비정상잡음 환경인 babble 5dB에서 PESQ 0.026, composite measure 0.029의 향상된 음질을 나타내었다.