• Title/Summary/Keyword: 음질예측

Search Result 61, Processing Time 0.019 seconds

Development of an Automatic Speech Quality Evaluator for Analog Cellular System (아날로그 셀룰라 시스템을 위한 자동 음질 평가기 개발)

  • 박상욱;최용수;정성교;윤대희;이충용
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.7
    • /
    • pp.28-35
    • /
    • 1998
  • 본 논문에서는 아날로그 이동 전화 환경에서의, 객관적인 음질 평가 척도를 사용하 여 주관적 음질을 추정하는 이동전화 자동 음질평가 시스템을 개발하였다. 이동전화의 통화 품질을 유지하기 위해서는 이동전화의 네트워크를 계속하여 체크하는 것이 매우 중요하다. 주관적 음질 평가는 사람의 체감을 직접 나타내는 것이므로 실제적인 음질을 평가하는데 중 요한 척도가 되지만, 인력과 시간이 많이 소모되므로 다양한 지역에서 지속적으로 음질을 평가하는데 부적절하다. 이러한 문제를 해결하기 위하여 객관적 음질평가 척도를 이용하여 주관적 음질 평가 척도를 예측하는 자동 음질 평가 시스템이 필수적이다. 반복된 실험을 통 하여 BSD(Bark Spectral Distance)가 주관적 음질 평가 척도와 높은 상관관계가 있음을 확 인하였으며 원래의 음성과 이동 전화 채널을 통과한 음성과의 BSD를 측정한 후 이를 바탕 으로 MOS(Mean Opinion Score)를 추정하는 자동 음질 평가 시스템(Automatic Speech Quality Evaluator)을 개발하였다.

  • PDF

Speech Quality Measure in a Mobile Communication System using PLP Cepstral Distance with CMS (심리 음향 겝스트럼 평균 차감법을 이용한 이동 전화망에서의 음질 평가)

  • 윤종진;박상욱;박영철;안동순;윤대희
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.12B
    • /
    • pp.2046-2051
    • /
    • 2000
  • 본 논문에서는 기존의 음질 평가 방법들보다 우수할 뿐 아니라 다양한 채널 경로의 음성 신호에 대해서도 일관된 성능을 갖는 새로운 음질 평가 방법 PLP-CMS(Perceptual Linear Predictive-Cepstral Mean Subtraction)를 제안한다. CDMA PCS 이동 전화 환경에서 음성 신호의 주관적 음질을 효과적으로 예측할 수 있는 PLP-CMS는 심리 음향 선형 예측 분석(PLP Analysis: Perceptual Linear Predictive Analysis)을 이용하여 주관적 음질과의 상관 관계를 높였으며, 겝스트럼 평균 차감(CMS: Cepstral Mean Subtraction) 과정을 통하여 PSTN 경로에 무관하게 일관된 성능을 갖음을 확인하였다.

  • PDF

EVRC Speech Quality Enhancement Using Pitch Prediction and Gradual Increase of the Decoded Speech (피치예측과 점진적 복원 기법을 이용한 EVRC 음질개선)

  • 민병준;김재원
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.6
    • /
    • pp.38-43
    • /
    • 1999
  • The EVRC vocoder is a toll quality coder, but it shows significant degradation or the quality in weak RF environment. In this paper, the speech quality degradation phenomenon of the EVRC is analyzed, and two methods are proposed as the solution - the pitch prediction and the gradual increase. The preference tests for various Rf environment are performed for speech quality assessments and both the methods show better performance.

  • PDF

Speech Quality Estimation Algorithm using a Harmonic Modeling of Reverberant Signals (반향 음성 신호의 하모닉 모델링을 이용한 음질 예측 알고리즘)

  • Yang, Jae-Mo;Kang, Hong-Goo
    • Journal of Broadcast Engineering
    • /
    • v.18 no.6
    • /
    • pp.919-926
    • /
    • 2013
  • The acoustic signal from a distance sound source in an enclosed space often produces reverberant sound that varies depending on room impulse response. The estimation of the level of reverberation or the quality of the observed signal is important because it provides valuable information on the condition of system operating environment. It is also useful for designing a dereverberation system. This paper proposes a speech quality estimation method based on the harmonicity of received signal, a unique characteristic of voiced speech. At first, we show that the harmonic signal modeling to a reverberant signal is reasonable. Then, the ratio between the harmonically modeled signal and the estimated non-harmonic signal is used as a measure of standard room acoustical parameter, which is related to speech clarity. Experimental results show that the proposed method successfully estimates speech quality when the reverberation time varies from 0.2s to 1.0s. Finally, we confirm the superiority of the proposed method in both background noise and reverberant environments.

Non-Intrusive Speech Quality Estimation of G.729 Codec using a Packet Loss Effect Model (G.729 코덱의 패킷 손실 영향 모델을 이용한 비 침입적 음질 예측 기법)

  • Lee, Min-Ki;Kang, Hong-Goo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.2
    • /
    • pp.157-166
    • /
    • 2013
  • This paper proposes a non-intrusive speech quality estimation method considering the effects of packet loss to perceptual quality. Packet loss is a major reason of quality degradation in a packet based speech communications network, whose effects are different according to the input speech characteristics or the performance of the embedded packet loss concealment (PLC) algorithm. For the quality estimation system that involves packet loss effects, we first observe the packet loss of G.729 codec which is one of narrowband codec in VoIP system. In order to quantify the lost packet affects, we design a classification algorithm only using speech parameters of G.729 decoder. Then, the degradation values of each class are iteratively selected that maximizes the correlation with the degradation PESQ-LQ scores, and total quality degradation is modeled by the weighted sum. From analyzing the correlation measures, we obtained correlation values of 0.8950 for the intrusive model and 0.8911 for the non-intrusive method.

Multichannel Audio Coding using inter-channel Redundancies (채널 간 중복성을 이용한 다채널 오디오 부호화)

  • 신종인
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.150-154
    • /
    • 1995
  • 기존의 2-채널 오디오 복호화기와 호환성을 유지하기 위해서는 다채널 오디오 부호화기에 할당되는 비트율이 제한되어야 한다. 늘어난 채널 신호에 적은 양의 비트를 할당해줌으로 인해서 복원음의 음질이 저하되는 결과를 초래한다. 따라서 기존의 방법에 신호의 채널 간 중복성을 이용한 다채널 오디오 신호의 음질을 개선시킬 필요가 있다. 본 논문에서는 채널간 중복성을 이용하기 위한 방법으로 적응 채널 간 예측법을 제안하였다. 적응 채널 간 예측법은 주로 저주파 대역에서 스테레오 신호 간에 존재하는 중복된 정보를 제거하고자 하는 방법이다. 저주파 대역에서는 큰 예측 이득을 얻을 수 있어서 스테레오 음상에 불필요한 정보를 없애는데 유리하다. 기존의 방법과 제안된 예측 부호화법을 비교해 보면 두 신호의 상관 관계가 클수록 개선폭이 증가함을 알 수 있으며 낮은 비트율에서 기존이 부호화기가 처리하기 어려운 광대역 신호에 대해서 음질이 개선되는 결과를 얻었다.

  • PDF

Coding of LPC Parameters Using the Ordering Property of LSP in the Presence of Channel Errors (전송에러가 있는 채널에서 LSP 순서화특성을 이용한 선형예측계수(LPC)의 양자화 방법)

  • 이인성
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.76-80
    • /
    • 1995
  • Differential pulse code modulation 구조의 Line spectrum pairs 양자화기에 높은 차수 LSP 파라미터 값은 낮은 차수 LSP 파라미터 값보다 커야한다는 LSP 파라미터의 순서화 특징을 이용하여 양자화하는 방법을 제시한다. 31 비트/프레임에서 1 dB 이하의 스펙트럴 왜곡을 갖는 명료한 음질을 보였다. 또한 LSP 주파수의 순서화 특성은 벡터-스칼라 결합 양자화기에 적용하였다. 벡터-스칼라 결합 양자화기에서는 26비트/프레임에서 명료한 음질을 보였다. 새로운 LSP 양자화 방법들은 전송에러 발생시 성능을 시험하고, 전송 에러에 강인하도록 프레임간 예측을 위해 Moving Average 예측기를 사용한다.

  • PDF

Quality Improvement of Karaoke Mode in SAOC using Cross Prediction based Vocal Estimation Method (교차 예측 기반의 보컬 추정 방법을 이용한 SAOC Karaoke 모드에서의 음질 향상 기법에 대한 연구)

  • Lee, Tung Chin;Park, Young-Cheol;Youn, Dae Hee
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.3
    • /
    • pp.227-236
    • /
    • 2013
  • In this paper, we present a vocal suppression algorithm that can enhance the quality of music signal coded using Spatial Audio Object Coding (SAOC) in Karaoke mode. The residual vocal component in the coded music signal is estimated by using a cross prediction method in which the music signal coded in Karaoke mode is used as the primary input and the vocal signal coded in Solo mode is used as a reference. However, the signals are extracted from the same downmix signal and highly correlated, so that the music signal can be severely damaged by the cross prediction. To prevent this, a psycho-acoustic disturbance rule is proposed, in which the level of disturbance to the reference input of the cross prediction filter is adapted according to the auditory masking property. Objective and subjective test were performed and the results confirm that the proposed algorithm offers improved quality.

Reduction of Pitch Searching Range in CELP vocoder (CELP 부호화기에서 피치검색범위의 단축)

  • 임재열;배명진;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • v.12 no.2E
    • /
    • pp.33-37
    • /
    • 1993
  • 부호여기선형예측 형태의 음성 부호화기에 있어서주된 단점은 요구되는 계산량이많다는 것이다. 본 논문에서는 음질의 저하없이 자기상관에 근거한 피치예측기에서 피치 찾는 시간을 줄이는 간단한 방법을 제안한다. 기본적인 발상은, 피치찾는 과정에서 나타나는 자기상관 함수의 특성에 근거하여, 음의 봉우리의 폭을 이전 양의 봉우리의 폭을 이용하여 추정하여 건너 뜀으로써 피치 찾는 범위를 자기상관함수의 양의 값쪽으로 제한하는 것이다. 이렇게 피치찾는 구간에 제약을 가함으로써 요구되는 계산량은 감소하게 된다. 제안된 방법을 적용한 결과, 평균 약 40%의 계산량 감소를 음질의 저하없이 얻을 수 있다.

  • PDF

A Study on Improvement of CELP Coder using Band-Divided Long Term Prediction (대역 분할 장구간 예측을 이용한 CELP 부호화기의 성능 향상에 관한 연구)

  • 최용수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.179-182
    • /
    • 1994
  • 본 논문에서는 4.8kbps 이하의 낮은 전송률에서 Code-Ecited Linear Prediction 방법에 MBE 방법을 도입하여 장구간 예측 성능을 향상시키는 방법을 제안하였다. 제안된 방법에서는 기존의 CELP 방법으로 장구간 예측을 한 후에도 여전히 남아 있는 주기적 성분들을 다시 한번 다대역 장구간 예측을 한다. 이 때 전체 주파수 영역을 기본 주파수의 하모닉 간격으로 주파수 분할하였고, 주기적 다대역 여기 신호를 각 대역 내의 하모닉들에서 여기 신호 스펙트럼과 근사한 크기를 갖는 정현파의 합으로 표현함으로써 실제 여기 신호의 특성을 잘 반영하도록 하였다. 음질 평가의 비교 기준 대상으로 4.8 kbps DoD CELP를 선정하여 주관적 음질평가를 실시한 결과 4.8 kbps DoD CELP보다 우수한 성능을 보임을 알 수 있었다.

  • PDF