• 제목/요약/키워드: CELP coder

검색결과 57건 처리시간 0.021초

효율적인 하모닉-CELP 구조를 갖는 저 전송률 음성 부호화기 (Efficient Harmonic-CELP Based Low Bit Rate Speech Coder)

  • 최용수;김경민;윤대희
    • 한국음향학회지
    • /
    • 제20권5호
    • /
    • pp.35-47
    • /
    • 2001
  • 본 논문에서는 하모닉 부호화기와 CELP(Code Excited Linear Prediction) 부호화기의 장점을 고려한 효율적인 저 전송률 하모닉-CELP 음성 부호화기를 제안한다. 제안된 하모닉-CELP 부호화기에서는 프레임 단위 유/무성음 판별에 따라 무성음 구간에서는 고속 CELP방식으로 부호화하고 유성음 구간에서는 개선된 하모닉 부호화를 수행한다. 제안된 부호화기는 무성음 부호화를 위한 RP-VSELP(Regular Pulse Vector Sum Excited Linear Prediction), 유성음 부호화를 위한 간단한 정수 피치 검색, 정수 단위 피치에서의 고속 하모닉 추정, 가변 차원 하모닉 벡터 양자화, 주파수 해상도를 반영한 인지 가중치, 고속 하모닉 합성, 대역별 유성음 정도에 따른 자연성 제어, 다중 모드 등을 주요한 특징으로 하며, 이러한 특징들로 인해 기존의 HVXC(Harmonic Vector eXeited Coder) 부호화기에 비해서 매우 낮은 복잡도를 갖는다. 주관적인 음질 평가 결과, 제안된 2.4 kbps 하모닉-CELP 부호화기는 낮은 지연과 적은 계산량으로 양호한 음질을 얻을 수 있음을 확인하였다.

  • PDF

다중 코드북 구조를 이용한 CELP형 음성부호화기 (CELP speech coder by the structure of multi-codebook)

  • 박규정;한승조
    • 한국정보통신학회논문지
    • /
    • 제5권1호
    • /
    • pp.23-33
    • /
    • 2001
  • 본 논문에서는 다중 코드북 구조를 이용하여 CELP 부호화기의 계산량의 증가 없이 고음질의 음성을 합성할 수 있는 코드북 구조를 제안한다. 또 제안된 코드북 구조를 가지는 4.8kbps CELP형 음성부호화기를 설계한다. 제안된 다중 코드북 구조는 기본 코드북과 두 종류의 스펙트럼과 피치 보강을 위한 코드북으로 구성되어 각각의 코드북에서 검색하여, 두 개의 코드북의 합으로 여기신호를 표현하고 각각의 서로 다른 코드북 이득을 사용하기 때문에 정확한 이득을 표현할 수 있어 기존의 개선 알고리즘보다 더 나은 음질을 제공할 수 있다. 본 코드북 구조를 갖는 4.8kbps CELP형 부호화기를 설계하여 컴퓨터 모의 실험한 결과, 같은 전송률을 갖는 DoD CELP 부호화기보다 segSNR가 0.81dB 더 높게 나타났다.

  • PDF

1차원 SPIHT를 이용한 가변 비트율 음성 부호기의 설계 (Design of a Variable Bit Rate Speech Coder Based on One-dimensional SPIHT)

  • 나훈;정대권
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.443-451
    • /
    • 2003
  • 코드북 기반의 CELP 부호기는 코드북에 미리 할당된 부호화 비트율에 따라서 여기 신호를 모델링한 후 코드북을 이용하여 음성신호를 합성한다. 따라서 임의의 다양한 비트율을 하나의 부호기에서 지원하지 못하는 단점이 있다. 본 논문에서 제안하는 가변 비트율 부호기는 웨이블렛 변환 (wavelet transform과 1차원 SPIHr (one dimensional SPIHT)를 이용하여 현재 프레임에 할당되는 비트수에 따라서 여기신호를 부호화한다. 또한 CELP 부호기의 경우처럼 특정한 몇 가지 형태로 여기신호(또는 코드북)를 모델링할 필요가 없고, 정확한 피치정보가 없어도 여기신호를 사용자의 요구에 따라 다양한 비트율로 부호화할 수 있다. 그 결과 코드북이 존재하지 않기 때문에 부호기의 복잡도가 낮으며, CELP 기반의 G.729와 G.723.1 부호기와의 음질 비교 결과 동등하거나 나은 결과를 보여준다.

이중 전송률(2.4/4.0 kbps)을 갖는 개선된 하모닉-CELP 음성부호화기 (Improved Harmonic-CELP Speech Coder with Dual Bit-Rates(2.4/4.0 kbps))

  • 김경민;윤성완;최용수;박영철;윤대희;강태익
    • 한국통신학회논문지
    • /
    • 제28권3C호
    • /
    • pp.239-247
    • /
    • 2003
  • 본 논문에서는 기존에 제안한 바 있는 EHC(Efficient Harmonic-CELP) 부호화기에 기반한 이중 전송률(2.4/4.0 kbps)의 개선된 하모닉-CELP(Improved Harmonic-CELP: IHC) 음성 부호화기를 제안한다. 제안된 IHC는 유/무성음 판별에 따라 유성음에서는 하모닉 추정, 하모닉 양자화, 하모닉 합성 및 잡음 혼합을 통한 자연성 제어 등의 과정을 통해, 무성음에서는 고속 CELP 방식을 통해 음성신호를 부호화/복호화한다. 또한 제안된 IHC는 EHC의 유/무성음 판별과 하모닉 추정 성능을 개선한다. 피치 이득과 에너지 등을 이용한 유/무성음 판별은 프레임 내의 에너지 변화 등에 의해 재판별된다. 하모닉 부호화에서는 첨점 추출과 델타 조정 방법을 이용하여 정확한 하모닉 추정을 하고, 혼합하는 잡음의 대역과 양을 적절하게 조절하여 자연성을 제어한다. 제안된 IHC 부호화기에 성능평가 결과, 비교 부호화기인 HVXC 연산량의 약 40%이내의 연산량으로 우수한 음질을 보임을 확인하였다.

분산펄스와 랜덤 코드북을 이용한 CELP 음성 부호화기 (A CELP Speech Coder Using Dispersed-Pulse and Random Codebook)

  • 황윤성;문인섭;이행우;김종교
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.115-118
    • /
    • 2001
  • This paper presents dispersed-pulse and random codebook for CELP coder. This coder operates on speech frames of 20ms and generates an excitation vector by convoluting dispersion vectors with signed pulses in an algebraic codevector. The improvement of pulse-based fixed codebook is performed at a low bit rate. A high performance fixed-codebook consists of a partial algebraic codebook and a random codebook in unvoiced and stationary noise regions. The proposed CELP coder is quantized with 4kb/s and is compared with G.729 (Bkb/s CS-ACELP). Subjective testing shows better quality than reference coders under some background noise conditions

  • PDF

Improved Excitation Modeling for Low-Rate CELP Speech Coding

  • Kwon, Chul-Hong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제18권2E호
    • /
    • pp.24-30
    • /
    • 1999
  • In this paper, we propose a weighting dependent mixed source model (WD-MSM) coder that is an improved version of a CELP-based mixed source model (C-MSM) coder. The coder classifies speech segments into three types : voiced, unvoiced and mixed. The excitation for a voiced frame is an adaptive source, and the excitation for an unvoiced frame is a stochastic source. The coder has a modified mixed source for a mixed frame. We apply different weighting functions for three classes. Simulation results show that the proposed coder at 4 kbits/s yields very good performance both subjectively and objectively.

  • PDF

Trellis excitation을 이용한 half rate 음성부호화기 (A Half Rate Speech Soder using Trellis Excitation)

  • 강상원;이형수;김영수;정진욱
    • 전자공학회논문지B
    • /
    • 제33B권2호
    • /
    • pp.88-94
    • /
    • 1996
  • In this paper, we present a half rate speech coder using trellis excitation. The coder combines code-excited linear prediction (CELP) system and trellis quantization method using the codebook expansion, and it produces higher speech quality than the typical CELP coder for the same transmission rate. A subjective comparison with 3~8 bit .$\mu$-law PCM indicates that the half rate coder provides speech quality between 5-bit and 6-bit $\mu$-law PCM .

  • PDF

네트워크 환경에서 서버용 음성 인식을 위한 MFCC 기반 음성 부호화기 설계 (A MFCC-based CELP Speech Coder for Server-based Speech Recognition in Network Environments)

  • 이길호;윤재삼;오유리;김홍국
    • 대한음성학회지:말소리
    • /
    • 제54호
    • /
    • pp.27-43
    • /
    • 2005
  • Existing standard speech coders can provide speech communication of high quality while they degrade the performance of speech recognition systems that use the reconstructed speech by the coders. The main cause of the degradation is that the spectral envelope parameters in speech coding are optimized to speech quality rather than to the performance of speech recognition. For example, mel-frequency cepstral coefficient (MFCC) is generally known to provide better speech recognition performance than linear prediction coefficient (LPC) that is a typical parameter set in speech coding. In this paper, we propose a speech coder using MFCC instead of LPC to improve the performance of a server-based speech recognition system in network environments. However, the main drawback of using MFCC is to develop the efficient MFCC quantization with a low-bit rate. First, we explore the interframe correlation of MFCCs, which results in the predictive quantization of MFCC. Second, a safety-net scheme is proposed to make the MFCC-based speech coder robust to channel error. As a result, we propose a 8.7 kbps MFCC-based CELP coder. It is shown from a PESQ test that the proposed speech coder has a comparable speech quality to 8 kbps G.729 while it is shown that the performance of speech recognition using the proposed speech coder is better than that using G.729.

  • PDF

LPC Cepstral 벡터 양자화에 의한 저 전송율 CELP 음성부호기의 스펙트럼 표기 (Spectrum Representation Based on LPC Cepstral VQ for Low Bit Rate CELP Coder)

  • 정재호
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.761-771
    • /
    • 1994
  • 본 논문에서는, 매우 낮은 전송율이 요구되는 음성통신의 환경하에서 CELP 음성 부호기를 사용할 경우, 스펙트럼에 대한 정보를 어떻게 효과적으로 나타낼 것인가에 대하여 고찰하였다. 구체적으로, 스펙트럼에 대한 정보를 나타내는 LPC 파라메타를 cepstrum으로 변형시키고, 변형된 LPC cepstrum계수들을 효과적으로 벡터 양자화하는 방법을 제시하였다. 벡터 양자화에 사용되는 코드-북의 설계를 위하여, 주파수 대역에서 서로 다른 의미를 갖는 세계의 cepstral distance measure들을 시도하였으며, 각각에 대한 성능이 분석되어졌다. 시뮬레이션을 통하여, 본 논문에서 제시한 LPC cepstral 벡터 양자화 방식이 스펙트럼에 대한 정보를 매우 효과적으로 나타낼 수 있음을 보였다.

  • PDF

대역 선택 구조와 선택적 벡터 양자화를 이용한 개선된 웨이브릿 변화형 CELP 보호화기 (Enhanced Wavelet Transform-based CELP Coder with Band Selection and Selective VQ)

  • 장동일;조영권;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.46-55
    • /
    • 1995
  • 본 논문에서는 대역선택 웨이브릿 변환 CELP 보호화기라 명명한 4.8 kbps 전송률의 새로운 웨이브릿 변화형 CELP 부호화기를 구현하였다. 제안된 알고리듬에서는 이산 웨이브릿 주파수 대역에 대한 대역 선택과 선택적 벡터 양자화 기법을 사용하였다. 이러한 대역 선택 및 선택적 벡터 양자화 구조는 구분형 VQ 구조를 이용하여 구현하였다. 제안한 알고리즘은 계산량 및 저장용량을 크게 줄이면서도, 기존의 불규칙 잡음 코드북 검색 구조에 비해 0.5에서 1 dB 가량 개선된 segmental SNR을 갖는다. 많은 실험 결과를 통해 확인한 결과, 제안된 대역 선택 웨이브릿 변환 CELP 부호화기는 기존의 CELP 구조나 웨이브릿 변환 구조에 비해서 실제 응용에 훨씬 적합함을 확인하였다.

  • PDF