• Title/Summary/Keyword: 예측 벡터 양자화기

Search Result 15, Processing Time 0.026 seconds

A LSF Quantizer for the Wideband Speech Using the Predictive VQ-Pyramid VQ (예측 VQ-Pyramid VQ를 이용한 광대역 음성용 LSF 양자학기 설계)

  • 이강은;이인성;강상원
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.4
    • /
    • pp.333-339
    • /
    • 2004
  • This Paper proposes the vector quantizer-pyramid vector quantizer(VQ-PVQ) structure. Also both predictive structure and safety-net concept are combined into the VQ-PVQ to quantize the IPC parameter of wideband speech codec. The Performance is compared to the LPC vector quantizer used in the AMR-WB(ITU-T G.722.2). demonstrating reduction in both spectral distortion and encoding memory.

Coding of LPC Parameters Using the Ordering Property of LSP in the Presence of Channel Errors (전송에러가 있는 채널에서 LSP 순서화특성을 이용한 선형예측계수(LPC)의 양자화 방법)

  • 이인성
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.76-80
    • /
    • 1995
  • Differential pulse code modulation 구조의 Line spectrum pairs 양자화기에 높은 차수 LSP 파라미터 값은 낮은 차수 LSP 파라미터 값보다 커야한다는 LSP 파라미터의 순서화 특징을 이용하여 양자화하는 방법을 제시한다. 31 비트/프레임에서 1 dB 이하의 스펙트럴 왜곡을 갖는 명료한 음질을 보였다. 또한 LSP 주파수의 순서화 특성은 벡터-스칼라 결합 양자화기에 적용하였다. 벡터-스칼라 결합 양자화기에서는 26비트/프레임에서 명료한 음질을 보였다. 새로운 LSP 양자화 방법들은 전송에러 발생시 성능을 시험하고, 전송 에러에 강인하도록 프레임간 예측을 위해 Moving Average 예측기를 사용한다.

  • PDF

Design of the LSF Parameter Quantizer for the Wideband Speech Codec (광대역 음성 부호화기용 선 스펙트럼 주파수 계수 양자화기 설계)

  • 지상현;강상원;윤병식
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.4
    • /
    • pp.29-34
    • /
    • 2001
  • In this paper, we designed an LSF coefficient quantizer of the wideband speech codec that can produce high quality speech service. For the efficient LSF coefficient quantizer, the interframe correlation was used. Also we separately quantized the LSF coefficients with high and low interframe correlation. Predictive pyramid vector quantizer (PVQ) was used for quantizing the LSF coefficients with high interframe correlation, and PVQ was used for quantizing the LSF coefficients with low interframe correlation. Experiments show that the proposed UF quantizer can quantize LSF information in 40 bits/frame, with an average spectral distortion (SD) of 1 dB and less than 3.87% frames having SD greater than 2 dB.

  • PDF

Design of a Quantization Algorithm of the Speech Feature Parameters for the Distributed Speech Recognition (분산 음성 인식 시스템을 위한 특징 계수 양자화 방식 설계)

  • Lee Joonseok;Yoon Byungsik;Kang Sangwon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.4
    • /
    • pp.217-223
    • /
    • 2005
  • In this paper, we propose a predictive block constrained trellis coded quantization (BC-TCQ) to quantize cepstral coefficients for the distributed speech recognition. For Prediction of the cepstral coefficients. the 1st order auto-regressive (AR) predictor is used. To quantize the prediction error signal effectively. we use a BC-TCQ. The performance is compared to the split vector quantizers used in the ETSI standard, demonstrating reduction in the cepstral distance and computational complexity.

Motion estimation algorithm using quantization for fast video encoding (고속 영상 부호화를 위한 양자화 변환 및 움직임 예측 알고리즘)

  • Park, Sang-Uk;Sim, Jae-Young;Lee, Sang-Uk
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.11a
    • /
    • pp.186-187
    • /
    • 2012
  • 본 논문에서는 기존의 표준 동영상 부호기의 산술적 연산 복잡도 및 대역폭을 낮추기 위하여 양자화된 두 영상에서 움직임을 예측하는 고속 영상 부호화 알고리즘을 제안한다. 기존에 제안된 이진 변환 기반 움직임 예측 알고리즘은 표적 영상과 참조 영상의 각 매크로 블록 단위로 가우시안 양자화를 적용한 뒤, 움직임 예측을 수행하기 때문에 블록 단위의 아티팩트로 인한 탐색 성능 저하를 피할 수 없다. 따라서, 우리는 참조 영상의 탐색 영역에 대해 하나의 양자화기를 적용함으로써 보다 정확한 움직임을 예측한다. 또한, 기존 알고리즘이 하나의 가우시안 양자화기를 적용하는 것과 달리, 제안 알고리즘은 데이터 특성 파악에 따른 다양한 확률 모델을 가정한 뒤 각 모델에 적합한 최적의 양자화기를 적용함으로써 블록 매칭 오류를 낮춘다. 실험 결과를 통해 제안 알고리즘이 기존의 이진 변환 기반 움직임 예측 알고리즘에 비해 보다 정확한 움직임 벡터를 예측함을 보인다.

  • PDF

A Method For Improvement Of Split Vector Quantization Of The ISF Parameters Using Adaptive Extended Codebook (적응적인 확장된 코드북을 이용한 분할 벡터 양자화기 구조의 ISF 양자화기 개선)

  • Lim, Jong-Ha;Jeong, Gyu-Hyeok;Hong, Gi-Bong;Lee, In-Sung
    • The Journal of the Acoustical Society of Korea
    • /
    • v.30 no.1
    • /
    • pp.1-8
    • /
    • 2011
  • This paper presents a method for improving the performance of ISF coefficients quantizer through compensating the defect of the split structure vector quantization using the ordering property of ISF coefficients. And design the ISF coefficients quantizer for wideband speech codec using proposed method. The wideband speech codec uses split structure vector quantizer which could not use the correlation between ISF coefficients fully to reduce complexity and the size of codebook. The proposed algorithm uses the ordering property of ISF coefficients to overcome the defect. Using the ordering property, the codebook redundancy could be figured out. The codebook redundancy is replaced by the adaptive-extended codebook to improve the performance of the quantizer through using the ordering property, ISF coefficient prediction and interpolation of existing codebook. As a result, the proposed algorithm shows that the adaptive-extended codebook algorithm could get about 2 bit gains in comparison with the existing split structure ISF quantizer of AMR-WB (G.722.2) in the points of spectral distortion.

A Study of BWE-Prediction-Based Split-Band Coding Scheme (BWE 예측기반 대역분할 부호화기에 대한 연구)

  • Song, Geun-Bae;Kim, Austin
    • The Journal of the Acoustical Society of Korea
    • /
    • v.27 no.6
    • /
    • pp.309-318
    • /
    • 2008
  • In this paper, we discuss a method for efficiently coding the high-band signal in the split-band coding approach where an input signal is divided into two bands and then each band may be encoded separately. Generally, and especially through the research on the artificial bandwidth extension (BWE), it is well known that there is a correlation between the two bands to some degree. Therefore, some coding gain could be achieved by utilizing the correlation. In the BWE-prediction-based coding approach, using a simple linear BWE function may not yield optimal results because the correlation has a non-linear characteristic. In this paper, we investigate the new coding scheme more in details. A few representative BWE functions including linear and non-linear ones are investigated and compared to find a suitable one for the coding purpose. In addition, it is also discussed whether there are some additional gains in combining the BWE coder with the predictive vector quantizer which exploits the temporal correlation.

A Study on the Interframe Image Coding Using Motion Compensated and Classified Vector Quantizer (Ⅰ: Theory and Computer Simulation) (이동 보상과 분류 벡터 양자화기를 이용한 영상 부호화에 관한 연구 (Ⅰ: 이론및 모의실험))

  • Kim, Joong-Nam;Choi, Sung-Nam;Park, Kyu-Tae
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.27 no.3
    • /
    • pp.13-20
    • /
    • 1990
  • This paper describes an interframe image coding using motion compensated and classified vector quantizer (MC-CVQ). It is essential to carefully encode blocks with significant pels in motion compensated vector quantizers (MCVQ). In this respect, we propose a new CVQ algorithm which is appropriate to the coding of interframe prediction error after motion compensation. In order to encode an image efficiently at a low bit rate, we partition each block, which is the processing element in MC, into equally sized 4 vectors, and classify vectors into 15 classes according to the position of significant pels. Vectors in each class are then encoded by the vector quantizer with the codebook independently designed for the class. The computer simulation shows that the signal-to-noise ratio and the average bit rate of MC-CVQ are 35-37dB and 0.2-0.25bit/pel, respectively, for the videophone or video conference type image.

  • PDF

Designing a Quantizer of LPC Parameters for the Narrowband Speech Coder using Block-Constrained Trellis Coded Quantization (블록 제한 트렐리스 부호화 양자화 기법을 이용한 협대역 음성 부호화기용 LPC 계수 양자화기 설계)

  • Jun, Ja-Kyoung;Park, Sang-Kuk;Kang, Sang-Won
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.3C
    • /
    • pp.234-240
    • /
    • 2007
  • In this paper, low complexity block constrained trellis coded quantization (BC-TCQ) structures are introduced, and a predictive BC TCQ encoding method is developed for quantization of line spectrum frequencies (LSF) parameters for narrowband speech coding applications. Trellis-coded quantization(TCQ) is a form of VQ that builds the VQ codebook from interleaved constituent scalar quantization codebooks. The performance is compared to the other VQ, demonstrating reduction in spectral distortion and significant reduction in encoding complexity. The predictive BC-TCQ is about 0.47107 dB superior to the IS-641 split-VQ, 26bits/frame, in spectral distortion sense. The BC-TCQ is 64.54%, 76.93%, 2.35% of the IS-641 split-VQ, respectively, in the complexity of the additions, multiplies, comparisons.

A Rate and Distortion Estimation Scheme for HEVC Hardware Implementation (하드웨어 구현에 적합한 HEVC 의 CU 단위 율 및 왜곡 예측 방법)

  • Lee, Busmhik;Kim, Munchurl
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.15-17
    • /
    • 2014
  • 본 논문에서는 하드웨어의 제한된 자원을 이용하여 HEVC 코덱을 구현할 때 DCT 와 엔트로피 부호화를 사용하지 않고 율 및 왜곡값을 예측하여 고효율의 부호화를 수행하는 방법에 대하여 제안한다. HEVC 는 기존의 부호화기에 비하여 계층적 부호화 구조와 함께 큰 블록 크기를 갖는 DCT 와 엔트로피 부호화를 반복적으로 수행하기 때문에 하드웨어 구현 시 그 복잡도가 매우 크게 증가한다. 먼저 DCT 는 하다마드변환 행렬과 또 다른 정규 직교 변환 행렬의 곱으로 표현될 수 있는 성질을 이용하여 부호화 변환 시 생성된 하드마드변환 행렬에 저복잡도의 정규 직교 변환 행렬을 곱하여 DCT 변환 계수를 생성한 후 변환 및 양자화를 수행한다. 왜곡값의 경우, 이 때 생성된 양자화 계수와 변환 계수 간의 차이를 변환도메인에서 제곱합을 이용하여 계산하여 역변환을 생략함으로써 복잡도를 감소시킬 수 있다. 또한 텍스처에 대한 비트율 예측은 각 CU 블록내의 양자화 계수의 수를 더하여 계산하여 엔트로피를 수행하지 않고 예측할 수 있다. 그리고 비 텍스처에 대한 비트율 예측의 경우 움직임벡터의 비트에 대한 Pseudo CABAC 코드를 수행하여 예측할 수 있다. 이러한 저 복잡도의 텍스처 및 비텍스처 비트와 왜곡을 예측함으로써 하다마드변환만을 이용하여 부호화하였을 때에 비해 최대 33%의 비트율 감소를 얻을 수 있었다.

  • PDF