DOI QR코드

DOI QR Code

적응적인 확장된 코드북을 이용한 분할 벡터 양자화기 구조의 ISF 양자화기 개선

A Method For Improvement Of Split Vector Quantization Of The ISF Parameters Using Adaptive Extended Codebook

  • 투고 : 2010.10.01
  • 심사 : 2010.12.23
  • 발행 : 2011.01.31

초록

본 논문에서는 ISF 계수의 순서화 성질을 이용하여 분할구조 벡터양자화기의 단점을 보완하여 ISF 계수 양자화의 성능을 높이는 알고리듬을 제안하고, 이를 이용한 광대역 음성 부호화기용 ISF 계수 양자화기를 설계한다. 16차 이상의 광대역 코덱의 ISF 계수는 계산량과 메모리 사용을 줄이기 위해서 분할구조의 벡터 양자화기를 사용한다. 분할구조 양자화기는 ISF 계수간의 상관도를 충분히 활용하지 못하는 단점이 발생한다. 제안하는 알고리듬은 이러한 단점을 극복하기 위하여 ISF 계수의 순서화 성질을 이용한다. ISF 계수의 순서화 성질을 이용하여 각 서브벡터의 불필요한 코드북 (Codebook Redundancy)을 검색할 수 있다. 이러한 불필요한 코드북은 ISF 계수의 순서화 성질, ISF 계수 예측과정과 기존 코드북의 보간법 (Interpolation)을 통해 적응적인 확장된 코드북으로 교체되어 양자화기의 성능을 향상시킨다. 제안된 알고리듬은 기존의 분할구조 양자화기에서 사용되지 못했던 17 %가량의 불필요한 코드북 인덱스를 적응적인 확장된 코드북에 할당하여, 표준화된 코덱인 AMR-WB의 ISF 계수 양자화기에 비해서 주파수 왜곡 관점에서 약 2 bit 가량의 이득을 보는 결과를 얻었다.

This paper presents a method for improving the performance of ISF coefficients quantizer through compensating the defect of the split structure vector quantization using the ordering property of ISF coefficients. And design the ISF coefficients quantizer for wideband speech codec using proposed method. The wideband speech codec uses split structure vector quantizer which could not use the correlation between ISF coefficients fully to reduce complexity and the size of codebook. The proposed algorithm uses the ordering property of ISF coefficients to overcome the defect. Using the ordering property, the codebook redundancy could be figured out. The codebook redundancy is replaced by the adaptive-extended codebook to improve the performance of the quantizer through using the ordering property, ISF coefficient prediction and interpolation of existing codebook. As a result, the proposed algorithm shows that the adaptive-extended codebook algorithm could get about 2 bit gains in comparison with the existing split structure ISF quantizer of AMR-WB (G.722.2) in the points of spectral distortion.

키워드

참고문헌

  1. O'Shaughnessy, D., "Linear predictive coding", IEEE Potentials vol. 7, pp. 29-32, 1988. https://doi.org/10.1109/45.1890
  2. Paliwal K.K. and Atal B.S., "Efficient vector quantization of LPC parameters at 24 bits/frame", IEEE Trans. vol. 1, no. 1, pp. 3-14, Jan. 1993.
  3. Bessette, B. and Salami, R., "The adaptive multirate wideband speech codec (AMR-WB)", IEEE Trans. vol. 10, no. 8, pp. 620-636, Nov. 2002.
  4. ITU-T Rec. G.718 "Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kb/s," Jun. 2008.
  5. Bistritz Y. and Pellerm S., "Immittance spectral pairs (ISP) for speech encoding", IEEE. vol. 2, Apr. 1993.
  6. Linder, Y. and Buzo, A. and Gray, R., "An algorithm for vector quantizer design", IEEE Trans. vol. 28, no. 1, pp. 84-95, Jan. 1980. https://doi.org/10.1109/TCOM.1980.1094577
  7. A.M. Kondoz, "Digital Speech", pp. 106-107.
  8. ITU-T Rec. G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband", Jul. 2003.