블록 제한 트렐리스 부호화 양자화 기법을 이용한 협대역 음성 부호화기용 LPC 계수 양자화기 설계

Designing a Quantizer of LPC Parameters for the Narrowband Speech Coder using Block-Constrained Trellis Coded Quantization

  • 전자경 (한양대학교 전자전기제어계측공학과) ;
  • 박상국 (한양대학교 전자전기제어계측공학과) ;
  • 강상원 (한양대학교 전자전기제어계측공학과)
  • 발행 : 2007.03.31

초록

본 논문에서는 기존의 트렐리스 부호화 양자화 기법을 이용, 변형하여 저 복잡도 블록 제한 격자 부호화 양자화 기법 (Block-Constrained Trellis Coded Quantization, 이하 BC-TCQ)을 제안하곤 이를 이용한 협대역 음성 부호화기용 예측 BC-TCQ를 설계하였다. 트렐리스 부호화 양자화 기법은 일종의 벡터 양자화 방식으로 부호화에 요구되는 벡터 코드북을 트렐리스 구조에 기반한 스칼라 코드북으로 구성함으로써 VQ와 비교 할 만한 성능을 보일 뿐 아니라 복잡도가 훨씬 작은 특성을 보인다. 본 논문에서 제안한 예측 BC-TCQ는 프레임당 26비트에서 IS-641 음성 부호화기보다 평균 SD가 0.4107dB 향상되었으며, 더하기 연산이 64.54%, 곱하기 연산이 76.93%, 비교 연산이 2.35% 감소하였다.

In this paper, low complexity block constrained trellis coded quantization (BC-TCQ) structures are introduced, and a predictive BC TCQ encoding method is developed for quantization of line spectrum frequencies (LSF) parameters for narrowband speech coding applications. Trellis-coded quantization(TCQ) is a form of VQ that builds the VQ codebook from interleaved constituent scalar quantization codebooks. The performance is compared to the other VQ, demonstrating reduction in spectral distortion and significant reduction in encoding complexity. The predictive BC-TCQ is about 0.47107 dB superior to the IS-641 split-VQ, 26bits/frame, in spectral distortion sense. The BC-TCQ is 64.54%, 76.93%, 2.35% of the IS-641 split-VQ, respectively, in the complexity of the additions, multiplies, comparisons.

키워드

참고문헌

  1. F. Itakura, 'Line spectral representation of linear predictive coefficients of speech signals,' J. Acoust. Soc. Amer., vol. 57, Supplement no. 1, S35, 1975
  2. N. Sugamura and N. Farvardin, 'Quantizer design in LSP speech analysis‐synthesis,' IEEE J. Sel. Areas Commun., SAC‐6, pp. 432-440, 1988
  3. K. K. Paliwal and B. S. Atal, 'Efficient vector quantization of LPC parameter at 24 bits/frame,' IEEE Trans. Speech Audio Processing, vol. 1, no. 1, pp. 3‐14, Jan. 1993
  4. A. Gersho and R. M. Gray, Vector Quantization and Signal Compression. Norwell, MA: Kluwer, 1992
  5. M. W. Marcellin and T. R. Fischer, 'Trellis coded quantization of memoryless and GaussMarkov sources,' IEEE Trans. Communications, vol. 38, issue 1, pp. 82-93, Jan. 1990 https://doi.org/10.1109/26.46532
  6. G. D. Forney, Jr., 'The Viterbi algorithm,' Proc. IEEE (Invited Paper), vol. 61, pp. 268-278, Mar. 1973
  7. S. Nikneshan and A. K. Khandani, 'Soft decision decoding of fixed rate entropycoded trellis coded quantizer over a noisy channel,' IEEE Trans. Vehicular Tech., to appear
  8. TIA/EIA/IS641, 'TDMA cellular/PCS radio interface‐enhanced full‐rate speech codec,' May 1996
  9. S. Chi, S. Kang, and C. Lee, 'Safety‐net pyramid VQ of LSF parameters for wideband speech codecs,' Electronics Letters, vol. 37, no. 11, pp. 724-726, May 2001 https://doi.org/10.1049/el:20010492
  10. Y. Shoham, 'Coding the line spectral frequencies by jointly optimized MA prediction and vector quantization,' IEEE Worksho. Speech Coding Proceedings, pp. 46-48, 1999