Design of the Vector-Scalar Quantizer of LSP Parameters for Wideband Speech Coder

광대역 음성부호화기를 위한 백터-스칼라 LSP 파라미터 양자화기 설계

  • 신재현 (충북대학교 전파공학과, 컴퓨터정보통신연구소) ;
  • 이인성 (충북대학교 전기전자컴퓨터공학부, 컴퓨터정보통신연구소) ;
  • 지덕구 (한국전자통신연구원 이동통신연구소) ;
  • 윤병식 (한국전자통신연구원 이동통신연구소) ;
  • 최송인 (한국전자통신연구원 이동통신연구소)
  • Published : 2003.07.01

Abstract

In this Paper, we designed an LSP(Line Spectral Pairs) parameter quantizer with cascaded structure of vector quantizer and scalar quantizer for the wideband speech coder. We have chosen the 16th-order of the LP coefficients. These coefficients are then transformed into the LSP parameters which have the excellent properties for quantization and easy stability checking condition of synthesis filter. In the first stage of quantization, input LSP parameters are split-vector-quantized using two 8-th order codebooks. In the second stage, the components of residual vector are individually quantized by the scalar quantizer utilizing the ordering property of LSP parameters. The designed adaptive VQ-SQ quantizer using 35 bits/frame shows the wideband transparency that the average spectral distortion should be less than 1.6 ㏈ and less than 4% of the frames should have SD above 3 ㏈. The simulation results show that the designed quantizer provides a 2-3 bits/frame saving over the typical vector-scalar quantizer.

본 논문에서는 광대역 음성 부호화기를 위한 VQ-SQ 구조의 LSP(Line Spectral Pairs) 파라미터 양자화기를 설계하였다. 16차 LPC(Linear Prediction Coefficients) 계수를 사용하며, 양자화 특성이 좋고 합성필터의 안정성의 조건을 검사하기 쉬운 LSP 파라미터로 변환/sup [2]/하여 양자화 한다. 설계된 VQ-SQ 양자화기는 첫 번째 단에서 2단 SVQ(Split VQ)로 각각 8차씩 양자화한 뒤, 두 번째 단에서 순서화 특성(OP Ordering Property)을 적용한 SQ를 사용하여 잔여신호(Residual Signal)를 양자화하는 구조로 되어있다. VQ-SQ결합 양자화기의 전체적인 성능개선을 위해 백터 양자화기에서 하나의 최적 벡터를 찾지 않고 5개의 후보백터를 가지고 스칼라 양자화를 수행한 후, 전체적으로 본래의 LSP 파라미터에 가장 가까운 벡터 양자화기 인덱스와 스칼라 양자화기의 인덱스를 결정한다. 순서화 특성을 고려하여 설계된 적응 VQ-SQ 양자화기는 LSP 파라미터에 총 35비트를 할당하여 광대역 명료도(Wideband Transparency)인 평균 1.6㏈ 이하의 스펙트럼 왜곡(SD : Spectral Distortion)과 4%미만의 3㏈가 넘는 프레임의 비율/sup [1]/을 만족하였으며, 기존의 VQ-SQ 양자화기보다 2-3비트를 절약할 수 있었다.

Keywords

References

  1. M. Ferhaoui and S. Van Gerven, 'LSP quantization in wideband speech coders,' IEEE Workshop on Speech Coding Processing, pp. 25-27, 1999 https://doi.org/10.1109/SCFT.1999.781472
  2. F. K. Soong and B. H. Juang, 'Line Spectrum and Speech Data Compression,' Proc. IEEE Int. Conf. Acous., Speech Signal Processing, pp. 1.10.1-1.10.4, 1984
  3. K. Paliwal and B. Atal, 'Efficient vector quantization of LPC parameters at 24 bits/frame', IEEE Trans. Speech and Audio Proc., Vol. 1, No. 1, pp. 3-14, Jan. 1993 https://doi.org/10.1109/89.221363
  4. W. LeBlanc, B. Bhattacharya, S. Mahmoud, and V. Cuperman, 'Efficient search and design procedures for robust multi-stage VQ of LPC parameters for 4kb/s speech coding', IEEE Trans. Speech and Audio Proc., Vol. 1, No. 4, pp. 373-385, Oct. 1993 https://doi.org/10.1109/89.242483
  5. J. Grass and P. Kabal, 'Method of improving vector-scalar quantization of LPC coefficients,' in Proc. IEEE Int. Conf. Acoust., Speech Signal Processing, pp. 657-660, April. 1991 https://doi.org/10.1109/ICASSP.1991.150425
  6. T. Miyano, M. Serizawa, J. Takizawa, S. Ikeda, and K. Ozawa, 'Improved 4.8 kb/s CELP coding using two-stage vector quantization with multiple candidates (LCELP),' in Proc. IEEE Int. Conf. Acoust., Speech sig. Processing, pp. I-321-I-324, 1992 https://doi.org/10.1109/ICASSP.1992.225907
  7. N. Sugamura and N. Farvardin, 'Quantizer design in LSP speech analysis-synthesis,' IEEE J. Selected Areas in Commun., Vol. 6, No. 2, pp. 432-440, Feb. 1988 https://doi.org/10.1109/49.618
  8. Y. Linde, A. Buzo, and R. M. Gray, 'An algorithm for vector quantizer design,' IEEE Trans. Commun., Vol. COM-28, No. 1, pp. 84-95, Jan. 1980
  9. Insung Lee and Hong Chae Woo, 'Encoding of Speech Spectral Parameters Using Adaptive Quantization Range Method', ETRI Journal, Vol. 23, No. 1, pp. 16-22, Mar. 2001 https://doi.org/10.4218/etrij.01.0101.0103