DOI QR코드

DOI QR Code

정규화 코드북을 이용한 분할 벡터 구조의 ISF 적응적 양자화 기법

A Method of Adaptive ISF Split Vector Quantization Using Normalized Codebook

  • 박지강 (충북대학교 전파통신공학과) ;
  • 임종하 (충북대학교 전파통신공학과) ;
  • 홍기봉 (충북대학교 전파통신공학과) ;
  • 이인성 (충북대학교 전파통신공학과)
  • 투고 : 2011.01.28
  • 심사 : 2011.05.31
  • 발행 : 2011.07.31

초록

본 논문에서는 ISF 계수의 순서화 성질을 이용하여 광대역 음성부화기의 분할구조 벡터양자화기의 단점을 보완함으로써 ISF 계수 양자화의 성능을 개선하는 알고리즘을 제안한다. 음성 부호화기의 ISF 벡터양자화기는 계산량과 메모리 수요량을 줄이기 위하여 벡터분할 구조를 사용한다. 이러한 벡터 분할구조의 양자화기는 분할된 벡터 사이의 상관도를 이용하지 못하였다. 제안하는 알고리즘은 ISF 계수의 순서화 특징을 이용하여 정규화 코드북을 만든다. 그리고 양자화 된 분할 벡터로 정규화 코드북의 분포범위를 적응적으로 변화시킴으로써 양자화 하여야 할 분할 벡터의 코드북을 효율적으로 만들어 준다. 제안된 알고리즘은 분할 벡터사이의 저하된 상관도를 순서화 특징을 통하여 다시 이용하는 방법으로 표준화 코덱인 AMR-WB의 ISF 양자화기에 적용하여 1.5 bit정도의 성능 개선을 얻었다.

In most of the ISF (or LSF) based real time speech codec, SVQ (split vector quantization) method is used to decrease the quantizer complexity and memory size of codebook. However, it produces drawback that the level of correlation between code vectors can not be used during vector splits. This paper presents a new method of adaptive ISF vector quantization, which compensates the drawbacks of SVQ structured quantizer for wideband speech codec. In each different frame, the proposed method makes use of the correlation between splitted vectors by adaptively changing codebook distribution according to ordering property of ISF. The algorithm is evaluated in AMR-WB, and shows about 1.5 bit per frame improvement.

키워드

참고문헌

  1. O'Shaughness, D., "Linear predictive coding", IEEE Potentials vol. 7, pp. 29-32, Feb. 1988. https://doi.org/10.1109/45.1890
  2. Makhoul J. (1975) Linear Prediction: A Tutorial Review. Proceedings of the IEEE. vol. 63, pp. 561-579. https://doi.org/10.1109/PROC.1975.9792
  3. A.M.Kondoz, "Digital Speech", pp. 106-107.
  4. F. Itakura, "Line spectrum representation of linear predictive coefficients of speech signals," J.Acoust. Soc. Am, vol. 57, no. 535(A), 1975.
  5. Y. Bistritz and S. Pellerm, "Immittance spectral pairs (ISP) for speech encoding", in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing, 1993.
  6. ITU-T Rec. G.729, "Coding of Speech at 8 kbit/s using Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP)," March 1996.
  7. ITU-T Rec. G.729.1, "An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729," May 2006.
  8. B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola- Pukkila, J. Vainio, H.Mikkola, K. Jarvinen, "The adaptive mulitirate wideband speech codec (AMR-WB)." IEEE Trans. Speech Audio Processing. vol. 10, no. 8, Nov. 2002.
  9. ITU-T Rec. G.718 "Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kb/s," Jun. 2008.
  10. Paliwal K.K and Atal B.S.,"Efficient vector quantization of LPC parameters at 24 bit/frame", IEEE Trans. vol. 1, pp. 3-14, Jan. 1993.
  11. Linder,Y, Buzo,A.and Gray,R.,"An algorithm for vector quantizer design", IEEE Trans. vol. 28, pp. 84-95, Jan. 1980. https://doi.org/10.1109/TCOM.1980.1094577
  12. Moo Young Kim, Nam Kyu Ha, and Sang Ryong Ki, "Linked split-vector quantizer of LPC parameters," Proc. ICASSP 1996.
  13. Sangwon Kang, Changyong Son, Hosang Sung, "A fast-search algorithm for the predictive split VQ of LPC parameters", IEEE Communications Letters, vol. 5, no. 5, pp. 212-214, May 2001. https://doi.org/10.1109/4234.922763
  14. Jongha Lim, Gyu-Hyeok Jeong, Gibong Hong and Insung Lee, "적응적인 확장된 코드북을 이용한 분할 벡터 양자화기 구조의 ISF 양자화기 개선" 한국음향학회지 30권, 1호.