High-Band Codec for Bandwidth Scalable Wideband Speech Codec

대역폭 계층 구조의 광대역 음성 부호화기를 위한 상위 대역 부호화기 연구

  • 김영보 (광운대학교 전자공학과) ;
  • 정병학 (광운대학교 전자공학과) ;
  • 손창용 (삼성종합기술원 Computing Lab) ;
  • 성호상 (삼성종합기술원 Computing Lab) ;
  • 박호종 (광운대학교 전자공학과)
  • Published : 2005.10.01

Abstract

In this paper, the high-band codec for bandwidth scalable wideband speech codec is proposed. The wideband input speech signal is separated into low-band signal and high-band signal, and the low-band signal is encoded by the standard narrow-band speech codec and the high-band signal is encoded by the proposed codec. In the high-band codec. the signal is transformed into frequency domain by MLT on a subframe basis, and MLT coefficients are splitted into magnitude and sign for quantization. The magnitudes of MLT coefficients are arranged into several time-frequency bands and each band is quantized in 2D-DCT domain, where the low-band information is utilized for better performance. The sign of MLT coefficient is quantized based on a priority selection process with the weighting measurement. The objective and subjective performance of wideband speech codec including the proposed high-band codec is measured, and it is confirmed that the proposed codec has better performance than 32kbps G.722.1.

본 논문에서는 대역폭 계층 구조의 광대역 음성 부호화기를 위한 8kbps 상위 대역 부호화기를 제안한다. 광대역 입력 음성 신호는 하위 대역 신호와 상위 대역 신호로 분리되고, 하위 대역 신호는 표준 협대역 음성 부호화기로 처리하고, 상위 대역 신호는 제안하는 부호화기로 처리하는 구조를 가진다. 제안한 상위 대역 부호화기는 입력 신호를 부프레임 단위로 MLT 변환하고 MLT 계수를 크기와 부호로 분리하여 각각의 특성에 적합하도록 양자화 한다. MLT 계수 크기는 다수의 시간과 주파수 성분을 함께 가지는 밴드로 분할하고, 각 밴드 신호는 2차원 DCT 변환하여 양자화하며, 하위 대역의 에너지 정보를 이용하여 양자화 성능을 향상시킨다. MLT 계수 부호는 각각의 중요도를 판정하여 일부 부호만 선택적으로 양자화 하는 방법을 사용한다. 제안한 상위 대역 부호화기를 포함하는 19.8kbps 광대역 부호화기의 객관적 성능과 주관적 성능을 측정하였으며, 32kbps G.722.1보다 우수한 성능을 가지는 것을 확인하였다.

Keywords

References

  1. A. McCree, 'A 14kbps wideband speech coder with a parametric highband model:' Proc. IEEE ICASSP, 1153-1156,2000
  2. K. Koishida, V Cuperrnan and A. Gersho, 'A 16-kbit/s bandwidth scalable audio coder band on the G.729 standard:' Proc. IEEE ICASSP, 1149-1152, 2002
  3. Kyung Tae Kim, Sung Kyo .Jung, Young Cheol Park, and Dae Hee Youn, 'A new bandwidth scalable wideband speech/audio coder', Proc. IEEE ICASSP, 657-660, 2002
  4. 이우석, 박호종, 손창용, 이영범, '대역폭 계층 구조의 광대역 음성부호화기 개발,'한국음향학회지, 23 (6), 400-406, 2004. 8
  5. ITU-T Rec. G.729, 'Coding of speech at 8kbit/s using conjugate-structure algebraic- code-excited linearprediction(CS-ACELP):' 1996
  6. ITU- Rec. G. 722.1, 'Coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss,' 1999
  7. ITU-T Recommendation P.862. 'Perceptual evaluation of speech quality,' Version 1.2-2, August 2002