DOI QR코드

DOI QR Code

Developing a Low Power BWE Technique Based on the AMR Coder

AMR 기반 저 전력 인공 대역 확장 기술 개발

  • 구본강 (한양대학교 전자전기제어계측공학과) ;
  • 박희완 (한양대학교 전자전기제어계측공학과) ;
  • 주연재 (한양대학교 전자전기제어계측공학과) ;
  • 강상원 (한양대학교 전자전기제어계측공학과)
  • Received : 2011.02.28
  • Accepted : 2011.05.09
  • Published : 2011.05.31

Abstract

Bandwidth extension is a technique to improve speech quality and intelligibility, extending from 300-3400 Hz narrowband speech to 50-7000 Hz wideband speech. This paper designs an artificial bandwidth extension (ABE) module embedded in the AMR (adaptive multi-rate) decoder, reducing LPC/LSP analysis and algorithm delay of the ABE module. We also introduce a fast search codebook mapping method for ABE, and design a low power BWE technique based on the AMR decoder. The proposed ABE method reduces the computational complexity and the algorithm delay, respectively, by 28 % and 20 msec, compared to the traditional DTE (decode then extend) method. We also introduce a weighted classified codebook mapping method for constructing the spectral envelope of the wideband speech signal.

대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

Keywords

References

  1. ITU-T Rec. G.722, Performance characteristics of PCM channels between 4-wire interfaces at voice frequencies, 1988.
  2. Peter Jax and Peter Vary, "On Artificial Bandwidth Extension of Telephone Speech," SIGNAL PROCESSING, vol. 83, no. 8, pp. 1707-1719, August, 2003. https://doi.org/10.1016/S0165-1684(03)00082-3
  3. P. Noll, "Wideband speech and audio coding," IEEE Communications Magazine, pp. 34-44, Nov.,1993.
  4. G. Fant, "Acoustics theory of speech production," The hague, The Netherlands: Mouton, 1960.
  5. U. Kornagel, "Techniques for artificial bandwidth extension of telephone speech," Signal Processing, vol. 86, no. 6, pp 1276-1306, 2006.
  6. K. Park and H. Kim, "Narrowband to wideband conversion of speech using GMM based transformation," proc. ICASSP, pp. 1843-1846, 2000.
  7. J. Marhoul and M. Berouti, "High-frequency regeneration in speech coding systems," proc. ICASSP, vol. 4, pp. 428-431, 1979.
  8. R. Laroia, N. Phamdo, N. Farvardin, "Robust and efficient quantization of speech LSP parameters using structured vector quantizers," ICASSP-91, pp. 641-644, vol. 1, 1991.
  9. S. Kang, Y. Shin, C. Son, and T. R. Fischer, "A Fast Encoding Technique for Vector Quantization of LSP Parameters," IEICE Trans. on commu., vol. E88-B, no. 9, pp. 3750-3755, Sept. 2005. https://doi.org/10.1093/ietcom/e88-b.9.3750