1차원 SPIHT를 이용한 가변 비트율 음성 부호기의 설계

Design of a Variable Bit Rate Speech Coder Based on One-dimensional SPIHT

  • 나훈 (한국항공대학교 항공전자공학과) ;
  • 정대권 (한국항공대학교 항공전자공학과)
  • 발행 : 2003.08.01

초록

코드북 기반의 CELP 부호기는 코드북에 미리 할당된 부호화 비트율에 따라서 여기 신호를 모델링한 후 코드북을 이용하여 음성신호를 합성한다. 따라서 임의의 다양한 비트율을 하나의 부호기에서 지원하지 못하는 단점이 있다. 본 논문에서 제안하는 가변 비트율 부호기는 웨이블렛 변환 (wavelet transform과 1차원 SPIHr (one dimensional SPIHT)를 이용하여 현재 프레임에 할당되는 비트수에 따라서 여기신호를 부호화한다. 또한 CELP 부호기의 경우처럼 특정한 몇 가지 형태로 여기신호(또는 코드북)를 모델링할 필요가 없고, 정확한 피치정보가 없어도 여기신호를 사용자의 요구에 따라 다양한 비트율로 부호화할 수 있다. 그 결과 코드북이 존재하지 않기 때문에 부호기의 복잡도가 낮으며, CELP 기반의 G.729와 G.723.1 부호기와의 음질 비교 결과 동등하거나 나은 결과를 보여준다.

Since a codebook-based CELP coder models its excitation signal according to one of several bit rates pre-assigned to codebooks and synthesizes speech signal using codebooks, it can not support encoding of speech signal at an arbitrary bit rate in one encoder. The proposed variable bit rate speech coder encodes the excitation signal based on the bit rate assigned to a present frame of speech using one-dimensional SPIHT and wavelet transform. Also it does't need to model excitation signal (or codebook) to some types as CELP coder, and can encode excitation signal at various bit rates without exact pitch information according to user requirement. As a result, since the coder doesn't have a codebook structure, it has relatively low coder complexity and provides equal or better speech quality compared to G.729 and G.723.1 coder.

키워드

참고문헌

  1. Digital Signal Processing of Speech Signal L.R.Rabiner;R.W.Schafer
  2. Digital Speech A.M.Kondoz
  3. 전자공학회지 v.20 no.5 음성 분석, 모델링 안수길
  4. 음성의 분석 및 합성과 그 응용 박경범
  5. ISO/IEC 144963-3 Subpart 2 Parametric coding
  6. IEEE Trans. on Acoust. Speech and Signal Process v.36 no.8 Mutiband excitation vocoder D.W.Griffin;J.S.Lim https://doi.org/10.1109/29.1651
  7. IMBE Vocoder Description Digital Voice Systems Inc.
  8. Digital Image Processing K.R.Castleman
  9. Wavelet Theory and Its Applications R.K.Young
  10. Introduction to Wavelets and Wavelet Transforms C.S.Burrus;R.A.Gopinath;H.Guo
  11. Wavelet Transforms R.M.Rao;A.S.Bopardikar
  12. Proc. of ICASSP A comparison of a wavelet functions for pitch detection of speech signals S.Kadambe;G.F.Boudreaux-Bartels
  13. IEEE Trans. on Information theory v.38 no.2 Application of the wavelet translation for pitch detection of speech signals S.Kadambe;G.F.Boudreaux-Bartels https://doi.org/10.1109/18.119752
  14. IEEE Trans. on Signal Processing. v.41 no.12 Embedded image coding using zerotrees of wavelet coefficients J.M.Shapiro https://doi.org/10.1109/78.258085
  15. IEEE Trans. on Circuits and Systems for Video Technology v.6 A new fast efficeint image codec based on set partitioning in hierarchical trees A.Said;W.A.Pearlman https://doi.org/10.1109/76.499834
  16. ITU-T Recommendation G.723.1 Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s
  17. ITU-T Recommendation G.729 Coding of speech at 8 kbit/s using CS-ACELP
  18. 한국음향학회지 v.20 no.3 개량형 다중대역 여기 음성부호기의 피치 예측 개선 나훈;정대권