DOI QR코드

DOI QR Code

Method of Harmonic Magnitude Quantization for Harmonic Coder Using the Straight Line and DCT (Discrete Cosine Transform)

하모닉 코더를 위한 직선과 이산코사인변환 (DCT)을 이용한 하모닉 크기값 (Magnitude) 양자화 기법

  • Published : 2008.05.31

Abstract

This paper presents a method of quantization to extract quantization parameters using the straight-line and DCT (Discrete Cosine Transform) for two splited frequency bands. As the number of harmonic is variable frame to frame, harmonics in low frequency band is oversampled to fix the dimension and straight-lines present a spectral envelope, then the discontinuous points of straight-lines in low frequency is sent to quantizer. Thus, extraction of quantization parameters using the straight-line provides a fixed dimension. Harmonics in high frequency use variable DCT to obtain quantization parameters and this paper proposes a method of quantization combining the straight-line with DCT. The measurement (If proposed method of quantization uses spectral distortion (SD) for spectral magnitudes. As a result, The proposed method of quantization improved 0.3dB in term of SD better than HVXC.

본 논문은 음성신호의 주파수를 반으로 나누어 양자화 계수 추출에 직선과 DCT (Discrete Cosine Transform)를 혼합하여 사용한 양자화 기법을 제안한다. 하모닉 부호화기에서의 하모닉은 가변이므로 저주파에서의 하모닉만을 오버샘플링하여 차원을 고정한다. 고정된 차원의 스펙트럼 포락선을 직선으로 표현한 후 직선이 불연속인 주파수에서의 샘플값만을 전송한다. 이 논문에서는 저주파에서의 하모닉은 복원을 위해 고정된 직선의 계수를 사용하였고 고주파에서의 하모닉은 가변 DCT를 적용하여 직선과 DCT가 격합된 형태의 양자화기법을 제안한다. 제안된 양자화 기법의 성능평가는 스펙트럴의 크기값에 대한 Spectral Distortion (SD)값을 사용하였다. 실험결과 HVXC보다 제안된 양자화 기법의 SD가 0.3dB 정도 개선되었다.

Keywords

References

  1. M. Nishiguchi, "Weighted vector quantization of harmonic spectral magnitudes for very low-bit-rate speech coding," Acoust. Sci. & Tech, 27, 43-49, 2006 https://doi.org/10.1250/ast.27.43
  2. Wai C. Chu, "Vector Quantization of Harmonic Magnitudes in Speech coding Applications-A Survey and New Technique," EURASIP Journal on Applied Signal Processing 2004:17, 2601-2613, 2004 https://doi.org/10.1155/S1110865704407161
  3. C. Li, P. Lupini, E. Shlomot, and V.Cuperman, "Coding of variable dimension speech spectral vectors using weighted nonsquare transform vector quantization," IEEE Trans. Speech, and Audio Processing, 9(6), 622-631, 2001 https://doi.org/10.1109/89.943340
  4. P.Lupini and V.Cuperman, "Nonsquare transform vector quantization," IEEE Signal Processing Letters, 3(1), 1-3, 1996 https://doi.org/10.1109/97.475819
  5. E. Shlomot, V. Cuperman, A. Gersho, "Combined harmonic and waveform coding of speech at low bit rates", ICASSP' 98, 585-588
  6. 신경진, 이인성,"효율적인 가변차원 하모닉 크기 양자화기법", 한국 학회지 20(7) 47-54, 2001
  7. 안영욱, 정규혁, 김종학, 양용호, 이인성,"정현파 모델 부호화기를 위한 MP (Matching Pursuit) 알고리즘과 파라미터 양자화기", 음향학회지 24(7), 402-409, 2005
  8. 정규혁, 김종학, 임정우, 주기호, 이인성, "Damping 요소를 첨가한 매칭 퍼슈잇 정현파 모델링," 전자공학회 논문지 44(1), 105-113, 2007
  9. $^{\ast}0.8^{\ast}$ 1.2Vorbis I specification, Xiph.org Foundation, pp.37-38, http://xiph.org/vorbis/doc/
  10. A. V. McCree and T. P. Barnwell III, ''A mixed excitation LPC vocoder model for low bit rate speech coding,'' IEEE Trans. Speech Audio Process., 3, 242-50, 1995 https://doi.org/10.1109/89.397089
  11. W. B. Kleijn and J. Haagen, "A speech coder based on decomposition of characteristic waveforms," Proc. ICASSP 95, I-508-11, 1995
  12. M. Nishiguchi, K. Iijima and J. Matsumoto, "Harmonic vector excitation coding of speech at 2.0 kbps," IEEE Workshop on Speech Coding, 1997