G.729A와 SMV 음성부호화기를 위한 파라미터 직접 변환 방식의 상호부호화 알고리듬

Transcoding Algorithm for SMV and G.729A Vocoders via Direct Parameter Transformation

  • 장달원 (한국과학기술원 전자전산학과) ;
  • 서성호 (한국과학기술원 전자전산학과) ;
  • 이선일 (한국과학기술원 전자전산학과) ;
  • 유창동 (한국과학기술원 전자전산학과)
  • 발행 : 2003.11.01

초록

본 논문에서는 G.729A와 SMV 음성부호화기를 위한 새로운 파라미터 직접 변환 방식의 상호부호화 알고리듬을 제안한다. 상호부호화를 위하여 부가적인 복호화, 부호화 과정을 거쳐야하는 기존의 Tandem 방식과 달리 제안된 파라미터 직접 변환 방식에서는 양 음성부호화기가 음성을 부호화하기 위하여 공통적으로 사용하는 파라미터들이 직접 변환된다. SMV 에서 G.729A로의 트랜스코딩에서는 LSP 변환, 피치 지연 변환, 낮은 전송률에서의 트랜스코딩 등의 알고리듬을 제안하고, G.729A에서 SMV로의 트랜스코더에서는 LSP 변환, 피치 지연 변환, 전송률 결정 등의 알고리듬을 제안한다 제안된 알고리듬을 다양한 방법으로 평가해본 결과 기존의 Tandem 방식과 비교하여 계산량과 지연 시간을 줄이면서도 동등한 음질 또는 향상된 음질을 구현함을 확인할 수 있었다.

In this paper, a novel transcoding algorithm for the G.729A and the Selectable Mode Vocoder(SMV) vocoders via direct parameter transformation is proposed. In contrast to the conventional tandem transcoding algorithm, the proposed algorithm converts the parameters of one coder to the other without going through the decoding and encoding processes. In transcoder from SMV to G.729A, LSP conversion algorithm, pitch delay conversion algorithm and transcoding algorithm in lower rate are proposed, and in transcoder from G.729A to SMV, LSP conversion algorithm, pitch delay conversion algorithm and rate selection algorithm are proposed. Evaluation results show that while exhibiting better computational and delay characteristics, the proposed algorithm produces equivalent or Improved speech quality to that produced by the tandem transcoding algorithm.

키워드

참고문헌

  1. ITU- T Rec. G.711, Pulse code modulation of voice frequencies, 1988
  2. ITU-T Rec. G.723.1, Dual-rate Speech Codec for Multimedia Communications Transmitting at 5.3 and 6.3 kbit/s, 1996
  3. ITU-T Rec. G.729 Annex A, Reduced Complexity 8 kbit/s CS-ACELP Speech Codec, 1996
  4. 3GPP TS 26.071 V5.0.0, AMR Speech CODEC; General Description, Jun., 2002
  5. TIA/EIA/IS-127, Enhanced variable rate codec, speech service option 3 for wideband spread spectrum digital systems, 1997
  6. ITU- T Rec. G.729, Coding of Speech at 8 kbit/s Using Conjugate-Structure Algebraic-Code-ExcitedLinear-Prediction(CD_ACELP), 1996
  7. 3GPP2 C.S0030-0 V2.0, Selectable Mode Vocoder Service Option for Wideband Spread Spectrum Communication System, 2001
  8. Yang Gao, E. Shlomot, A. Benyassine, J. Thyssen, Hyun-yu Su and C. Murgia, 'The SMV Algorithm Selected by TIA and 3GPP2 for CDMA Applications', In Proc. ICASSP 2001, vol.2, pp 689-692, 1991 https://doi.org/10.1109/ICASSP.2001.941013
  9. Yang Gao, A. Benyassine, J. Thyssen, Hyun-yu Su and E. Shlomot, 'EX-CELP : A Speech Coding Paradigm', In Proc. ICASSP 2001, vol.2, pp 689-692, 1991 https://doi.org/10.1109/ICASSP.2001.941008
  10. W.B. Kleijn, 'Analysis-by-Synthesis Speech Coding Based on Relaxed Waveform-Matching Constraints,' Ph.D. dissertation, Delft University of Technology, 1991
  11. Manfred R. Schroeder, Bishnu S. Atal, 'Code Excited Linear Prediction(CELP): High-Quality Speech at Very Low Bit Rates,' Proc. Of ICASSP, pp. 937-940, 1985 https://doi.org/10.1109/ICASSP.1985.1168147
  12. ITU-T Rec. P.862, Perceptual evaluation of speech quality(PESQ), an objective method for end-to-end speech quality assessment of narrowband telephone networks and speech codecs, 2000
  13. F.K. Soong, B.H. Juang, 'Line Spectrum Pair(LSP) and speech data compression,' Proc. of ICASSP, pp. 1.10.1-1.10.4, 1984
  14. Hong-Goo Kang, Hong-Kook Kim, R. V. Cox, 'Improving transcoding capability of speech coders in clean and frame erasured channel environments,' Proc. of IEEE Workshop on Speech Coding, pp. 78-80, Jan., 2000 https://doi.org/10.1109/SCFT.2000.878403
  15. 이선일, 유창동, 'AMR과 EVRC 음성 부호화기간의 비탠텀 방식을 이용한 상호 부호화,' 한국음향학회지, 제 21권, 제 6호, pp. 531-542, 2002
  16. Kyung Tae Kim, Sung Kyo Jung, Young Cheol Park, Yong Sao Choi, Dae Hee Youn, 'An efficient transcoding algorithm for G.723.1 and EVRC speech coders,' Proc. of 54th IEEE VTC, vol. 3, pp. 1561-1564, 2001 https://doi.org/10.1109/VTC.2001.956460
  17. 윤성완, 정성교, 박영철, 윤대희, '8kbps G.729A에서 5.3 kbps G.723.1로의 상호 부호화 알고리듬,' 신호처리 합동 학술대회 논문집 제 13권, 제 1호, pp. 832-826, 2000
  18. Qualcomm Inc., CELP-based to CELP-based vocoder packet translation, US Patent no. US6260009B1, Jul., 2001