Implementation of Internet Terminal using G.729.1 Wideband Speech Codec for Next Generation Network

차세대 통신망을 위한 G.729.1 광대역 음성 코덱을 활용한 인터넷 단말 구현

  • 소운섭 (한국전자통신연구원 멀티미디어통신연구팀) ;
  • 김대영 (충남대학교 전자전파정보통신공학과)
  • Published : 2008.10.30

Abstract

Tn this paper we described the process and the results of an implementation of Internet terminal using G.729.1 wideband speech codec for next generation network. For this purpose firstly we chose a high performance RISC application processor having DSP features for speech codec processing and enhanced Multimedia Accelerator(eMMA) function for video codec. In the implementation of this terminal, we used G.729.1 codec recently standardized in ITU-T which is a new scalable speech and audio codec that extends 0.729 speech coding standard. To adopt G.729.1 codec to this terminal we transformed most of the fixed point C codes which require more complexity into assembly codes so as to minimize processing time in the processor. As a result of this work we reduced the execution time of the original C codes about 80% and operated in real time on the terminal. For video we used H.263/MPEG-4 codec which is supported by the eMMA with hardware in the processor. In the SIP call processing test connected to real network we obtained under looms end-to-end delay and 3.8 MOS value measured with PESQ instrument. Besides this terminal operated well with commercial terminals.

본 논문에서는 차세대 통신망을 위한 G.729.1 광대역 음성 코덱을 활용한 인터넷 단말을 구현한 절차와 결과에 대해 기술하였다. 이러한 목적을 이루기 위해 먼저 음성 코덱 처리를 위한 DSP 기능을 가지며, 비디오 코덱 처리를 위한 향상된 멀티미디어 가속기 기능을 가진 고성능 RISC 응용 프로세서를 선택하였다. 단말 구현에 사용한 G.729.1 광대역 음성 코덱은 ITU-T에서 최근 표준화 된 것으로 G.729 음성 코덱 표준을 확장한 새로운 스케일러블 음성 및 오디오 코덱이다. G.729.1 코덱의 프로세서에서 처리 시간을 줄이고, 단말에 적용하기 위해 계산량이 많이 필요한 부분의 고정 소수점 C 코드를 어셈블리 언어로 변환하였다. 그 결과 원시 C 코드의 실행 시간을 약 80% 줄여서 단말에서 실시간으로 동작시켰다. 비디오 코덱은 프로세서의 eMMA 하드웨어에서 지원되는 H.263/MPEG-4 코덱을 사용하였다. 실제 망에 접속판 SIP 호 처리 시험에서 단 대 단 지연은 100ms 이하이고, PESQ 장비로 측정한 MOS 값은 평균 3.8 이었으며, 상용 단말들과의 연동 시험에서도 정상적으로 동작하였다.

Keywords

References

  1. 김도영, 김영선, '인터넷 전화 기술현황 및 전망', 한국통신학회지 제21권 4호, pp.170-179, 2004년 4월
  2. ITU-T Rec. G.729.1, 'An 8-32kbit/s scalable wi-deband coder bitstream interoperable with G.729', May 1995
  3. ITU-T Rec. H.263, 'Video coding for low bit rate communication', Jan. 2005
  4. MC9328MX21DS, Freescale Semiconductor, Data Sheet, http://www.freescale.com
  5. http://www.arm.com/products/CPUs/ ARM926EJ-S.html
  6. ITU-T Rec. G.729, 'Coding of speech at 8 kb/s using conjugate-structure algebraic code-excited linear prediction (CS- ACELP),' June 1995
  7. Hedley Francis, 'ARM DSP-Enhanced Extensions', ARM White Paper, May 2001
  8. GNU gprof, http://www.cs.utah.edu/dept/old/ textinfo/as/gprof.html
  9. ARM Developer Suite Version 1.2 - Linker and Utilities Guide, Chapter 8 : Using the ARM Profiler
  10. ARM Ltd., ARM Developer Suite Version 1.2-CodeWarrior IDE Guide, March 2003
  11. http://www.dsprelated.com/groups/speechcoding/ show/940.php
  12. 소운섭, 황인기, 구기종, 김대호, 김도영, 김대영, 'G.729.1 광대역 음성 코덱을 응용한 MoIP 단말 구현', 제9회 전자정보통신 학술대회, 2007 년 11월
  13. IETF Rec. RFC 3261, 'SIP: Session Initiation Protocol', June 2002
  14. IETF Rec. RFC 4566, 'SDP: Session Description Protocol', July 2006
  15. IETF Rec. RFC 3550, 'RTP: A Transport Protocol for Real-Time Applications', July 2003
  16. The boot loader, blob (Boot Loader OBject), http://www.lartmaker.nl/lartware/blob/
  17. PESQ-Perceptual Evaluation of Speech Quality, http://www.opticom.de/download/ SpecSheet_PESQ_ 05-11-14.pdf