The Performance Improvement of PLC by Using RTP Extension Header Data for Consecutive Frame Loss Condition in CELP Type Vocoder

CELP Type Vocoder에서 RTP 확장 헤더 데이터를 이용한 연속적인 프레임 손실에 대한 PLC 성능개선

  • 홍성훈 (숭실대학교 정보통신공학과) ;
  • 배명진 (숭실대학교 정보통신공학과)
  • Published : 2010.01.31

Abstract

It has a falling off in speech quality, especially when consecutive packet loss occurs, even if a vocoder implemented in the packet network has its own packet loss concealment (PLC) algorithm. PLC algorithm is divided into transmitter and receiver algorithm. Algorithm in the transmitter gives superior quality by additional information. however it is impossible to provide mutual compatibility and it occurs extra delay and transmission rate. The method applied in the receiver does not require additional delay. However, it sets limits to improve the speech quality. In this paper, we propose a new method that puts extra information for PLC in a part of Extension Header Data which is not used in RTP Header. It can solve the problem and obtain enhanced speech quality. There is no extra delay occurred by the proposed algorithm because there is a jitter buffer to adjust network delay in a receiver. Extra information, 16 bits each frame for G.729 PLC, is allocated for MA filter index in LP synthesis, excitation signal, excitation signal gain and residual gain reconstruction. It is because a transmitter sends speech data each 20 ms when it transfers RTP payload. As a result, the proposed method shows superior performance about 13.5%.

패킷네트워크에서 사용하는 음성부호화기는 자체적으로 PLC (Packet Loss Concealment) 알고리즘을 사용하고 있지만 서비스에 적합할 만큼 좋지 않다. 더욱이 연속적인 패킷 손실에 대해서는 많이 취약하다. PLC 알고리즘은 크게 송신단 기반의 알고리즘과 수신단 기반의 알고리즘으로 나뉜다. 송신단 기반의 알고리즘은 추가정보를 전송하기 때문에 음질개선에 큰 성능을 갖는 반면 데이터 전송율이 높아지고 추가 지연이 발생하며 상호간의 호환이 불가능하다. 수신단 기반의 알고리즘은 수신된 데이터에 기반하기 때문에 추가지연이나 정보가 필요 없으나 음질개선에 한계가 있다. 본 논문에서는 RTP 헤더 정보 중 사용하지 않는 확장 헤더 데이터 (Extension Header Data: 32 bit)부분에 PLC를 위한 추가정보를 전송하는 방법을 제안한다. 이렇게 함으로써 송신단 기반의 알고리즘이 갖는 호환성 문제를 해결하고 음질 개선 성능을 향상 시킬 수 있다. 추가적으로 발생하는 지연 (delay)는 이미 수신단에서 네트워크상의 지연을 조정하기 위해 지터 버퍼 (jitter buffer)를 갖고 있기 때문에 제안하는 알고리즘으로 인해 발생하는 추가 지연은 없다. G.729 PLC를 위한 추가 정보는 LP 파라미터 합성용 MA필터 인덱스, 여기신호, 여기신호 이득 및 잔여신호 이득 파라미터로 프레임당 16 bit를 할당한다. 이는 RTP payload 전송 시 음성 데이터를 두 프레임인 20 ms 단위로 전송하기 때문이다. 성능 평가 결과 기존 대비 13.5%의 성능 향상을 보였다.

Keywords

References

  1. J. Bolot and A. Vega Garcia, "Control Mechanisms for Packet Audio in the Internet." in Proceeding of IEEE INFOCOM, vol,1. no.1 pp. 232-239, March 1996.
  2. C. Perkins, O. Hodsom and V. Hardman. "A Survey of Packet Loss Recovery Techniques for streaming Audio," IEEE Network. Vol. 12, no. 5. pp,40-48, Sep, 1998. https://doi.org/10.1109/65.730750
  3. C. Romer, M. Podolsky and S. McCanne, "Simulation of FEC-vased error control for Packet Audio on the Internet," in Proceedings of IEEE INFOCOM, vol.2, no.1, pp. 505-515, April. 1998.
  4. T. J. Kostas. et al, "Real-time voice over packet-switched networks," IEEE Network, vol. 12. no.1. pp. 18-27, Jan.-Feb. 1998 https://doi.org/10.1109/65.660003
  5. J. C. Bolot, et al, "Adaptive FEC-based Error Control for Internet Telephony," Proceeding INFOCOM 99, vol. 3, pp, 21-25, March 1999.
  6. ITU-T Rec. G.711 Appendix I, A high quality low-complexity algorithm for packet loss concealment with G.711, Sep. 1999.
  7. ITU-T Rec. G.729, Coding of speech at 8kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS- ACELP), March. 1996
  8. ITU-T Rec. G.723.1, Dual rate speech coder for multimedia communication transmitting at 5.3 and 6.3 kbit/s, Mar. 1996
  9. ETSI TS 126.091, AMR speech Codec; Error concealment of lost frames, 2009-01
  10. 홍성훈, 김종국, 배명진, "VolP 시스템의 음질개선," 2009년도 음향학회 음성통신 및 신호처리 학술대회 논문집, 26권 1호 pp.49-52
  11. VolP 음성 품질 평가 항목, 하나로델레콤, 2007
  12. 윤성완, 강홍구, 윤대희. "음성신호의 특성을 고려한 패킷 손실 은닉 알고리즘," 한국통신학회 논문지 Vol.31, No.7c, 2006년 7월
  13. N. Kitawaki and K. Itoh, "Pure Delay Effects on Speech Quality in Telecommunications," IEEE Journal on Selected Areas in Communication, Vol.9, No.4, pp. 586-593, May 1991 https://doi.org/10.1109/49.81952