펄스위치 재검색 방법을 이용한 AMR-WB 여기 코드북 검색

AMR-WB Algebraic Codebook Search Method Using the Re-examination of Pulses Position

  • 허석 (충북대학교 전파공학과, 컴퓨터정보통신연구소) ;
  • 이인성 (충북대학교 전기전자컴퓨터공학부, 컴퓨터정보통신연구소) ;
  • 지덕구 (한국전자통신연구원 이동통신연구소) ;
  • 윤병식 (한국전자통신연구원 이동통신연구소) ;
  • 최송인 (한국전자통신연구원 이동통신연구소)
  • Hur, Seok (Dept. of Radio Science & Engineering Chungbuk National University) ;
  • Lee, In-Sung (School of Electrical & Computer Engineering Chungbuk National University) ;
  • Jee, Deock-Gu (Mobile Telecommunication Research Laboratory Electronics and Telecommunications Research Institute) ;
  • Yoon, Byung-Sik (Mobile Telecommunication Research Laboratory Electronics and Telecommunications Research Institute) ;
  • Choi, Song-In (Mobile Telecommunication Research Laboratory Electronics and Telecommunications Research Institute)
  • 발행 : 2003.07.01

초록

3GPP에서 광대역 음성부호화 알고리즘으로 채택한 AMR-WB 부호화기는 8개의 모드로 동작되고 전송률을 23.85 kbps 까지 높임에 따라 음성부호화기 프로그램 및 데이터 메모리 크기가 매우 크게 증가되었으며, 합성필터의 입력신호인 고정 코드북의 펄스 수가 기존의 협대역 AMR 부호화기 보다 5배 이상 증가함으로써 코드북 검색에 많은 계산량을 요구하고 있다. AMR-WB는 적당한 계산량에서 비교적 좋은 음질을 유지하기 위한 방법으로 depth-first 트리 검색 방법을 사용하고 있다. 본 논문에서는 여기코드북 검색시 레퍼런스 벡터를 중심으로 적당한 계산량을 갖는 검색 방법으로 검색시 기준이 되는 레퍼런스 벡터를 좀더 정확하게 예측하여 성능 향상을 하였으며, 펄스위치 재검색 알고리즘을 적용하여 depth-first 트리 검색방법의 문제점을 개선시켜 1/2 이상의 계산량을 줄이면서 같은 성능을 유지하는 AMR-WB 여기코드북 검색기를 설계하였다.

We propose a new method to reduce the complexity of excitation codebook search. The preselected excitation pulses by the coarse search method can be updated to pulses with higher quality performance measure. The excitation pulses can arbitrarily be deleted and inserted among the searched pulses until the overall performance achieves. If we use this excitation pulse search method in AMR-WB, the complexity required for excitation codebook search can be reduced to half the original method while the output speech maintains equal speech quality to a conventional method.

키워드

참고문헌

  1. ITU Radiocommunication Assembly, Document8/1045-E, 'Detailed Specifications of the Radio Interfaces of IMT-2000,' Document 8/126(Rev.1), April. 2000
  2. Boudreau, D., Caire,G., Corazza, G.E., De Gaudenzi, R., Gallinaro, G., Luglio, M., Lyons, R., Romero Garcia, J., Vernucci, A., Widmer, H. 'Wide-band CDMA for the UMTS/IMT-2000 satellite component', Vehicular Technology, IEEE Transactions on, vol. 51 pp. 306-331, March 2002 https://doi.org/10.1109/25.994808
  3. ISO/JTC1/CS29/WG1 N2203, 'Committee Draft Interantional standard of ISO/IEC 14496-3', 1998
  4. ISO/IEC JTC1/SC29/WG11 no.71, 'coding of Moving Pictures and Associated Audio for Digital Stroage Media at up to about 1.5 Mbit/s DC11172-3 (Part 3. MPEG Audio)'
  5. ETSI draft EN 301 704, 'Digital cellular telecommunication system;Adaptive Multi-Rate(AMR) speech transcoding'
  6. ITU-T Recommendation G.722.2, 'Wideband coding of speech at around 16kbit/s using adaptive multi-rate wideband(AMR-WB)', January 2002
  7. 3GPP TS 26.171, 'AMR Wideband Speech Codec ; General description'
  8. 3GPP TS 26.173, 'AMR Wideband Speech Codec ; ANSI-C code'
  9. Nam Kyu Ha, 'A fast search method of algebraic codebook by reordering search sequence,' Proc. in ICASSP, 1999 https://doi.org/10.1109/ICASSP.1999.758052
  10. Hochong Park, 'Efficient codebook search method ofr EVRC speech codec,' IEEE Signal Processing Letters, vol. 7, no. 1, 2000 https://doi.org/10.1109/97.809508
  11. ITU-T P.862 (2001), 'Perceptual evaluation of speech quality (PESQ) : An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs'