An Efficient Computation of FFT for MPEG/Audio Psycho-Acoustic Model

MPEG 심리음향모델의 고속 구현을 위한 효율적 FFT 연산

  • 송건호 (LG 전자기술원 모바일 멀티미디어 연구소) ;
  • 이근섭 (연세대학교 전기 전자공학과) ;
  • 박영철 (연세대학교 정보기술학부) ;
  • 윤대희 (연세대학교 전기 전자공학과)
  • Published : 2004.11.01

Abstract

In this paper, an efficient algorithm for computing in the MPEG/audio Layer Ⅲ (MP3) encoder is proposed. The proposed algerian performs a full-band 1024-point FFT by computing 32-point FFT's of 32 subband outputs. To reduce the aliasing caused by the analysis filter bank, an aliasing cancellation butterfly is developed. A major benefit of the proposed algorithm is the computational saving. By using the proposed algorithm, it is possible to save 40~50% of computations for FFT, which results in about 20% reduction of the PAM-2 complexity.

본 논문은 MPEG 오디오 부호화 과정 중 심리음향모델(PAM: Psychoacoustic Model)에 사용되는 FFT를 효율적으로 계산할 수 있는 방법을 제안한다. MPEG 오디오 부호화 과정 중 심리음향 모델 연산은 많은 연산량을 차지하며, 부호화의 실시간 및 저 전력 구현을 위해서는 이의 최적화가 요구된다. 최적화를 위하여 제안하는 알고리듬은 심리음향모델에서 사용하는 입력신호에 대한 1024-샘플 FFT 대신에 서브밴드과정에서 나온 각각의 32개의 밴드에 대하여 32-샘플 FFT를 함으로써 1024-샘플 FFT의 효과를 얻는데 있다. 이때 서브밴드과정을 거친 신호에 대한 FFT에는 에일리어징이 발생하며 이를 줄이기 위하여 버터플라이 구조의 에일리어징 제거블록을 제안한다. 제안한 알고리듬으로 심리음향모델을 구현할 경우 SMR이 약 1dB이내의 오차를 가지며, 기존 알고리듬에 비해 절반의 연산량으로 심리음향 모델을 위한 FFT 스펙트럼을 얻을 수 있다.

Keywords

References

  1. ISO/IEC IS 11172-3, 'Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s-Audio Part,' Nov. 1992
  2. P. Noll, 'MPEG Digital Audio Coding,' Signal Processing Magazine, IEEE, Vol: 14 Issue: 5, Sept. 1997 https://doi.org/10.1109/79.618009
  3. K. Brandenburg, G. stoll, 'ISO-MPEG-1 Audio: A Generic Standard for Coding of High-Quality Digital Audio,' J. Audio Eng. Soc., Vol.42, No.10, Oct. 1994
  4. Hyen-O Oh, J. S. Kim, C. H. Song, Y. C. Park, and D. H. Yoon, 'Low power MPEG/AUDIO encoders using simplified psychoacoustic model and fast bit allocation', Consumer Electronics, IEEE Transactions on , Vol: 47 Issue: 3 , Aug. 2001 Page(s): 613-621 https://doi.org/10.1109/30.964154
  5. B. Edler, 'Aliasing Reduction in Subbands of Cascaded Filter Banks with Decimation', Electronics Letters, Vol.28, No.12, pp 1104-1105, June 1992 https://doi.org/10.1049/el:19920697
  6. Chi-Min Liu, Wen-Chieh Lee, 'The Design of A Hybrid Filter Bank for The Psychoacoustic Model in ISO/MPEG Phases 1, 2 Audio Encor', IEEE Transactions on Consumer Electronics, Vol.43, No.3, Aug. 1997 https://doi.org/10.1109/30.628680
  7. P.P. Vaidyanathan, 'MULTIRATE SYSTEMS AND FILTER BANKS,' Prentice Hall Inc., 1993
  8. Davis Pan, 'A Tutorial on MPEG/Audio Comession,' IEEE Multimedia , Vol. 2 Issue. 2, pp 60-74, Summer 1995 https://doi.org/10.1109/93.388209
  9. J. H. Rothweiler, 'Polyphase Quadrature Filters A New Subband Coding Technique,' in Proc. Int. Conf. IEEE ASSP. pp1280-1283
  10. John G. Proakis, D. G. Manolakis, 'DIGITAL SIGNAL PROCESSING,' Prentice Hall Inc., 1996
  11. Rec. ITU-R BS.1116-1, 'METHODS FOR THE SUBJECTIVE ASSESSMENT OF SMALL IMPAIRMENTS IN AUDIO SYSTEMS INCLUNG MULTICHANNEL SOUND SYSTEMS,' 1994-1997
  12. Chiristian Neubauer, 'A Compatible Family of Bitstream Watermarking Schemes for MPEG-Audio', AES 110th Convention, Amsterdam, May 2001