덧셈과 쉬프트 연산을 사용한 MP3 IMDCT의 저전력 Systolic 구조

A low-power systolic structure for MP3 IMDCT Using addition and shift operation

  • 장영범 (상명대학교 정보통신공학전공) ;
  • 이원상 (상명대학교 정보통신공학전공)
  • 발행 : 2004.10.01

초록

이 논문에서는 MP3에 사용되는 32-point IMDCT 블록의 저전력 hard-wired 구조를 제안하였다. 행렬의 재배열을 통하여 16, 8, 4, 2, 1 cycle에 동작하는 5개의 multirate block을 유도함으로서 저전력 systolic 구조를 제안하였다. 각각의 sub-block들의 곱셈 구현은 덧셈기와 쉬프트로 구현하는 CSD(Cainmic signed digit) 방식을 채택하여 덧셈의 수를 줄임으로서 전력소모를 감소시켰다. 또한 각각의 sub-block들의 전력소모를 더욱 감소시키기 위하여 common sub-expression sharing 방식을 채용함으로서 덧셈의 연산량을 더욱 감소시킨 구조를 제안하였다. 그 결과, 2의 보수형을 사용하는 구조와 비교하여 58.4%의 상대 전력소모를 줄일 수 있었다. 또한 하드웨어 구현을 Verilog-HDL코팅을 통하여 시뮬레이션 함으로서 구조가 정확하게 동작함을 확인하였다.

In this paper, a low-power 32-point IMDCT structure is proposed for MP3. Through re-odering of IMDCT matrices, we propose the systolic structure operating with 16, 8, 4, 2, and 1 cycle, respectively. To reduce power consumption, multiplication of each sub blocks are implemented by add and shift operation with CSD(Canrmic sigled digit) form coefficients. To reduce, furthermore, the number of adders, we utilize the common sub-expression sharing techniques. With these techniques, the relative power consumption of the proposed structure is reduced by 58.4% comparison to the conventional structure using only 2's complement form coefficient. Validity of the proposed structure is proved through Verilog-HDL coding.

키워드

참고문헌

  1. ISO/IEC 11172-3 MPEG-1 Connnittee Draft Part 3 : Audio, layer I, II, ill
  2. N. AhmxI, T. Natarajan, and K. R. Rao, 'Discrete cosine transform,' IEEE Trans. Comput., vol. C-23, pp. 90-93, Jan. 1974 https://doi.org/10.1109/T-C.1974.223784
  3. W. H Chen, C. H Smith, and S. C. Fralick, 'A fast computational algoritlnn for the discrete cosine transform,' IEEE Trans. Commun., vol. COM-25, pp. 1004-1009, Sep. 1977
  4. M Vetterli, and H 1. Nussbaumer, 'Simple FFT and OCT algoritlnn with reduced number of operations,' Signal Process., vol. 6, No.4, pp. 267-278, 1984 https://doi.org/10.1016/0165-1684(84)90059-8
  5. M T. Stm, L. Wu, and M L. Liou, 'A concurrent architecture for VLSI irnp1enx:ntation of discrete cosine transform,' IEEE Trans. Circuits and Systems, vol. CAS-34, pp. 992-994, Aug. 1987
  6. M. Yoshida, H Ohtorno, and I. Kuroda, 'A new generation 16-bit general purpose progrannnable DSP and its video rate application,' in IEEE Workshop on VLSI Signal Processing, pp. 93-101, 1993
  7. T. S. Chang, C. S. Kung, and C. W. len, 'A simple processor core design for OCTjIDCT,' IEEE Trans. Circuits and Systems for Vuleo Technology, vol. 10, No.3, Apr. 2000
  8. K. Hwang, Computer Aritlnnetic: Principles, Architecture, and Design, New York: Wiley, 1979
  9. R. I. Hartley, 'Subexpression sharing in filters using canonic signed digit multipliers,' IEEE Trans. Circuits and Systerr&II: Analog and Digital Signal Processing, vol. 43, No. 10, pp. 677-688, Oct. 1996 https://doi.org/10.1109/82.539000
  10. 장영범, 양세정, '수직 공통패턴을 사용한 고속/저전력 CSD 선형위상 FIR 필터 구조,' 한국통신학회논문지, 27권 4A호, pp. 324-329, 2002년 4월