Design of a Bit-Level Super-Systolic Array

비트 수준 슈퍼 시스톨릭 어레이의 설계

  • Lee Jae-Jin (School of Electrical & Computer Engineering, Chungbuk National University) ;
  • Song Gi-Yong (School of Electrical & Computer Engineering, Chungbuk National University)
  • 이재진 (충북대학교 전기전자컴퓨터공학부) ;
  • 송기용 (충북대학교 전기전자컴퓨터공학부)
  • Published : 2005.12.01

Abstract

A systolic array formed by interconnecting a set of identical data-processing cells in a uniform manner is a combination of an algorithm and a circuit that implements it, and is closely related conceptually to arithmetic pipeline. High-performance computation on a large array of cells has been an important feature of systolic array. To achieve even higher degree of concurrency, it is desirable to make cells of systolic array themselves systolic array as well. The structure of systolic array with its cells consisting of another systolic array is to be called super-systolic array. This paper proposes a scalable bit-level super-systolic amy which can be adopted in the VLSI design including regular interconnection and functional primitives that are typical for a systolic architecture. This architecture is focused on highly regular computational structures that avoids the need for a large number of global interconnection required in general VLSI implementation. A bit-level super-systolic FIR filter is selected as an example of bit-level super-systolic array. The derived bit-level super-systolic FIR filter has been modeled and simulated in RT level using VHDL, then synthesized using Synopsys Design Compiler based on Hynix $0.35{\mu}m$ cell library. Compared conventional word-level systolic array, the newly proposed bit-level super-systolic arrays are efficient when it comes to area and throughput.

시스톨릭 어레이는 동일한 기능을 가지는 계산처리들을 동일한 형태로 연결하여, 다수의 자료에 반복적인 계산을 하도록 만들어진 병렬처리기로써 개념적으로 산술 파이프라인과 밀접한 관계를 갖는다. 시스톨릭 어레이 셀 내의 연산에 대한 고성능처리는 시스톨릭 어레이의 중요한 특징이다. 본 논문에서는 시스톨릭 어레이 셀 내의 동시성 처리를 높이기 위해 셀 내의 연산 중에서는 큰 지연 시간을 가지는 셀 내의 연산자를 다시 규칙성을 가지는 시스톨릭 어레이로 구성하는 비트 수준 슈퍼 시스톨릭 어레이 구조를 제안하고, 그 예로 비트 수준 슈퍼 시스톨릭 FIR 필터에 대하여 기술한다. 먼저 정규순환방정식으로 표현된 알고리즘으로부터 워드 수준 시스톨릭 어레이를 유도한 후 유도된 워드 수준 시스톨릭 어레이를 슈퍼 시스톨릭 어레이로 변환한다. 위의 과정으로 유도된 비트 수준 슈퍼 시스톨릭 어레이를 RT 수준에서 VHDL로 모델링 하여 동작을 검증하였으며, Hynix에서 제공되는 $0.35{\mu}m$셀 라이브러리를 사용하여 합성하였다. 본 논문에서 제안하는 비트 수준 슈퍼 시스톨릭 어레이는 워드 수준 시스톨릭 어레이 디자인에 비해 면적은 물론 성능측면에서 이점을 가진다.

Keywords

References

  1. S. Y. Kung, VLSI Array Processors, Prentice Hall, 1988
  2. H. T. Kung, 'Why Systolic Architectures?,' IEEE Computer vol 15, no. 1, pp. 37-46, 1982
  3. H. T. Kung and C.E.Leiserson, 'Systolic Arrays (for VLSI),' Sparse Matrix Proc., Academic Press, Orland, pp. 256-282, 1979
  4. S. Y. Kung, 'On Supercomputing with Systolic /Wavefront Array processors,' IEEE computer, vol. 72, no. 7, 1984
  5. K. T. Johnson, A. R. Hurson, 'General Purpose Systolic Arrays,' IEEE Computers, pp. 20-31, Novemver 1993 https://doi.org/10.1109/2.241423
  6. J. Mccanny, J. Mcwhirter, and S. Y. Kung 'The use of data dependence graphs in the design of bit-level systolic arrays,' IEEE Trans. Acoust., Speech., Signal Process., vol. 18, pp. 787-793, 1990 https://doi.org/10.1109/29.56023
  7. S. Nayak, and P. Meher, 'High throughput VLSI implementation of discrete orthogonal transforms using bit-level vector-matrix multiplier,' IEEE Trans. Circuits Syst. II, Analog Digital Signal Process., vol. 46, (5), pp. 655-658, 1999 https://doi.org/10.1109/82.769818
  8. R. S. Grover, W. Chang and Q. Li, 'A comparison of FPGA implementation of two's complement bit-level and word-level matrix multiplier,' FPGA 2001, pp. 223, 2001
  9. S. S. Nayak, 'Bit-level systolic implementation of 1D and 2D discrete wavelet transform.' IEE Proc. of Circuits, Devices and Systems, vol. 152, pp. 25-32, 2005 https://doi.org/10.1049/ip-cds:20040745
  10. U. Meyer-Baese, Digital Signal Processing with Field Programmable Gate Arrays, Springer, 2001
  11. J. J. Lee and G. Y. Song, 'Implementation of the Super-Systolic Array for Convolution,' ASP-DAC 2003, pp. 491-494, 2003 https://doi.org/10.1109/ASPDAC.2003.1195065
  12. S. G. Smith and R.W.Morgan, 'Generic ASIC architecture for high-performance integer arithmetic realization,' Proc. of IEEE int. conf., computer design, 1989
  13. K. C. Chang, Digital Systems Design with VHDL and Synthesis, IEEE Computer Society Press, 1999
  14. http://www.synopsys.com