Adaptive Pipeline Architecture for an Asynchronous Embedded Processor

비동기식 임베디드 프로세서를 위한 적응형 파이프라인 구조

  • Lee, Seung-Sook (Dept. of Computer and Communication Engineering and Research Institute for Computer and Information Communication, Chungbuk National University) ;
  • Lee, Je-Hoon (CBNU BK21 Chungbuk Information Technology Center, Chungbuk National University) ;
  • Lim, Young-Il (Dept. of Computer and Communication Engineering and Research Institute for Computer and Information Communication, Chungbuk National University) ;
  • Cho, Kyoung-Rok (Dept. of Computer and Communication Engineering and Research Institute for Computer and Information Communication, Chungbuk National University)
  • 이승숙 (충북대학교 정보통신공학과 컴퓨터정보통신연구소) ;
  • 이제훈 (충북대학교 BK21) ;
  • 임영일 (충북대학교 정보통신공학과 컴퓨터정보통신연구소) ;
  • 조경록 (충북대학교 정보통신공학과 컴퓨터정보통신연구소)
  • Published : 2007.01.25

Abstract

This paper presented an adaptive pipeline architecture for a high-performance and low-power asynchronous processor. The proposed pipeline architecture employed a stage-skipping and a stage-combining scheme. The stage-skipping scheme can skip the operation of a bubble stage that is not used pipeline stage in an instruction execution. In the stage-combining scheme, two consecutive stages can be joined to form one stage if the latter stage is empty. The proposed pipeline architecture could reduce the processing time and power consumption. The proposed architecture supports multi-processing in the EX stage that executes parallel 4 instructions. We designed an asynchronous microprocessor to estimate the efficiency of the proposed pipeline architecture that was synthesized to a gate level design using a $0.35-{\mu}m$ CMOS standard cell library. We evaluated the performance of the target processor using SPEC2000 benchmark programs. The proposed architecture showed about 2.3 times higher speed than the asynchronous counterpart, AMULET3i. As a result, the proposed pipeline schemes and architecture can be used for asynchronous high-speed processor design

본 논문은 비동기식 프로세서에서 동작 상황에 따라 파이프라인 구조가 변경 가능하고 명령어 종류에 따라 병렬처리를 지원하는 적응형 파이프라인 구조를 제안하였다. 제안된 구조는 동작이 불필요한 스테이지를 건너뛰는 스테이지 스키핑(stage-skipping)과 다음 스테이지가 비어 있으면 현재 스테이지와 다음 스테이지를 하나로 통합하는 스테이지 통합(stage-combining) 기법을 지원한다. 이 기법들은 명령어 종류에 따라 서로 다른 데이터패스를 사용하는 명령어들을 병렬로 처리하여 머신 사이클을 단축시켜 프로세서의 동작 속도를 증가시킨다. 본 논문에서는 제안된 파이프라인 구조를 적용한 ARM 명령어 호환 프로세서를 설계하였다. 이 프로세서는 VHDL로 설계한 후 $0.35-{\mu}m$ CMOS 표준 셀 라이브러리를 이용하여 합성되었다. SPEC2000 벤치마크를 사용하여 성능을 평가한 결과, 타겟 프로세서는 평균 365 MIPS의 속도로 동작하여 영국 맨체스터 대학에서 개발한 비동기 프로세서인 AMULET3i에 비해 2.3배 높은 성능을 보였다. 제안된 파이프라인 기법과 프로세서 구조는 고속 비동기식 프로세서 설계에 적용 가능하다.

Keywords

References

  1. M. Ozawa, M. Imai, Y. Ueno, H. Nakamura, and T. Nanya, 'A cascade ALU architecture for asynchronous super-scalar processor,' IEICE Trans. Electron., vol. E84-C, no. 2, pp. 229-237, Feb. 2001
  2. S. B. Furber, D. A. Edward, and J. D. Garside, 'AMULET3: A 100 MIPS asynchronous embedded processor,' Proc. Computer Design, pp. 329-334, 2000 https://doi.org/10.1109/ICCD.2000.878304
  3. A. Takamura, M, Kuwakao, M. Imai, T. Fujii, M. Ozawa, I. Fukasaku, Y. Ueno, and T. Nanya, 'TITAC-2 A 32-bit scalable-delay insensitive microprocessor,' Proc. ICCD, pp. 288-294, Oct. 1997
  4. S. B. Furber, J. D. Garside, S. Temple, J. Liu, P. Day, and N. C. Paver, 'AMULET2e An asynchronous embedded controller,' Proc ASYNC'1997, pp. 290-299, Apr. 1997 https://doi.org/10.1109/ASYNC.1997.587182
  5. A. J. Martin, M. Nystrom, K. Papadantonakis, P. I. Penzes, P. Prakash, C. G. Wong, J. Chang, K. S. Ko, B. Lee, E. Ou, J. Pugh, E. Talvala, J. T. Tong, and A. Tura, 'The lutonium subnanojoule asynchronous 8051 microcontroller,' Proc ASYNC'03, pp. 14-23, 2003
  6. J. H. Lee, Y. H. Kim, and K. R. Cho, 'Design of a fast asynchronous embedded CISC microprocessor, A8051,' IEICE Trans. on Electron, vol. E87-C, no. 4, pp. 527-534. Apr. 2004
  7. J. M. Colmenar, O. Garnica, S. Lopez, J. I. Hidalgo, J. Lanchares, and R. Hermida, 'Empirical characterization of the latency of long asynchronous pipelines with data-dependent module delays,' Proc. 12th EUROMICROPDP' 04, pp. 311-321, Feb. 2004 https://doi.org/10.1109/EMPDP.2004.1271435
  8. A. Efthymiou and J. D. Garside, 'Adaptive pipeline structures for speculation control,' Proc. ASYNC'03, pp. 46-55, May 2003 https://doi.org/10.1109/ASYNC.2003.1199165
  9. J. L. Peterson, 'Petri nets,' ACM Computing surveys, vol. 9, no. 3, sept. 1977
  10. J. L. Peterson, Petri nets theory and the modeling of systems, Englewood Cliffs, Prentice Hall 1981
  11. J. D. Garside, W. J. Bainbridge, A. Bardsley, D. M. Clark, D. A. Edwards, S. B. Furber, J. Liu, D. W. Lloyd, S. Mohammadi, J. S. Pepper, O. Petlin, S. Temple, J. V. Woods, 'AMULET3i-an asynchronous system-on-chip,' Proc. ASYNC2000, pp. 162-175, Apr. 2000 https://doi.org/10.1109/ASYNC.2000.836999
  12. S. Segars, 'The ARM9 family-high performance microprocessors for embedded applications,' Proc. ICCD, pp. 230 - 235, Oct. 1998 https://doi.org/10.1109/ICCD.1998.727055
  13. D. Sima, T. Fountain, and P. Kacsuk, Advanced Computer Architectures: a Design Space Approach, Addition-Wesley, 1997