DOI QR코드

DOI QR Code

Design of an Asynchronous Data Cache with FIFO Buffer for Write Back Mode

Write Back 모드용 FIFO 버퍼 기능을 갖는 비동기식 데이터 캐시

  • 박종민 (충북대학교 정보통신 공학과) ;
  • 김석만 (충북대학교 정보통신 공학과) ;
  • 오명훈 (한국전자통신연구원 서버플랫폼 연구팀) ;
  • 조경록 (충북대학교 전자정보대학)
  • Received : 2010.05.31
  • Accepted : 2010.06.18
  • Published : 2010.06.28

Abstract

In this paper, we propose the data cache architecture with a write buffer for a 32bit asynchronous embedded processor. The data cache consists of CAM and data memory. It accelerates data up lood cycle between the processor and the main memory that improves processor performance. The proposed data cache has 8 KB cache memory. The cache uses the 4-way set associative mapping with line size of 4 words (16 bytes) and pseudo LRU replacement algorithm for data replacement in the memory. Dirty register and write buffer is used for write policy of the cache. The designed data cache is synthesized to a gate level design using $0.13-{\mu}m$ process. Its average hit rate is 94%. And the system performance has been improved by 46.53%. The proposed data cache with write buffer is very suitable for a 32-bit asynchronous processor.

본 논문에서는 32bit 비동기 임베디드 프로세서용 쓰기 버퍼 기능을 갖는 데이터 캐시 구조를 제안하고 성능을 검증하였다. 데이터 캐시는 비동기 시스템에서 메인 메모리 장치와 프로세서 사이의 데이터 처리속도 향상을 목적으로 한다. 제안된 데이터 캐시의 메모리 크기는 8KB, 매핑 방식으로는 4 words(16byte)의 라인 크기를 가지며, 사상 기법으로는 4 way set associative, 교체 알고리즘으로는 pusedo LRU방식을 사용하였으며, 쓰기 정책을 위한 dirty 레지스터와 쓰기 버퍼를 적용시켰다. 설계한 데이터 캐시는 $0.13-{\mu}m$ CMOS공정으로 합성하였으며, MI벤치마크 검증 결과 평균 히트율은 94%이고 처리 속도가 46% 향상되었다.

Keywords

References

  1. J. Pangjun and S. Sapatnekar, "Low-power Clock Distribution Using Multiple Voltages and Reduced Swings," IEEE Journal of TVLSI, Vol.10, No.2, pp.309-319, 2002(6).
  2. X. Wang, T. Ahonen, and J. Nurmi, "A Synthesizable RTL Design of Asynchronous FIFO," Proc. ISSOC'2004, pp.123-128, 2004(11).
  3. S. N. Kim, S. W. Kim, Y. W. Kim. M. H. Oh, and C. H. Shin, "Ultra low power asynchronous processor development," Technical Report 09ZH1230-01-7030p, ETRI, 2009(12).
  4. D. Hormdee and J. D. Ringenberg, D Ernst, T. M. Austin, T. R. Mudge, and B. Brown, "MiBench: A free, commercially representative embedded benchmark suite," Proc. WWC-4.2001, pp.3-14, 2001(12).
  5. D. Hormdee and J. D. Garside, "AMULET3i cache architecture," Proc. ASYNC'2001, pp.152-161, 2001(5).
  6. Z. Wang, S. Das, h. Che, and M. Kumar, "SACCS: Scalable Asynchronous Cache Consistency Scheme for Mobile Environments," Proc. ICDCSW'2003, pp.797-802, 2003(5).
  7. 전광배, 김석만, 이제훈, 오명훈, 조경록, “혼합 지연 모델에 기반한 비동기 명령어 캐시 설계”, 한국콘텐츠학회논문지, 제10권, 제3호, pp.64-71, 2010(3). https://doi.org/10.5392/JKCA.2010.10.3.064
  8. Virantha N. Ekanayak and Rajit Manohar, "Asynchronous DRAM Design and Synthesis," Proc. Asynchronous Circuits and Systems, pp.174-183, 2003(5).