DOI QR코드

DOI QR Code

Low-Power Cache Design by using Locality Buffer and Address Compression

지역 버퍼와 주소 압축을 통한 저전력 캐시 설계

  • 곽종욱 (영남대학교 컴퓨터공학과)
  • Received : 2013.05.05
  • Accepted : 2013.07.14
  • Published : 2013.09.30

Abstract

Most modern computer systems employ cache systems in order to alleviate the access time gap between processor and memory system. The power dissipated by the cache systems becomes a significant part of the total power dissipated by whole microprocessor chip. Therefore, power reduction in the cache system becomes one of the important issues. Partial tag cache is the system for the least power consumption. The main power reduction for this method is due to the use of small partial tag matching, not full tag matching. In this paper, we first analyze the previous regular partial tag cache systems and propose a new address matching mechanism by using locality buffer and address compression. In simulation results, the proposed model shows 18% power reduction in average, still providing same performance level, compared to regular cache.

프로세서와 메모리 시스템 사이의 속도 차이를 완화하기 위하여 오늘날의 컴퓨터 시스템은 대부분 캐시 시스템을 사용하고 있다. 하지만 소비 전력 측면에서 캐시 메모리는 전체 시스템 측면에서 큰 비중을 차지한다. 본 논문에서는 캐시 시스템의 전력을 줄이는 방안 가운데 하나로 지역 버퍼와 주소 압축을 통한 저전력 캐시 설계 기법을 제안한다. 주소 압축을 위해 사용되는 부분태그 캐시는 전력 소모량을 최소화하기 위해서 전체 태그를 쓰기보다는 태그의 작은 부분을 사용함으로써 소비 전력을 줄이도록 하는 기법이다. 본 논문에서는 기존의 여러 주소 압축 캐시 연구에서의 문제점들을 분석하여 그것을 보완할 수 있는 새로운 기법을 제안한다. 제안된 기법은 지역성이 높은 내장형 응용프로그램의 특징을 활용한 것으로, 지역 버퍼와 지역 실패 버퍼를 활용한 새로운 형태의 캐시 주소 압축 기법이다. 모의실험 결과, 제안된 기법은 전체적인 성능의 감소 없이 평균 18%의 에너지 감소를 보였다.

Keywords

References

  1. Patterson, D. A., and Hennessy, J. L. "Computer architecture: a quantitative approach" (Morgan Kaufman, 2007, 4th Ed.)
  2. S. Segars, "Low power design techniques for microprocessor" Tutorial, International solid-State Circuit conference, Feb.2001
  3. ARMv7-M Architecture Reference Model, ARM DDI 0403C, 2010.
  4. A. Malik, B. Moyer, D. Cermak, "A Lower Power Unified Cache Architecture Providing Power and Performance Flexibility," ISLPED'00, 2000, pp. 241-243
  5. Gennady Pekhimenko, et al., "Linearly compressed pages: a main memory compression framework with low complexity and low latency", PACT '12 pp. 489-490, 2012
  6. H. Kim, C. Rhee, and H. Lee, "Address generation for lossless frame memory compression in an H.264/AVC encoder", Proceedings on ICCE, pp. 570-571, 2013
  7. Xi Chen, Lei Yang and Li Shang, "C-Pack: A High-Performance Microprocessor Cache Compression Algorithm", IEEE Transactions on VLSI Systems, pp. 1196-1208, 2010
  8. Hadi Hajimiri and Kamran Rahmani, "Compression-aware dynamic cache reconfiguration for embedded systems", IEEE IGCC 2011, pp. 71-80, June 2012,
  9. Mathew, S. and Jagadeeswari, M., "Low power L2 cache design using partially tagged bloom filter and hotline check", International Conference on ICCCI, pp. 1-6, Jan. 2013
  10. M. Loghi, P. Azzoni, M. Poncino, Tag overflow buffering: an energy-efficient cache architecture, in: Proceedings of the Design, Automation and Test, pp. 520-525, March 2005.
  11. D. Burger, A. Kagi, and M. Hrishikesh. "Memory hierarchy extensions to SimpleScalar 3.0", Technical Report TR99-25, University of Texas at Austin, April 1999.
  12. NaveenMuralimanohar, Rajeev Balasubramonian, Norman P. Jouppi, ''CACTI 6.0: A Tool to Model Large Caches", HPL-2009-85, Tech. Report, Compaq Western Research Lab, 2009.
  13. Guthaus, M. R. et al., "MiBench: A free, commercially representative embedded benchmark suite", IEEE International Workshop on Workload Characterization, pp. 3-14, Dec. 2001