저전력 고성능 뱅크-승격 TLB 구조

A High Performance and Low Power Banked-Promotion TLB Structure

  • 이정훈 (연세대학교 컴퓨터과학과) ;
  • 김신덕 (연세대학교 컴퓨터과학과)
  • 발행 : 2002.04.01

초록

TLB(translation lookaside buffer) 성능 향상을 위한 전형적인 방법으로 TLB로 하여금 더 많은 엔트리 수를 지원하는 방법, 페이지 크기를 증대시키는 방법, 그리고 다중 페이지 크기를 지원하는 방법이다. 현재 TLB 성능을 높이기 위한 가장 좋은 방법으로 다중 페이지 크기를 지원하는 연구가 효과적이다. 다중 페이지 크기를 지원하는 방법들 중에서 가장 적합한 것은 운영체제나 컴파일러로부터 일정한 정보를 받아서 가장 적합한 페이지 크기를 TLB에 할당하는 것이다. 그러나 운영체제의 시스템 영역에서 는 이러한 방식이 가능하나 사용자 영역에서는 현실적으로 이러한 방식을 지원하기 어렵기 때문에 우리는 사용자 영역까지 운영체제의 지원 없이 이중 페이지를 지원할 수 있는 새로운 TLB 구조를 제안하고자 한다. 고성능을 보장하기 위한 방법으로 이중페이지를 하드웨어 방식으로 지원하는 방식을 제시하고, 또한 저전력의 효과를 높이기 위하여 하나의 완전 연관 TLB를 두 개의 서버 TLB로 나누는 방식을 사용하였다. 이러한 두 가지 방식을 내장형 프로세서에 적합하도록 하나로 집적화 하여 저전력과 고성능의 효과를 모두 얻을 수 있었다. 시뮬레이션 결과에 따르면 적은 엔트리만을 사용하고도 높은 성능 향상효과를 얻을 수 있으며 또한 완전 연관 TLB에 비해 거의 50%이상 소비전력을 줄이는 효과를 얻을 수 있다.

There are many methods for improving TLB (translation lookaside buffer) performance, such as increasing the number of entry in TLB, supporting large page or multiple page sizes. The best way is to support multiple page sizes, but any operating system doesn't support multiple page sizes in user mode. So, we propose the new structure of TLB supporting two pages to obtain the effect of multiple page sizes with high performance and at low cost without operating system support. we propose a new TLB structure supporting two page sizes dynamically and selectively for high performance and low cost design without any operating system support. For high performance, a promotion-TLB is designed by supporting two page sizes. Also in order to attain low power consumption, a banked-TLB is constructed by dividing one fully associative TLB space into two sub-fully associative TLBs. These two banked-TLB structures are integrated into a banked-promotion TLB as a low power and high performance TLB structure for embedded processors. According to the results of comparison and analysis, a similar performance can be achieved by using fewer TLB entries and also power consumption can be reduced by around 50% comparing with the fully associative TLB.

키워드

참고문헌

  1. Todd M. Austin; and Gurindar S. Sohi, 'Hignbandwidth address translation for multiple-issue processors,' In Proceedings of the 32rd ACM Intl Symp. on Computer Architecture, pp. 158-167, May 1996 https://doi.org/10.1145/232973.232990
  2. M. Talluri, Shing Kong, Mark D. hill, and David A. Patterson. 'Tradeoffs in Supporting Two Page Sizes,' In Proc. the 19th Annual Intl Symp. on Computer Architecture, pp. 415-424, May 1992 https://doi.org/10.1145/139669.140406
  3. Y. A. Khalidi, 'Virtual memory support for multiple page sizes,' In Proc. of the fourth workshop on workstation operating systems, Oct. 1993 https://doi.org/10.1109/WWOS.1993.348164
  4. Sribalan Santhanm, 'StrongARM SA110, a 160mhz 32b 0.5w CMOS ARM processor,' In Hot Chips 8, Aug. 1996
  5. M. B. Kamble and K. Ghose, 'Energy-Efficiency of VLSI Cache:A Comparative Study,' in Proc. IEEE 10-th Intl. Conf. On VLSI Design, pp. 261-267, Jan. 1997 https://doi.org/10.1109/ICVD.1997.568087
  6. M. B. Kamble and K. Ghose, 'Analytical Energy Dissipation Models for Low Power Caches,' ACM/IEEE Intl. Symp. on Low-Power Electronics and Design, Aug. 1997 https://doi.org/10.1145/263272.263310
  7. Ghose K. and Kamble M. B., 'Reducing power in superscalar processor caches using subbanking multiple line buffers and bit-line segmentation,' ACM/IEEE Intl Symp on Low-Power Electronics and Design, pp. 70-75, Aug. 1999 https://doi.org/10.1145/313817.313860
  8. Kin, et al., 'Filtering memory references to increase energy efficiency,' IEEE Transactions on Computers, Vol. 49, No. 1, January 2000 https://doi.org/10.1109/12.822560
  9. D. Liu, and C. Svensson, 'Trading Speed for Low Power by Choice of Supply and Threshold Voltages,' IEEE journal of solid atate Circults, Vol. 28, No. 1, 1993 https://doi.org/10.1109/4.179198
  10. T. Juan, T. Lang, J. Navarro, 'Reducing TLB Power Requirements,' Intl Symp on Low Power Electronics and design, 1997 https://doi.org/10.1145/263272.263332
  11. Mark D Hill and M. Talluri, 'Suppassing the TLB Performance of Superpages with Less Operating system Support,' ASPLOS VI-, San Jose, California USA, pp. 171-182, Oct. 1994
  12. J. Kin, M. Gupta, and W.H. Mangione-Smith, 'The Filter Cache:An Energy Efficient Memory Structure,' MICRO-97: ACM/IEEE International Symposium on Microarchitecture, Research Triangle Park, NC, pp. 184-193, Dec. 1997 https://doi.org/10.1109/MICRO.1997.645809
  13. S. Manne, A. Klauser, D. Srunwald, F. Somenzi, 'Low power TLB Design for High Performance Microprocessors,' Univ. of Colorado Technical Report, 1997
  14. Jan Edler and Mark , 'Dinero IV Trace-Driven Uniprocessor Cache Simulator,' available from Univ.Wis., CS ftp site 1997
  15. Glenn Reinman and Norm Jouppi, 'An Integrated Cache Timing and Power Model,' Compaq WRL Report, 1999
  16. J. H. Lee, J. S. Lee, G. H. Park, G. W. Lee, and S. D. Kim, 'Dual TLB structure to support two page sizes,' Electronics Letters, Vol. 36, No. 8, pp. 705-706, Apr. 2000 https://doi.org/10.1049/el:20000514
  17. S. J. E. Wilton, and N. Jouppi, An Enhanced Access and Cycle Time Model for On-Chip Caches, Digital WRL Research Report 93/5, July 1994