Efficient Cache Management Scheme in Database based on Block Classification

블록 분류에 기반한 데이타베이스의 효율적 캐쉬 관리 기법

  • Sin, Il-Hoon (Dept.of Electric Computer Engineering, Seoul National University) ;
  • Koh, Kern (Dept.of Electric Computer Engineering, Seoul National University)
  • 신일훈 (서울대학교 전기컴퓨터공학부) ;
  • 고건 (서울대학교 전기컴퓨터공학부)
  • Published : 2002.08.01

Abstract

Although LRU is not adequate for database that has non-uniform reference pattern, it has been adopted in most database systems due to the absence of the proper alternative. We analyze database block reference pattern with the realistic database trace. Based on this analysis, we propose a new cache replacement policy. Trace analysis shows that extremely non-popular blocks take up about 70 % of the entire blocks. The influence of recency on blocks' re-reference likelihood is at first strong due to temporal locality, however, it rapidly decreases and eventually becomes negligible as stack distance increases. Based on this observation, RCB(Reference Characteristic Based) cache replacement policy, which we propose in this paper, classifies the entire blocks into four block groups by blocks' recency and re-reference likelihood, and operates different priority evaluation methods for each block group. RCB policy evicts non-popular blocks more quickly than the others and evaluates the priority of the block by frequency that has not been referenced for a long time. In a trace-driven simulation, RCB delivers a better performance than the existing polices(LRU, 2Q, LRU-K, LRFU). Especially compared to LRU. It reduces miss count by 5~l2.7%. Time complexity of RCB is O(1), which is the same with LRU and 2Q and superior to LRU-K(O(log$_2$N)) and LRFU(O(l) ~ O(log$_2$N)).

LRU는 비균등 참조 패턴을 보이는 데이타베이스의 캐쉬 교체 정책으로 적합하지 않음에도 불구하고, 적절한 대안 부재로 인해 대부분의 데이타베이스 시스템에서 캐쉬 교체 정책으로 이용되어 왔다. 본 논문은 실제 데이타베이스 트레이스 분석을 통해 데이타베이스의 블록 참조 패턴을 추출하고, 이를 바탕으로 새로운 캐쉬 교체 정책을 제안한다. 데이타베이스의 트레이스 분석 결과, 전체 시간동안 거의 참조되지 않는 블록이 전체의 70% 가량을 차지하였다. 그리고 블록의 재참조 가능성에 미치는 최근도(recency)의 영향력이 시간적 지역성으로 인해 처음엔 강력하지만, LRU 스택거리가 증가함에 따라 급격히 감소하여, 결국엔 사라지는 현상을 관찰하였다. 이 관찰을 토대로, 본 논문은 전체 블록을 재참조 가능성과 재참조 가능성에 대한 최근도의 영향력을 기준으로 4개의 그룹으로 분류하고, 각 그룹의 참조 특징에 적합한 우선순위 평가 방법을 운용하는 RCB(Reference Characteristic Based) 캐쉬 교체 정책을 제안한다. RCB 정책은 재참조 가능성이 극히 낮은 블록은 다른 블록보다 캐쉬에서 빨리 교체하며, 오랜 시간 참조되지 않은 블록에 대해서는 참조빈도에 의거하여 블록의 우선순위를 결정한다. 실제 데이터베이스 워크로드를 통한 모의실험 수행 결과, RCB 정책은 기존의 다른 교체 정책들(LRU, 2Q, LRU-K, LRFU)보다 우수한 성능을 나타냈으며, 특히 LRU에 비해서는 약 5 ~ 12.7% 정도, 캐쉬적중실패 회수를 줄였다. RCB 정책의 시간복잡도는 O(l)로서 LRU, 2Q 등과 동일하며, 캐쉬 크기를 N이라 할 때 시간복잡도가 $O(log_2N)$인 LFU와 LRU-K, 그리고 O(1)부터 $O(log_2N)$ 사이의 값을 갖는 LRFU보다 우수하다.

Keywords

References

  1. E. J. O'Neil, P.E. O'Neil, G. Weikum. 'The LRU-K Page Replacement Algorithm For Database Disk Buffering,' Proc. Of the 1993 ACM SIGMOD Conference, pp 297-306, 1993 https://doi.org/10.1145/170035.170081
  2. T. Johnson, D. Shasha.. '2Q: A Low Overhead High Performance Buffer Management Replacement Algorithm,' Proc. Of the 20th International Conference on Very Large Data Bases, pp 439-450, 1994
  3. Donghee Lee, Jongmoo Choi, Jong-Hun Kim, Sam H. Noh, Sang Lyul Min, Yookun Cho, ChongSang Kim. 'On the Existence of a Spectrum of Policies that Subsumes the Least Recently Used (LRU) and Least Frequently Used (LFU) Policies,' Proc. Of the 1999 ACM SIGMETRICS International Conference on Measurement and Modeling of Computer Systems, pp 134-143, May 1999
  4. Yannis Smaragdakis, Scott Kaplan, and Paul Wilson. 'EELRU: Simple and Effective Adaptive Page Replacement,' Proc. Of the 1999 ACM SIGMETRICS International Conference on Measurement and Modeling of Computer Systems, pp 134-143, May 1999
  5. J. T. Robinson, N. V. Devarakonda. 'Data Cache Management Using Frequency-Based Replacement,' Proc. Of the 1990 ACM SIGMETRICS Conference, pp 134-142, 1990
  6. Stephen Williams, Marc Abrams, Charles Standridge, Ghaleb Abdulla, and Edward Fox. 'Removal Policies in Network Caches for World-Wide Web Documents,' Procedings of the ACM SIGCOMM'96 conference, 1996 https://doi.org/10.1145/248156.248182