Efficient Processing of Multipoints MAX/MIN Queries in OLAP Environment

OLAP 환경에서 다중점 MAX/MIN 질의의 효율적인 처리기법

  • 양우석 (한국과학기술원 전산학과) ;
  • 김명호 (한국과학기술원 전산학과)
  • Published : 2000.03.31

Abstract

Online analytical processing (OLAP) systems are introduced to support decision support systems. Many researches focussed on efficient processing of aggregate functions that usually occur in OLAP queries. However, most previous researches in the literature are deal with the situation in which aggregate functions arc applied to all the values in a given range. Since those approaches utilize characteristic of aggregate functions applied to a range, they are difficult to be applied to a muitipoint query that is a query considering only some points in a given range. In this paper, we propose the Ranking Index and the flanking Decision Tree (RDT) for efficient evaluation of multipoints MAX/MIN queries. The ranking of possible MAX/MIN values are computed with RDT Then MAX/MIN values can be acquired from the Ranking Index. We show through experiments that our method provides high performance in most situations. In other words, the proposed method is robust as well as efficient. A single common set of precomputed results for both MAX and MIN values is another advantage of the proposed method.

OLAP(Online analytical processing)은 의사지원시스템을 효과적으로 지원하기 위한 핵심요소이며 주로 집단함수를 포함한 분석 질의를 처리한다. 이러한 질의를 효율적으로 처리하기 위한 연구들이 많이 이루어져 왔으나, 기존의 연구들은 어떤 범위 내의 모든 값을 대상으로 하는 집단함수의 처리 방법들을 다루고 있다. 그러나 이러한 범위 질의 외에도 범위 내의 특정 값들, 즉 다중점에 대한 질의도 많이 사용될 수 있으며, 이러한 질의에는 기존의 연구가 적용되기 어렵다. 본 논문에서는 다중점 MAX/MIN 질의를 효율적으로 처리하는 방법으로 순위 색인과 순위 결정 트리를 제안한다. 최대/최소값을 구하기 위해, 비트맵 형태의 노드로 이루어진 순위 결정 트리를 사용하여 결과의 순위를 구하고, 순위 색인을 통하여 질의의 결과를 얻는다. 그리고 실험을 통하여 제안한 방법이 대부분의 MAX/MIN 질의에 대해 안정적으로 높은 성능을 나타낸다는 것을 보였다. 또한, 단일 선계산 자료만으로 MAX와 MIN 질의를 모두 처리할 수 있다는 것도 제안한 방법의 주요 장점이다.

Keywords

References

  1. E.F. Codd, S. B. Codd and C. T. Salley, 'Beyond decision support,' Computerworld, 27(30), July 1993
  2. A. Gupta, V. Harinarayan, and D. Quass. 'Aggregate-Query Processing in Data Warehousing Environments'. In Proceedings of the 21th VLDB, 1995
  3. P. O'Neil and D.Quass, 'Improved Query Performance with Variant Indexes.' In Proceeding of the ACM SIGMOD International Conference on Management of Data, 1997 https://doi.org/10.1145/253260.253268
  4. Yannis Kotidis and Nick Roussopoulos, 'An Alternative Storage Organization for ROLAP Aggregate Views Based on Cubetrees,' SIGMOD Conference, 1998 https://doi.org/10.1145/276304.276327
  5. J. Gray, A. Bosworth, A. Layman, and Pirahesh, 'Data cube: A relational aggregation operator generalizing group-by, cross-tabs and sub-totals,' In Proceedings of VLDB, pp 358-369, 1995
  6. V. Harinarayan, A. Rajaraman, and J.D. Ullman, 'Implementing Data Cubes Efficiently.,' ACM SIGMOD 1996, pp 205-216, 1996 https://doi.org/10.1145/233269.233333
  7. Surajit Chaudhuri and Umeshwar Dayal, 'An Overview of Data Warehousing and OLAP technology,' ACM SIGMOD Record, 26(1):65-74, 1997 https://doi.org/10.1145/248603.248616
  8. Ching-Tien Ho, Rakesh Agrawal, Nimrod Megiddo and Ramakrishnan Srikant, 'Range queries in OLAP data cubes,' In Proc. Of the ACM SIGMOD Conference on Management of Data, 1997
  9. Dong Wook Kim, Myoung Ho Kim, Yoon Joon Lee, 'An Efficient Processing of Range Min/Max Queries over Data Cube,' Information Science 112, 1998, pp.223-237 https://doi.org/10.1016/S0020-0255(98)10035-X
  10. Ching-Tien Ho, Jehoshua Bruck, Rakesh Agrawal, 'Partial-Sum Queries in OLAP Data Cubes Using Covering Codes,' In PODS, 1997 https://doi.org/10.1145/263661.263686
  11. Chee-Yong Chan, Yannis E. Ioannidis, 'Bitmap Index Design and Evaluation,' ACM SIGMOD 1998, pp 355-366 https://doi.org/10.1145/276305.276336