A Bitmap Index for Chunk-Based MOLAP Cubes

청크 기반 MOLAP 큐브를 위한 비트맵 인덱스

  • 임윤선 (이화여자대학교 과학기술대학원 컴퓨터학과) ;
  • 김명 (이화여자대학교 과학기술대학원 컴퓨터학과)
  • Published : 2003.06.01

Abstract

MOLAP systems store data in a multidimensional away called a 'cube' and access them using way indexes. When a cube is placed into disk, it can be Partitioned into a set of chunks of the same side length. Such a cube storage scheme is called the chunk-based MOLAP cube storage scheme. It gives data clustering effect so that all the dimensions are guaranteed to get a fair chance in terms of the query processing speed. In order to achieve high space utilization, sparse chunks are further compressed. Due to data compression, the relative position of chunks cannot be obtained in constant time without using indexes. In this paper, we propose a bitmap index for chunk-based MOLAP cubes. The index can be constructed along with the corresponding cube generation. The relative position of chunks is retained in the index so that chunk retrieval can be done in constant time. We placed in an index block as many chunks as possible so that the number of index searches is minimized for OLAP operations such as range queries. We showed the proposed index is efficient by comparing it with multidimensional indexes such as UB-tree and grid file in terms of time and space.

다차원 온라인 분석처리 (MOLAP, Multidimensional On-line Analytical Processing) 시스템은 데이타를 큐브라고 불리는 다차원 배열에 저장하고 배열 인덱스를 이용하여 데이타를 엑세스한다. 큐브를 디스크에 저장할 때 각 변의 길이가 같은 작은 청크들로 조각내어 저장하게 되면 데이타 클러스터링 효과를 통해 모든 차원에 공평한 질의 처리 성능이 보장되며, 이러한 큐브 저장 방법을 ‘청크기반 MOLAP 큐브’ 저장 방법이라고 부른다. 공간 효율성을 높이기 위해 밀도가 낮은 청크들은 또한 압축되어 저장되는데 이 과정에서 데이타의 상대 위치 정보가 상실되며 원하는 청크들을 신속하게 엑세스하기 위해 인덱스가 필요하게 된다. 본 연구에서는 비트맵을 사용하여 청크기반 MOLAP 큐브를 인덱싱하는 방법을 제시한다. 인덱스는 큐브가 생성될 때 동시에 생성될 수 있으며, 인덱스 수준에서 청크들의 상대 위치 정보를 보존하여 청크들을 상수 시간에 검색할 수 있도록 하였고, 인덱스 블록마다 가능한 많은 청크들의 위치 정보가 포함되도록 하여 범위 질의를 비롯한 OLAP 주요 연산 처리 시에 인덱스 엑세스 회수를 크게 감소시켰다. 인덱스의 시간 공간적 효율성은 다차원 인덱싱 기법인 UB-트리, 그리드 파일과의 비교를 통해 검증하였다.

Keywords

References

  1. Arbor Software Corporation, Robert J. Earle, U.S. Patent #5359724, 1994
  2. Yihong Zhao, Prasad Deshpande, Jeffrey Naughton, 'An Array-Based Algorithm for Simultaneous Multidimensional Aggregates,' Proc, ACM SIGMOD, pp. 159-170, 1997 https://doi.org/10.1145/253262.253288
  3. S. Sarawagi, M. Stonebraker, 'Efficient Organization of Large Multidimensional Arrays,' Proc, 10th ICDE, Feb. 1994 https://doi.org/10.1109/ICDE.1994.283048
  4. Hosagrahar V. ]agadish, 'linear Clustering of Objects with Multiple Attributes,' Proc, ACM SIGMOD, pp. 332-342, 1990 https://doi.org/10.1145/93597.98742
  5. Prasad M. Deshpande, Karthikeyan Rarnasarny, Amit Shukla, jeffrey F. Naughton, 'Caching Multidimensional Queries Using Chunks,' Proc, ACM SIGMOD, pp. 259-270, 1998 https://doi.org/10.1145/276305.276328
  6. Jurg. Neivergelt, Hans Hinterberger, Kenneth C. Sevcik, 'The Grid File: An Adaptable, Symmetric Multikey File Structure,' ACM Transactions on Database Systems, Vol. 9, No.1, pp. 38-71, March 1984 https://doi.org/10.1145/348.318586
  7. Kyu-Young Whang, Ravi Krishnarnurthy, 'The Multilevel Grid File-A Dynamic Hierarchical Multidimensional File Structure', DSFAA, pp. 449-459, 1991
  8. Antonin Guttman, 'R-Trees: A Dynamic Index Structure for Spatial Searching,' Proc, ACM SIGMOD, pp. 47-57, Boston, 1984 https://doi.org/10.1145/602259.602266
  9. Rudolf Bayer, 'The Universal B-Tree for Multidimensional Indexing', Technische Universitat Munchen, TUM-I9637, November 1996
  10. Michael Freeston. 'The bang file: a new kind of grid file,' Proc, ACM SIGMOD, pp. 260-269, 1987 https://doi.org/10.1145/38713.38743
  11. Chee-Yong Chan, Yannis E. Ioannidis, 'Bitmap index design and evaluation,' Proc. ACM SIGMOD, pp, 355-366, June 1998 https://doi.org/10.1145/276305.276336
  12. Patrick O'Neil, Goetz Graefe, 'Multi-Table Joins Through Bitmapped Join Indices,' SIGMOD Record 24(3), September 1995 https://doi.org/10.1145/211990.212001
  13. Ming-Chuan Wu, Alejandro P. Buchmann. 'Encoded bitmap indexing for data warehouses,' Proc. 14th ICDE, Orlando, Florida, pp. 220-230, 1998 https://doi.org/10.1109/ICDE.1998.655780
  14. Patrick O'Neil, Dallan Quass. 'Improved Query Performance with Variant Indexes,' Proc. ACM SIGMOD, pp. 38-49, Tucson, Arizona, 1997 https://doi.org/10.1145/253260.253268
  15. Myung Kim, Yoonsun Lim, 'A Z index based MOLAP Storage Scheme', Journal of Korea Information Science Society, Vol. 29, No.4, pp. 262-273, August 2002
  16. MicroStrategy, Inc., 'The Case for Relational-OLAP', White Paper, http://www.microstrategy.com/files/whitepapers/wp_rolap.pdf, 2000
  17. Comshare, Inc., 'ROLAP:그 기대치와 현실', White Paper, http://www.olapforum.com/ForumOLAP/OLAP%20General/White%20paper/ROLAP-그%20기대치와%20현실.asp, 1995.(금용찬(역))