큐브 계산에서 I/O 비용을 줄이는 구간 기반 큐브 분할

Range-based Cube Partitioning for Reducing I/O Cost in Cube Computation

  • 박웅제 (한국과학기술원 전자전산학과 전산학전공) ;
  • 정연도 (한국과학기술원 전자전산학과 전산학전공 연구) ;
  • 김진녕 ((주) 데이콤 연구원) ;
  • 이윤준 (한국과학기술원 전자전산학과 전산학전공) ;
  • 김명호 (한국과학기술원 전자전산학과 전산학전공)
  • 발행 : 2001.12.01

초록

본 논문은 OLAP에서의 I/O 비용을 줄이는 큐브 계산 방법으로, 구간 기반 큐브 분할 기법을 제안한다. 제안하는 방법은 큐브 분할 단계들 사이에 존재하는 계산의 일부를 중복시켜 처리하는 방법을 통해 큐브 분할 작업의 I/O 성능을 향상시킨다. 계산의 중복을 위하여 제안하는 방법은 애트리뷰트의 단 일 값이 아닌 애트리뷰트 값의 일정 구간을 기준으로 큐브를 분할한다 분석과 실험을 통하여 제안하는 방법의 성능을 기존 큐브 분할 방법과 비교하여 보인다.

In this paper we propose a method, called the range-based cube partitioning (RCP)method for reducing I/O cost of cube computation in OLAP The method improves I/O performance of cube partitioning process by overlapping some computation between partitioning stages. For overlapping the computation, the method partitions the cube based on the ranges of attribute values, not the points of attribute value, Through analysis any experiments, we show the performance of the proposed method with comparison of the previous cube partitioning method.

키워드

참고문헌

  1. S.Agarwal, RAgrawal, et al. 'On the Computation of Multidimensional Aggregates,' in Proceedings of the 22nd VLDB, pp.506-521, 1996
  2. K.A.Hoss and D.Srivastava. 'Fast Computation of Sparse Datacubes', In Proceedings of 23rd VLDB, pp.116-125. 1997
  3. K.Beyer and RHamakrishnan. 'Bottom-Up Computation of Sparse and Iceberg CUBEs,' In Proceedings of the ACM SIGMOD, pp.359-369, 1999 https://doi.org/10.1145/304182.304214
  4. S.Chaudhuri and U.Dayal. 'An Overview of Data Warehousing and OLAP technology,' In ACM SIGMOD Record, 1996 https://doi.org/10.1145/248603.248616
  5. E.F.Codd, S.B.Codd, and C.T.Salley. 'Providing OLAP(On-Line Analytical Processing) to User-Analysts: An It Mandate,' 1993
  6. P.M.Deshpande, SmAgarwal, et al. 'Computation of Multidimensional Aggregates,' Technical Report-1314, Univ. of Wisconsinn-Madison, 1996
  7. V.Harinarayan, A.Hajaraman, and J.D.UlIman. 'Implementing data cubes efficiently,' In Proceedings of the ACM SIMOD Conference, pp.205-227, 1996 https://doi.org/10.1145/233269.233333
  8. J.Gray, A.Bosworth, A.Laymon, and H.Pirahesh. 'Data Cube: A Relational Aggregation Operator Generalizing Group-by, Cross-tabs and Sub- Totals,' In Proceedings of the 12th ICDE, pp.12-159, 1996 https://doi.org/10.1109/ICDE.1996.492099
  9. S.Sarawagi, R.Agarwal, and A.Gupta. 'Modeling multidimensional databases,' In Proceedings of the 13th ICDE, pp.232-243, 1997
  10. S.Sarawagi, R.Agrawal, and A.Gupta, 'On Computing The Data Cube,' Research Report RJ 10026, IBM Almaden Research Center, San Jose, California, 1996. Available from http://www.almaden.ibm.com/cs/quest
  11. A.Shukla, P.M.Deshpande, J.F.Naughton, and K.Ramasamy, 'Storage estimation for multidimensional aggregates in the presence of hierarchies,' In Proceedings of the 22nd VLDB Conference, pp,522-531, 1996
  12. Y.Zhao, P.M.Deshpande, and J.F.Naughton. 'An ArrayBased Algorithm for Simultaneous Multidimensional Aggregates,' In Proceedings of the ACM SIGMOD Conference, pp.159-170, 1997