An Efficient Query Transformation for Multidimensional Data Views on Relational Databases

관계형 데이타베이스에서 다차원 데이타의 뷰를 위한 효율적인 질의 변환

  • 신성현 (강원대학교 컴퓨터학부) ;
  • 김진호 (강원대학교 컴퓨터학부) ;
  • 문양세 (강원대학교 컴퓨터학부)
  • Published : 2007.02.15

Abstract

In order to provide various business analysis methods, OLAP(On-Line Analytical Processing) systems represent their data with multidimensional structures. These multidimensional data are often delivered to users in the horizontal format of tables whose columns are corresponding to values of dimension attributes. Since the horizontal tables nay have a large number of columns, they cannot be stored directly in relational database systems. Furthermore, the tables are likely to have many null values (i.e., sparse tables). In order to manage the horizontal tables efficiently, we can store them as the vertical format of tables which has dimension attribute names as their columns thus transforms the columns of horizontal tables into rows. In this way, every queries for horizontal tables have to be transformed into those for vertical tables. This paper proposed a technique for transforming horizontal table queries into vertical table ones by utilizing not only traditional relational algebraic operators but also the PIVOT operator which recent DBMS versions are providing. For achieving this goal, we designed a relational algebraic expression equivalent to the PIVOT operator and we formally proved their equivalence. Then, we developed a transformation technique for horizontal table queries using the PIVOT operator. We also performed experiments to analyze the performance of the proposed method. From the experimental results, we revealed that the proposed method has better performance than existing methods.

온라인 분석 처리(OLAP, On-Line Analytical Processing)에서는 다양한 분석을 효과적으로 처리하기 위해, 다차원 구조의 데이타를 열에 차원 애트리뷰트의 값이 표시되는 넓은 형태의 수평 테이블로 표현한다. 관계형 테이블들은 보통 애트리뷰트의 개수에 제한이 있으므로 이러한 수평 테이블을 직접저장하기 어렵고, 저장하더라도 많은 수의 널(null) 간을 갖는 희박(sparse) 테이블이 되기 쉽다. 따라서 관계 데이타베이스에서는 이러한 수평 테이블을 차원의 이름을 열로 갖는 수직 테이블로 바꾸어 저장할 수 있다. 이렇게 할 경우, 수평 뷰 테이블에 대한 OLAP 질의를 저장된 수직 테이블에 대한 질의로 변환하는 작업이 필요하다. 본 논문에서는 전통적인 관계 대수 연산자들 외에 최근 DBMS 버전들이 제공하는 PIVOT 연산자를 사용하여 수평적인 뷰의 질의를 효율적으로 변환하는 방법을 제안하였다. 이를 위해 PIVOT 연산과 동등한 관계 대수식을 만들고 이를 증명하였으며, 이 PIVOT 연산을 사용하여 수평적인 테이블에 대한 질의를 수직적인 테이블에 대한 질의로 변환하는 방법을 제시하였다. 또한 실험을 통해 제안한 변환 방법이 기존 방법에 비해 성능이 더욱 우수함을 보였다.

Keywords

References

  1. Chaudhuri, S. and Dayal, U., 'An Overview of Data Warehousing and OLAP Technology,' SIGMOD Record, 26(1): 65-74, 1997 https://doi.org/10.1145/248603.248616
  2. Pilot Software, 'An Introduction to OLAP: Multidimensional Terminology and Technology,' http://www.pilotsw.com/olap/olap.htm
  3. M. Mohania, S. Samtani, J. Roddick and Y. Kambayashi, 'Advances and Research Directions in Data Warehousing Technology,' Australian Journal of Information Systems, Vol. 7, No. 1, pp. 41-59, 1999
  4. J. Gray, S. Chaudhuri, A. Bosworth, A. Layman, D. Reichart, H. Pirahesh, F. Pellow, and H. Pirahesh, 'Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals,' Data Mining and Knowledge Discovery, vol. 1, no. 1, pp. 29-53, 1997 https://doi.org/10.1023/A:1009726021843
  5. A. Witkowski, S. Bellamkonda, T. Bokaya, G. Dorman, N. Folkert, A. Gupta, L. Shen, and S. Subramanian. 'Spreadsheets in RDBMS for OLAP,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, San Diego, CAA, pp. 52-63, 2003
  6. A. Witkowski, S. Bellamkonda, T. Bozkaya, N. Folkert, A. Gupta, L. Sheng, and S. Subramanian, 'Business Modeling Using SQL Spreadsheets,' 'In Proc. of the 29th Int'l Conf. on Very Large Data Bases(VLDB), Berlin, Germany, pp. 1117-1120, 2003
  7. R. Agrawal, A. Somani and Y. Xu. 'Storage and Querying of E-Commerce Data,' In Proc. of the 27th Int'l Conf. on Very Large Data Bases (VLDB), Roma, Italy, pp. 149-158, 2001
  8. Microsoft SQL Server 2005. http://www.microsoft.com/sql
  9. Oracle 9i Database. http://www.oracle.com/database
  10. Y. Zhao, P. Deshpande, and J. Naughton, 'An Array-Based Algorithm for Simultaneous Multidimensional Aggregates,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, Tucson, Arizona, United States, pp. 159-170, 1997
  11. L. V. S. Lakshmanan, F. Sadri, and S. N. Subramanian. 'On efficiently implementing Schema-SQL on an SQL database system,' In Proc, of the 25th Int'l Conf. on Very Large Data Bases (VLDB), Edinburgh, Scotland, pp. 471-482. September 7-10, 1999
  12. C. Cunningham, G. Graefe, and C. A. Galindolegaria. 'PIVOT and UNPIVOT: Optimization and Execution Strategies in an RDBMS,' In Proc. of the 30th Int'l Conf. on Very Large Data Bases (VLDB), Toronto, Canada, pp. 998-1009, 2004
  13. Songting Chen and Elke A. Rundensteiner. 'GPIVOT: Efficient Incremental Maintenance of Complex ROLAP Views,' In Proc. of the 21st Int'l Conf. on Data Engineering(ICDE), pp. 552-563, 2005