DOI QR코드

DOI QR Code

관계형 데이터베이스에서 PIVOT 연산과 차등 파일을 이용한 수평 뷰의 점진적인 관리

Incremental Maintenance of Horizontal Views Using a PIVOT Operation and a Differential File in Relational DBMSs

  • 신성현 (한양대학교 BK21 사업단 정보기술분야) ;
  • 김진호 (강원대학교 컴퓨터과학) ;
  • 문양세 (강원대학교 컴퓨터과학) ;
  • 김상욱 (한양대학교 정보통신학부)
  • 발행 : 2009.08.31

초록

OLAP 이나 e-비즈니스 환경에서는 다차원 데이터의 효율적인 분석을 위하여, 데이터를 여러 형태로 표현하거나 저장한다. 이러한 다차원 구조의 데이터를 차원 애트리뷰트들의 값으로 표시되는 넓은 형태의 수평 뷰로 표현한다. 수평 뷰는 여러 소스로부터 수집한 요약 정보를 유지하도록 실체 뷰로서 저장되며, 복잡한 질의들을 효율적으로 처리하기 위해 사용된다. 그러나, 소스 데이터가 변경될 경우 수평 뷰들의 내용도 수정해야 하는 데, 소스 데이터들이 여러 사이트에 분산되어 있기 때문에 수평 뷰를 관리하는 것은 어렵다. 따라서, 본 연구에서는 점진적인 뷰 관리 방법 중의 하나로 차등 파일을 이용하여 수평 뷰를 관리하는 효율적인 방법을 제시한다. 이러한 방법은 상용 RDBMS에서 제공하는 PIVOT 연산을 이용하여 저장된 수직 형태의 소스 테이블을 수평 뷰로 변환하고, 수직 테이블의 변경 사항을 반영한 차등 파일을 이용하여 수평 뷰에서도 동일하게 적용하는 방법이다. 이를 위해, 우선 저장된 수직 테이블에서 수평 뷰로 변환하여 처리하는 전체적인 프레임워크를 제안한다. 제안한 프레임워크 하에서 수직 테이블을 수평 뷰로 변환하는 PIVOT 연산을 정의한다. 다음으로, 수직 테이블로부터 데이터가 변경될 경우, 데이터에 대한 변경 사항을 차등 파일로 저장한 후, 이를 이용하여 수평 뷰를 갱신하는 방법을 제안한다. 특히, 차등 파일의 구조는 수평 뷰의 구조와 다르기 때문에, 수평 뷰에 적합하도록 변경 사항을 변환해야 한다. 마지막으로 실험을 통하여 제안한 방법은 다른 방법에 비해서 평균 1.2$\sim$5.0배까지 성능을 향상시킴을 보인다.

To analyze multidimensional data conveniently and efficiently, OLAP (On-Line Analytical Processing) systems or e-business are widely using views in a horizontal form to represent measurement values over multiple dimensions. These views can be stored as materialized views derived from several sources in order to support accesses to the integrated data. The horizontal views can provide effective accesses to complex queries of OLAP or e-business. However, we have a problem of occurring maintenance of the horizontal views since data sources are distributed over remote sites. We need a method that propagates the changes of source tables to the corresponding horizontal views. In this paper, we address incremental maintenance of horizontal views that makes it possible to reflect the changes of source tables efficiently. We first propose an overall framework that processes queries over horizontal views transformed from source tables in a vertical form. Under the proposed framework, we propagate the change of vertical tables to the corresponding horizontal views. In order to execute this view maintenance process efficiently, we keep every change of vertical tables in a differential file and then modify the horizontal views with the differential file. Because the differential file is represented as a vertical form, its tuples should be converted to those in a horizontal form to apply them to the out-of-date horizontal view. With this mechanism, horizontal views can be efficiently refreshed with the changes in a differential file without accessing source tables. Experimental results show that the proposed method improves average performance by 1.2$\sim$5.0 times over the existing methods.

키워드

참고문헌

  1. Agrawal, R., Somani, A., and Xu, Y., 'Storage and Querying of E-Commerce Data,' In Proc. the 27th Int'l Conf. on Very Large Data Bases (VLDB), Roma, Italy, pp.149-158, Sept., 2001
  2. Chaudhuri, S. and Dayal, U., 'An Overview of Data Warehousing and OLAP Technology,' ACM SIGMOD Record, Vol.26, No.1, pp.65-74, Mar., 1997 https://doi.org/10.1145/248603.248616
  3. Chen, S. and Rundensteiner, E. A., 'GPIVOT: Efficient Incremental Maintenance of Complex ROLAP Views,' In Proc. the 21st Int'l Conf. on Data Engineering (ICDE), IEEE, Tokyo, Japan, pp.552-563, Apr., 2005 https://doi.org/10.1109/ICDE.2005.71
  4. Colby, L., et al., 'Supporting Multiple View Maintenance Polices,' In Proc. of ACM SIGMOD Conf., pp.405-416, 1997
  5. Cunningham, C., Graefe, G., and Galindo-legaria, C. A., 'PIVOT and UNPIVOT: Optimization and Execution Strategies in an RDBMS,' In Proc. the 30th Int'l Conf. on Very Large Data Bases (VLDB), Toronto, Canada, pp.998-1009, Aug., 2004
  6. Elmasri, R. and Navathe, S., Fundamentals of Database Systems, 3rd Ed., Addison-Wesley, 2000
  7. Gray, J., et al., 'Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub- Totals,' Data Mining and Knowledge Discovery, Vol.1, No.1, pp.29-53, Mar., 1997 https://doi.org/10.1023/A:1009726021843
  8. Gupta, A. and Mumick, I., S., 'Maintenance of Materialized Views: Problems, Techniques, and Applications,' IEEE Data Engineering Bulletin, Vol.18, No.2, pp.3-18, 2005
  9. Lakshmanan, L. V. S., Sadri, F., and Subramanian, S. N., 'On Efficiently Implementing SchemaSQL on an SQL Database System,' In Proc. the 25th Int'l Conf. on Very Large Data Bases (VLDB), Edinburgh, Scotland, pp.471-482, Sept., 1999
  10. Lee. W., 'On the Independence of Data Warehouse from Databases in Maintaining Join views,' Lecture Notes in Computer Science, pp.86-109, 1999 https://doi.org/10.1007/3-540-48298-9_9
  11. Mohania, M and Kambayashi, Y., 'Making Aggregate Views Self- Maintainable,' Data and Knowledge Eng., Vol.32, No.1, pp.87-109, 2000 https://doi.org/10.1016/S0169-023X(99)00016-6
  12. Mohania, M., Samtani, S., Roddick, J., and Kambayashi, Y., 'Advances and Research Directions in Data Warehousing Technology,' Australian Journal of Information Systems, Vol.7, No.1, pp.41-59, 1999
  13. Witkowski, A., et al., 'Spreadsheets in RDBMS for OLAP,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, San Diego, California, pp.52-63, June, 2003 https://doi.org/10.1145/872757.872767
  14. Witkowski, A., et al., 'Business Modeling Using SQL Spreadsheets,' In Proc. the 29th Int'l Conf. on Very Large Data Bases (VLDB), Berlin, Germany, pp.1117-1120, Sept., 2003