An Efficient XML Query Processing Method using Path Containment Relationships

경로 포함 관계를 이용한 효율적인 XML 질의 처리기법

  • 민경섭 (서울대학교 전기컴퓨터공학부) ;
  • 김형주 (서울대학교 전기컴퓨터공학부)
  • Published : 2004.04.01

Abstract

As XML is a do facto standard for a data exchange language, there have been several researches on efficient processing XML queries. The most important thing to consider when processing XML queries is how efficiently we can process path expressions in queries. Some previous works make results by performing a sequence of join operations on all records corresponding to labels in the path expression. Others works check the existence of paths in the query using an RDBMS's string comparison operator and make results by extracting the records corresponding to the paths. In this paper we suggested a new query planning algorithm based on path containment relationships and two join operators supporting the planning algorithm. The join operators use only the records related to the paths in a query as input data, scan them only once, and generate result data using a pipelining mechanism. By analysis and experiments, we confirmed that our techniques(a new query planning algorithm and two join operators) achieved significantly higher performance than other previous works.

XML 이 명실상부한 데이타 교환 표준 언어로서 자리 잡아 감에 따라, 효율적인 XML 질의 처리 지원에 대한 많은 연구가 진행되어 왔다. XML 질의 처리에서 가장 중요한 고려 사항은 ‘어떻게 XML 경로식을 효율적으로 처리할 것인가’ 하는 것이다. 기존의 몇몇 연구들은 질의를 구성하는 각 라벨들에 대응되는 모든 데이타에 대해 일련의 조인 연산을 수행하는 방식으로 결과를 생성하였다. 다른 몇몇 연구들은 질의에 포함된 경로를 찾기 위해 RDBMS의 문자열 비교 연산자를 사용하고 찾은 경로들에 대응되는 레코드를 추출하여 결과를 생성하였다. 본 연구에서 우리는 경로 포함 관계를 기반으로 한 새로운 질의 계획 생성 방식과 이를 지원하기 위한 두 개의 새로운 조인 연산자들을 제안하였다. 제안한 조인 연산자들은 질의에 속한 경로들과 관련된 데이타만을 입력 데이타로 사용하며, 매우 적은 비교 연산만을 수행한다. 그리고 파이프라인 기법을 적용하여 결과를 생성한다. 우리는 제안한 기법이 다른 이전 기법들에 비해 높은 성능을 보임을 분석과 실험을 통해 증명하였다.

Keywords

References

  1. Neil Bradley, The XML companion second edition, Addison Wesley, 2000
  2. Alin Deutsch, Mary F. Fernandez, Daniela Florescu, Alon Y. Levy, Dan Suciu, XML-QL, QL, 1998
  3. Hiroshi Ishikawa, Kazumi Kubota, Yasuhiko Kanemasa, XQL: A Query Language for XML Data, QL, 1998
  4. Donald D. Chamberlin, Jonathan Robie, Daniela Florescu, Quilt: An XML Query Language for Heterogeneous Data Sources, WebDB, pp. 1-25, 2000
  5. XQuery 1.0: An XML Query Language W3C Working Draft, http://www.w3.org/TR/xquery/, 2002
  6. Wisconsin XML Data Set, http://www.cs.wisc.edu/niagara/data.html
  7. Chun Zhang, Jeffery Nahgton, David DeWitt, Qiong Luo, and Guy Lohman, On Supporting Containment Queries in Relational Database Management Systems, SIGMOD, pp. 425-436, May 2001 https://doi.org/10.1145/376284.375722
  8. Shurug Al-Khalifa, H.V. Jagadish, Nick Koudas, Jignesh M. Patel, Divesh Srivastava, and Yuqing Wu, Structural Joins : A Primitive for Efficient XML Query Pattern Matching, ICDE, pp. 141-153, February 2002
  9. Shu-Yao Chien, Zografoula Vagena, Donghui Zhang, Vassilis J. Tsotras, and Carlo Zaniolo, Efficient Structural Joins on Indexed XML Documents, VLDB, pp. 263-274, August 2002
  10. Masatoshi Yoshikawa and Toshiyuki Amagasa, XRel : A Path-Based Approach to Storage and Retrieval of XML Documents Using Relational Databases, ACM TOIT, Volume 1, Number 1, pp. 110-141, August 2001 https://doi.org/10.1145/383034.383038
  11. Chiyoung Seo, Sang-won Lee, and Hyoung-Joo Kim, An Efficient Inverted Index Technique for XML Documents using RDBMS. Information and Software Technology (Elsevier Science), Volume 45, Issue 1, pp. 11-22, January 2003 https://doi.org/10.1016/S0950-5849(02)00157-X
  12. Kyung-Sub Min, Hyoung-Joo Kim, An RDBMS-based Inverted Index Technique for Efficient Support of Processing Path Queries on XML Documents with Different Structures, JKISS, Volumn 30, Number 4, pp. 420-428, 2003
  13. Jason McHugh, Serge Abiteboul, Roy Goldman, Dallan Quass, Jennifer Widom, Lore: A Database Management System for Semistructured Data, SIGMOD Record Volume 26, Number 3, pp. 54-66 https://doi.org/10.1145/262762.262770
  14. Roy Goldman and Jennifer Widom, DataGuides : Enabling Query Formulation and Optimization in Semistructured Databases, VLDB, pp. 436-445, August 1997
  15. J. McHugh and J. Widom, Query Optimization for XML, VLDB, September 2001
  16. Quanzhong Li and Bongki Moon, Indexing and Querying XML Data for Regular Path Expression, VLDB, pp. 361-370, September 2001
  17. Haifeng Jiang, Wei Wang, and Hongjun Lu, Holistic Twig Joins on Indexed XML Documents, VLDB, pp. 273-284, September, 2003