An Efficient XML Query Processing Method using Path Containment Relationships

;;

Journal of KIISE:Databases (한국정보과학회논문지:데이타베이스)

Volume 31 Issue 2
/
Pages.183-194
/
2004
/
1229-7739(pISSN)

Korean Institute of Information Scientists and Engineers (한국정보과학회)

An Efficient XML Query Processing Method using Path Containment Relationships

경로 포함 관계를 이용한 효율적인 XML 질의 처리기법

민경섭 (서울대학교 전기컴퓨터공학부) ;
김형주 (서울대학교 전기컴퓨터공학부)

Published : 2004.04.01

PDF KSCI

Download PDF

⟨ Previous Next ⟩

Abstract

As XML is a do facto standard for a data exchange language, there have been several researches on efficient processing XML queries. The most important thing to consider when processing XML queries is how efficiently we can process path expressions in queries. Some previous works make results by performing a sequence of join operations on all records corresponding to labels in the path expression. Others works check the existence of paths in the query using an RDBMS's string comparison operator and make results by extracting the records corresponding to the paths. In this paper we suggested a new query planning algorithm based on path containment relationships and two join operators supporting the planning algorithm. The join operators use only the records related to the paths in a query as input data, scan them only once, and generate result data using a pipelining mechanism. By analysis and experiments, we confirmed that our techniques(a new query planning algorithm and two join operators) achieved significantly higher performance than other previous works.

XML 이 명실상부한 데이타 교환 표준 언어로서 자리 잡아 감에 따라, 효율적인 XML 질의 처리 지원에 대한 많은 연구가 진행되어 왔다. XML 질의 처리에서 가장 중요한 고려 사항은 ‘어떻게 XML 경로식을 효율적으로 처리할 것인가’ 하는 것이다. 기존의 몇몇 연구들은 질의를 구성하는 각 라벨들에 대응되는 모든 데이타에 대해 일련의 조인 연산을 수행하는 방식으로 결과를 생성하였다. 다른 몇몇 연구들은 질의에 포함된 경로를 찾기 위해 RDBMS의 문자열 비교 연산자를 사용하고 찾은 경로들에 대응되는 레코드를 추출하여 결과를 생성하였다. 본 연구에서 우리는 경로 포함 관계를 기반으로 한 새로운 질의 계획 생성 방식과 이를 지원하기 위한 두 개의 새로운 조인 연산자들을 제안하였다. 제안한 조인 연산자들은 질의에 속한 경로들과 관련된 데이타만을 입력 데이타로 사용하며, 매우 적은 비교 연산만을 수행한다. 그리고 파이프라인 기법을 적용하여 결과를 생성한다. 우리는 제안한 기법이 다른 이전 기법들에 비해 높은 성능을 보임을 분석과 실험을 통해 증명하였다.

Keywords

References

Neil Bradley, The XML companion second edition, Addison Wesley, 2000
Alin Deutsch, Mary F. Fernandez, Daniela Florescu, Alon Y. Levy, Dan Suciu, XML-QL, QL, 1998
Hiroshi Ishikawa, Kazumi Kubota, Yasuhiko Kanemasa, XQL: A Query Language for XML Data, QL, 1998
Donald D. Chamberlin, Jonathan Robie, Daniela Florescu, Quilt: An XML Query Language for Heterogeneous Data Sources, WebDB, pp. 1-25, 2000
XQuery 1.0: An XML Query Language W3C Working Draft, http://www.w3.org/TR/xquery/, 2002
Wisconsin XML Data Set, http://www.cs.wisc.edu/niagara/data.html
Chun Zhang, Jeffery Nahgton, David DeWitt, Qiong Luo, and Guy Lohman, On Supporting Containment Queries in Relational Database Management Systems, SIGMOD, pp. 425-436, May 2001 https://doi.org/10.1145/376284.375722
Shurug Al-Khalifa, H.V. Jagadish, Nick Koudas, Jignesh M. Patel, Divesh Srivastava, and Yuqing Wu, Structural Joins : A Primitive for Efficient XML Query Pattern Matching, ICDE, pp. 141-153, February 2002
Shu-Yao Chien, Zografoula Vagena, Donghui Zhang, Vassilis J. Tsotras, and Carlo Zaniolo, Efficient Structural Joins on Indexed XML Documents, VLDB, pp. 263-274, August 2002
Masatoshi Yoshikawa and Toshiyuki Amagasa, XRel : A Path-Based Approach to Storage and Retrieval of XML Documents Using Relational Databases, ACM TOIT, Volume 1, Number 1, pp. 110-141, August 2001 https://doi.org/10.1145/383034.383038
Chiyoung Seo, Sang-won Lee, and Hyoung-Joo Kim, An Efficient Inverted Index Technique for XML Documents using RDBMS. Information and Software Technology (Elsevier Science), Volume 45, Issue 1, pp. 11-22, January 2003 https://doi.org/10.1016/S0950-5849(02)00157-X
Kyung-Sub Min, Hyoung-Joo Kim, An RDBMS-based Inverted Index Technique for Efficient Support of Processing Path Queries on XML Documents with Different Structures, JKISS, Volumn 30, Number 4, pp. 420-428, 2003
Jason McHugh, Serge Abiteboul, Roy Goldman, Dallan Quass, Jennifer Widom, Lore: A Database Management System for Semistructured Data, SIGMOD Record Volume 26, Number 3, pp. 54-66 https://doi.org/10.1145/262762.262770
Roy Goldman and Jennifer Widom, DataGuides : Enabling Query Formulation and Optimization in Semistructured Databases, VLDB, pp. 436-445, August 1997
J. McHugh and J. Widom, Query Optimization for XML, VLDB, September 2001
Quanzhong Li and Bongki Moon, Indexing and Querying XML Data for Regular Path Expression, VLDB, pp. 361-370, September 2001
Haifeng Jiang, Wei Wang, and Hongjun Lu, Holistic Twig Joins on Indexed XML Documents, VLDB, pp. 273-284, September, 2003

Journal of KIISE:Databases (한국정보과학회논문지:데이타베이스)

An Efficient XML Query Processing Method using Path Containment Relationships

경로 포함 관계를 이용한 효율적인 XML 질의 처리기법

Abstract

Keywords

References

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)