A Flexible Query Processing System for XML Regular Path Expressions

XML 정규 경로식을 위한 유연한 질의 처리 시스템

  • 김대일 (국민은행 카드영업팀 e-Business Unit) ;
  • 김기창 (인하대학,교 정보통신공학부) ;
  • 김유성 (인하대학교 정보통신공학부)
  • Published : 2003.12.01

Abstract

The eXtensible Markup Language(XML) is emerging as a standard format of data representation and exchange on the Internet. There have been researches about storing and retrieving XML documents using the relational database which has techniques in full growth about large data processing, recovery, concurrency control and so on. Since in previous systems same structure information and fundamental operation are used for processing of various kinds of XML queries, only some specific query can be efficiently processed not all types of query. In this paper, we propose a flexible query processing system. To process query efficiently, the proposed system analyzes regular path expression queries, and uses $\theta$-join operation using region numbering values to check ancestor-descendent relationship and equi-join operation using parent's region start value to check parent-child relationship. Thus, the proposed system processes efficiently XML regular path expressions. From the experimental results, we show that proposed XML query processing system is more efficient than previous systems.

반 구조적(semi-structured)이며 표현의 유연성이 높은 XML(extensible Markup Language)은 인터넷에서의 정보 교환의 표준으로 자리잡았다. 많은 문서들이 XML로 작성되고 있으며 이러한 문서들에 대한 효율적인 저장과 검색에 대한 요구가 증가하고 있다. XML 문서들을 저장하는 백엔드(back-end)로서 대량의 정보처리가 가능하고 회복, 동시성 제어 등의 성숙된 기술들을 가지고 있는 관계형 데이타베이스를 이용하는 많은 연구들이 있다. 기존의 관계형 데이타베이스를 이용한 질의 처리 방법들에서는 다양한 질의에 대해 동일한 구조 정보와 기본 연산을 적용하여 질의 처리를 하기 때문에 특정한 질의 형태만을 효율적으로 처리할 수 있다. 본 논문에서는 질의를 분석하여 질의에 적합한 구조 정보와 기본 연산을 적용하는 유연한 질의 처리 시스템을 제안한다. 제안된 질의 처리 시스템은 정규 경로식 XML 질의를 분석하여 부모-자식 관계 파악에는 동등(equi)-조인을 사용하고 부모-자식 관계가 아닌 조상-자손 관계에는 $\theta$-조인을 사용하여 다양한 정규 경로식 질의를 효율적으로 처리한다. 제안된 XML 질의 처리 시스템과 기존의 관계형 데이타베이스를 이용하는 질의 처리 시스템을 비교 실험한 결과 다양한 정규 경로식 질의 처리의 성능 향상을 보였다.

Keywords

References

  1. World Wide Web Consortium(W3C), 'Extensible Markup Language (XMl) 1.0 (Second Edition),' http://www.w3c.org, 2000
  2. Tamino, http://www.softwareag.com/tamino/
  3. eXcelon, http://www.exceloncorp.com/
  4. 박상원, 정재목, 정태산, 김형주, 'XML과 데이타베이스,' 정보과학회지 제1권 제1호, 2001
  5. Jayavel Shanmugasundaram, et al, 'Relational Databases for Querying XML Documents: Limitations and Opportunities,' VLDB, 1999
  6. D. Floresc and D. Kossman, 'A Performance Evaluation of Alternative Mapping Schemes for Storing XML Data in a Relational Database,' Technical report, INRIA, 1999
  7. M. Yoshikawa, O. Amagasa, T. Shimura, and S. Uemura, 'XRel: A Path-based Approach to Storage and Retrieval of XML Documents Using Relational Databases,' ACM TOIT 1(1), 2001
  8. H. Jiang, et al, 'Path Materialization Revisited: An Efficient Storage Model for XML Data,' Proc. of ADC, 2002
  9. 이명철, '효율적인 구조검색을 지원하는 XQL 질의 처리기의 설계 및 구현', 충남대학교 컴퓨터공학과 석사학위논문, 2001
  10. Chun Zhang, Jeffrey F. Naughton, David J. DeWitt, Qiong Luo, and Guy Lohman, 'On Supporting Containment Queries in Relational Database Management Systems,' Proc. of the SIGMOD, 200l https://doi.org/10.1145/375663.375722
  11. World Wide Web Consortium(W3C), 'XML Path Language(XPath),' http://www.w3.org/TR/xpath
  12. World Wide Web Consortium(W3C), 'Document Object Model(DOM),' http://www.w3.org/DOM/
  13. 권병희, SQL Server Bible, 영진 출판사, 1999
  14. SUN, Java jdk1.3.l, http://java.sun.com/j2se/1.5/docs/api/index.html
  15. IBM, XML4J, http://www.alphaworks.ibm.com/tech/xml4j
  16. Document Object Model(DOM) World Wide Web Consortium(W3c)
  17. SQL Server Bible 권병희
  18. Java jdk1.3.1 SUN
  19. XML4J IBM