The XP-table: Runtime-efficient Region-based Structure for Collective Evaluation of Multiple Continuous XPath Queries

The XP-table: 다중 연속 XPath 질의의 집단 처리를 위한 실행시간 효율적인 영역 기반 구조체

  • 이현호 (안양과학대학 컴퓨터정보학부) ;
  • 이원석 (연세대학교 컴퓨터과학과)
  • Published : 2008.08.15

Abstract

One of the primary issues confronting XML message brokers is the difficulty associated with processing a large set of continuous XPath queries over incoming XML seams. This paper proposes a novel system designed to present an effective solution to this problem. The proposed system transforms multiple XPath queries before their run-time into a new region-based data structure, called an XP-table, by sharing their common constraints. An XP-table is matched with a stream relation (SR) transformed from a target XML stream by a SAX parser. This arrangement is intended to minimize the runtime workload of continuous query processing. Also, system performance is estimated and verified through a variety of experiments, including comparisons with previous approaches such as YFilter and LazyDFA. The proposed system is practically linear- scalable and stable for evaluating a set of XPath queries in a continuous and timely fashion.

XML 메시지 중계기에서의 주요 이슈들 중 하나는 XML 스트림에 대한 다중 연속 XPath질의를 효율적으로 처리하는 방안이다. 본 연구는 이 문제를 효과적으로 해결하기 위한 시스템을 제안한다. 제안되는 시스템에서는 XPath 질의집합을 XP-table이라는 새로운 영역 기반 데이터 구조로 변환한다. XP-table은 대상 질의들의 공통적인 선택조건들을 공유하며, 실행시간 질의 수행 전에 구축된다. XML 스트림은 XP-table과의 효율적 매칭을 위해 스트림 릴레이션(SR)으로 실행시간에 변환된다. 제안된 시스템에서는 XML의 구조적 특성을 반영한 XP-table과 SR 간의 효과적인 매칭 전략이 제시된다. 또한, YFilter나 LazyDFA와 같은 기존 방법론과의 비교를 포함한 일련의 실험들을 통해, 제안 시스템이 질의 처리의 실행시간 부하를 줄임으로써 시간 효율성이 중요한 스트림 환경에서의 안정적 데이타 처리 능력을 보여준다.

Keywords

References

  1. R. Motwani, J. Widom, A. Arasu, B. Babcock, S. Babu, M. Datar, G. Mandu, C. Olston, J. Rosonstein, and R. Varma, Query Processing, Resource Management, and Approximation in a Data Stream Management System, Proc. of CIDR Conf., Asilomar, CA, USA, pp.245-256, 2003
  2. Y. Diao and M. Franklin, Query Processing for High-Volume XML Message Brokering, Proc. of VLDB Conf., pp.261-272, 2003
  3. A. K. Gupta and D. Suciu, Stream Processing of XPath Queries with Predicates, Proc. of SIGMOD Conf, San Diego, CA, USA, pp.419-430, 2003
  4. D. J. Abadi, D. Carney, U. Cetintemel, M. Cherniack, C. Convey, S. Lee, M. Stonebraker, N. Tatbul, and S. Zdonik. Aurora: a new model and architecture for data stream management, VLDB Journal, vol.12(2), pp.120-139, 2003 https://doi.org/10.1007/s00778-003-0095-z
  5. J. Clark and S. DeRose, XML Path Language (XPath) Version 1.0, W3C Recommendation, http:// www.w3.org/TR/1999 /REC-xpath-19991116, 1999
  6. J. Chen, D. J. DeWitt, F. Tian, and Y. Wang. NiagaraCQ: A scalable continuous query system for internet databases, Proc. of SIGMOD Conf., Dallas, Texas, USA, pp.379-390, 2000
  7. S. R. Madden, M. A. Shah, and J. M. Hellerstein, Continuously Adaptive Continuous Queries over Streams, Proc. of SIGMOD Conf, Madison, Wisconsin, USA, 2002
  8. K. Munagala, U. Srivastava, and J. Widom, Optimization of Continuous Queries with Shared Expensive Filters, Proc. of VLDB Conf., Seoul, Korea, 2006
  9. 윤은원, 이원석, 데이타 스트림에서 다중 연속질의의 선택 조건에 대한 실행 순서 결정, 한국정보과학회 2007 한국컴퓨터종합학술대회 논문집 제34권 제1호(C), pp. 25-28, 2007
  10. N. Bruno, L. Gravano, N. Koudas, and D. Srivastava, Navigation- vs. Index-Based XML Multi- Query Processing, Proc. of ICDE Conf., Bangalore, India, pp.139-150, 2003
  11. M. Altinel and M. J. Franklin, Efficient Filtering of XML Documents for Selective Dissemination of Information, Proc. of VLDB Conf., Cairo, Egypt, pp.53-64, 2000
  12. Y. Diao, M. Altinel, M. J. Franklin, H. Zhang, and P. Fischer, Path matching and predicate evaluation for high-performance XML filtering, ACM Transactions on Database Systems, vol.28(4), pp.467-516, 2002 https://doi.org/10.1145/958942.958947
  13. C. Y. Chan, P. Felber, M. Garofalakis, and R. Rastogi, Efficient Filtering of XML Documents with XPath Expressions, VLDB Journal, vol.11, pp.354-379, 2002 https://doi.org/10.1007/s00778-002-0077-6
  14. T. J. Green, A. Gupta, G. Miklau, M. Onizuka, and D. Suciu, Processing XML Streams with Deterministic Automata and Stream Indexes, ACM Transactions on Database Systems, Vol. 29, Issue 4, pp.752-788, 2004 https://doi.org/10.1145/1042046.1042051
  15. 김영현, 강현철, XML 스트림 데이타에 대한 적용력 있는 질의 처리 시스템, 한국정보과학회, 정보과학회논문지 : 데이타베이스 제33권 제3호, pp. 327-341, 2006
  16. 이상욱, 김진, 강현철, XML 레이블링 기법을 이용한 XML 조각 스트림에 대한 질의 처리, 한국정보과학회, 한국정보과학회 학술발표논문집 한국정보과학회 2006 가을 학술발표논문집 제33권 제2호(C), pp. 113-117, 2006
  17. V. Josifovski, M. Fontoura, and A. Barta, Querying XML Streams, VLDB Journal, vol.14, pp.197- 210, 2004 https://doi.org/10.1007/s00778-004-0123-7
  18. Z. G. Ives, A. Y. Halevy, and D. Weld, An XML Query Engine for Network-Bound Data, VLDB Journal, vol.11(4), pp.380-402, 2002 https://doi.org/10.1007/s00778-002-0078-5
  19. H. Su, J. Jian and E. A. Rundensteiner, Raindrop: a uniform and layered algebraic framework for XQueries on XML streams. Proc. of CIKM Conf., New Orleans, Louisiana, USA, pp.279-286, 2003
  20. L. Ding, E.A. Rundensteiner, and G. Herneman, MJoin: A Metadata-Aware Stream Join Operator, Proc. of DEBS Conf., San Diego, CA, USA, 2003
  21. T. Urhan and M. J. Franklin, XJoin: A Reactively-Scheduled Pipelined Join Operator, Bulletin of the IEEE Computer Society Technical Committee on Data Engineering, vol.23(2), pp.27-33, 2000