XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법

Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries

  • 여대휘 (대구가톨릭대학교 공과대학 IT공학부) ;
  • 이종학 (대구가톨릭대학교 공과대학 IT공학부)
  • Yeo, Dae-Hwi (Dept. of IT Engineering, Catholic University of Daegu) ;
  • Lee, Jong-Hak (Dept. of IT Engineering, Catholic University of Daegu)
  • 발행 : 2013.03.30

초록

본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

This paper presents a two-dimensional grouping index(2DG-index) for efficient processing of XML filtering queries. Recently, many index techniques have been suggested for the efficient processing of structural relationships among the elements in the XML database such as an ancestor- descendant and a parent-child relationship. However, these index techniques focus on simple path queries, and don't consider the path queries that include a condition value for filtering. The 2DG-index is an index structure that deals with the problem of clustering index entries in the twodimensional domain space that consists of a XML path identifier domain and a filtering data value domain. For performance evaluation, we have compared our proposed 2DG-index with the conventional one dimensional index structure such as the data grouping index (DG-index) and the path grouping index (PG-index). As the result of the performance evaluations, we have verified that our proposed 2DG-index can efficiently support the query processing in XML databases according to the query types.

키워드

참고문헌

  1. Bray, T., et al., Extensible Markup Language, (XML)1.0. W3C Recommendation, http://www.w3.org/TR /REC-xml-19980210, Feb. 2004.
  2. Fallside, C. D., and Walmsley, P., XML Schema Part 0. W3C Recommendation, http://www.w3.org /TR /xmlschema-0, Oct. 2004.
  3. Berglund, A., et al., "XML Path Language (XPath) 2.0. W3C Working Draft 30 Apr. 2002," http: //www.w3.org/TR/xpath20, Work-ing Draft, 2002.
  4. Haw, S. C., and Lee, C. S.,"Extending Path Summary and Region Encoding for Efficient Structural Query Processing in Native XML Databases," The Journal of Systems and Software Vol. 82, pp. 1025-1035, 2009. https://doi.org/10.1016/j.jss.2009.01.007
  5. 김동수, "Standard Conformance Testing for Seamless B2B e-Commerce Process Integration," 정보기술아키텍처연구, pp. 71-85, 2006년 12월.
  6. Mandawat, P., and Tsotras, V. J., "Indexing schemes for efficient aggregate computation over structural joins," In Proc. of 2005 International Workshop on Web & Data Bases, pp. 55-60, June, 2005.
  7. 손태용, 이종학, "서로 다른 XML 경로상의 동일 요소 타입에 대한 통합 색인구조," 2012년도 한국산업정보학회 춘계학술대회 논문집, 대구가톨릭대학교, pp. 133-136, 2012년 6월.
  8. 손태용, 이종학, "XML 데이터베이스의 여러 동일 요소타입에 대한 경로별 그룹핑 색인구조," 2012년도 한국멀티미디어학회 추계학술발표대회 논문집, 서울대학교, 제 15권, 제 2호, pp. 236-239, 2012년 11월.
  9. 강유진, 정승현, 조완섭, "데이터베이스 클러스터 시스템 환경에서의 중첩 질의 분할 처리 기법," 정보기술아키텍처연구, 제 7권, 제 1호, pp. 89-96, 2010년.
  10. Boag, S., et al., XQuery 1.0: An XML Query Language, http: //www.w3.org/TR/xquery, Nov. 2005.
  11. Dietz, P., "Maintaining order in a linked list," In Proc. of the Fourteenth Annual ACM Symposium on Theory of Computing, pp. 122-127, 1982.
  12. Li, Q., and Moon, B., "Indexing and Querying XML Data For Regular path expression," In Proc. Intl. Conf. on Very Large Data Bases, pp. 361-370, 2001.
  13. Leela, K. P., and Haritsa, J. R., "Schema conscious XML indexing," Information Systems 32, pp. 344-364, 2007. https://doi.org/10.1016/j.is.2005.10.002
  14. Robinson, J. T., "The K-D-B-Tree: A Search Structure for Large Multidimensional Dynamic Indexes," In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, Ann Arbor, Michigan, pp. 10-18, Apr. 1981.
  15. Whang, K. Y., and Krishnamurthy, R., "The Multilevel Grid File - A Dynamic Hierarchical Multidimensional File Structure," In Proc. Intl. Conf. on Database Systems for Advanced Applications (DASFAA), Tokyo, pp. 449-459, Apr. 1991.
  16. Lee, J. H., et al., "A Region Splitting Strategy for Physical Database Design of Multidimensional File Organizations," In Proc. Int'l Conf. on Very Large Data Bases, Athens, Greece, pp. 416-425, Aug. 1997.
  17. BerTino, E., and Kim, W., "Indexing Techniques for Queries on Nested Objects," IEEE Trans. on Knowledge and Data Eng, Vol. 1, No. 2, pp. 196-215, June 1989. https://doi.org/10.1109/69.87960