동적으로 갱신가능한 XML 데이터에서 레이블 재작성하지 않는 원형 레이블링 방법

A Circle Labeling Scheme without Re-labeling for Dynamically Updatable XML Data

  • 김진영 (서강대학교 컴퓨터공학과) ;
  • 박석 (서강대학교 컴퓨터공학과)
  • 발행 : 2009.04.15

초록

XML은 인터넷과 유비쿼터스 환경의 데이타에 대한 저장과 교환, 출판의 목적으로 널리 사용되고 있다. XML의 광범위한 사용에 따라 XML 데이타를 효율적으로 저장하고 활용하기 위한 방법으로 레이블링 방법이 연구되고 있다. 레이블링 방법에 대한 최근 연구들은 동적으로 업데이트 가능한 XML 문서에 대한 효과적인 레이블링 방법에 중점을 두고 있다. 그러나 레이블 재작성 비용, 레이블 저장을 위한 큰 저장공간 할당 등의 문제점이 있다. 이러한 문제점은 새로운 데이타가 지속적으로 삽입될 경우 더욱 심화된다. 본 논문에서는 XML 문서를 원으로 나타냄으로써 회전수, 부모/자식원의 개념을 적용하여 전체 레이블 저장공간의 효율을 얻는 방법을 제시한다. 그리고 반지름 개념을 적용하여 동일 위치에 지속적인 새로운 데이타 삽입 시에도 레이블의 길이가 증가하지 않으면서 기존 레이블의 변경을 초래하지 않는 방법을 제시한다. 또한 실험을 통해 제안하는 원형 레이블링 방법의 우수성을 보인다. 본 논문은 XML 문서를 원으로 이해하는 새로운 시도를 한 점과 XML 문서의 크기 증가 시 레이블 저장공간의 효율을 얻을 수 있는 점과 동적 XML 환경에서 새로운 데이타의 업데이트 시에 기존 노드들에 대해 레이블 재작성을 피할 수 있는 점에 의미가 있다.

XML has become the new standard for storing, exchanging, and publishing of data over both the internet and the ubiquitous data stream environment. As demand for efficiency in handling XML document grows, labeling scheme has become an important topic in data storage. Recently proposed labeling schemes reflect the dynamic XML environment, which itself provides motivation for the discovery of an efficient labeling scheme. However, previous proposed labeling schemes have several problems: 1) An insertion of a new node into the XML document triggers re-labeling of pre-existing nodes. 2) They need larger memory space to store total label. etc. In this paper, we introduce a new labeling scheme called a Circle Labeling Scheme. In CLS, XML documents are represented in a circular form, and efficient storage of labels is supported by the use of concepts Rotation Number and Parent Circle/Child Circle. The concept of Radius is applied to support inclusion of new nodes at arbitrary positions in the tree. This eliminates the need for re-labeling existing nodes and the need to increase label length, and mitigates conflict with existing labels. A detailed experimental study demonstrates efficiency of CLS.

키워드

참고문헌

  1. T. Bray, J. Paoli, C. Sperberg-McQueen, E. Maler, and F. Yergeau, 'Extensible Markup Language (XML) 1.0,' W3C Recommendation, Vol.6, 2000
  2. J. Clark and S. DeRose, 'XML Path Language (XPath) Version 1.0. W3C Recommendation,' World Wide Web Consortium, 1999
  3. S. Boag, D. Chamberlin, M. Fernandez, D. Florescu, J. Robie, J. Simeon, and M. Stefanescu, 'XQuery 1.0: An XML Query Language,' W3C Working Draft, Vol.15, 2002
  4. S. Al-Khalifa, H. V. Jagadish, N. Koudas, J. M. Patel, D. Srivastava, and Y. Wu, 'Structural Joins: A Primitive for Efficient XML Query Pattern Matching," Proc. of the 10th International Conference on Data Engineering (ICDE), pp. 141-154, 2002
  5. J. McHugh and J. Widom, 'Query Optimization for XML,' Proc. of the 25th International Conference on Very Large Data Bases (VLDB), pp. 315-326, 1999
  6. P. Dietz, 'Maintaining order in a linked list,' Proc. of the 14th annual ACM symposium on Theory of computing, pp. 122-127, 1982 https://doi.org/10.1145/800070.802184
  7. Q. Li and B. Moon, 'Indexing and Querying XML Data for Regular Path Expressions,' The VLDB Journal, pp. 361-370, 2001
  8. M. Duong and Y. Zhang, 'LSDX: a new labeling scheme for dynamically updating XML data,' Proc. of the 16th Australasian database conference, Vol.39, pp. 185-193, 2005
  9. P. O'Neil, E. O'Neil, S. Pal, I Cseri, G. Schaller, and N. Westbury, 'ORDPATHs: insert-friendly XML node labels,' in Proc. of the 2004 ACM SIGMOD international conference on Management of data, Paris, France, 2004, pp. 903-908 https://doi.org/10.1145/1007568.1007686
  10. A. Khaing and N. Thein, 'A Persistent Labeling Scheme for Dynamic Ordered XML Trees,' in Proc. of the 2006 IEEE/WIC/ACM International Conference on Web Intelligence, 2006, pp. 498-501 https://doi.org/10.1109/WI.2006.23
  11. X. Wu, M. Lee, and W. Hsu, 'A prime number labeling scheme for dynamic ordered XML trees,' in Proc. of the 20th International Conference on Data Engineering (ICDE), 2004, pp. 66-78
  12. R. Thonangi, 'A Concise Labeling Scheme for XML Data,' in Proc. of ACM SIGMOD, COMAD, 2006
  13. V. Gaede and O. Gunther, 'Multidimensional access methods,' ACM Computing Surveys (CSUR), Vol. 30, pp. 170-231, 1998 https://doi.org/10.1145/280277.280279
  14. J-G. Lee, K.-Y. Whang, W.-S. Han, and I-Y. Song, 'The dynamic predicate: integrating access control with query processing in XML databases,' The VLDB Journal, Vol.16, pp. 371-387, 2007 https://doi.org/10.1007/s00778-006-0037-7
  15. A. Schmidt, F. Waas, M. Kersten, M. J. Carey, I. Manolescu, and R. Busse, 'XMark: a benchmark for XML data management,' in Proceedings of the 28th international conference on Very Large Data Bases Hong Kong, China: VLDB Endowment, 2002