DOI QR코드

DOI QR Code

삭제된 노드의 재사용을 이용한 Fast XML 인코딩 기법

Fast XML Encoding Scheme Using Reuse of Deleted Nodes

  • 고혜경 (성결대학교 컴퓨터공학과)
  • Hye-Kyeong Ko (Dept. of Computer Engineering, Sungkyul Universkty)
  • 투고 : 2023.04.16
  • 심사 : 2023.05.05
  • 발행 : 2023.05.31

초록

XML 데이터의 구조를 고려할 때 경로 및 트리 패턴 매칭 알고리즘은 XML 질의 처리에 중요한 역할을 하고 있다. 노드 간의 결정 또는 관계를 용이하게 하기 위해 XML 트리의 노드는 일반적으로 두 노드 간의 조상-후손 관계를 신속하게 설정할 수 있는 방식으로 레이블링된다. 그러나 이러한 기법은 순서에 따른 업데이트로 삽입이 발생할 경우 기존 노드에 레이블을 다시 지정하거나 특정 값을 다시 계산해야 하는 단점이 발생한다. 따라서 현재 레이블링 기법들에서는 레이블을 업데이트 하는 비용이 매우 높다. 본 논문에서는 재레이블링 또는 재계산 없이 순서에 민감한 XML 문서의 업데이트를 지원하는 Fast XML 인코딩 기법이라는 새로운 레이블링을 제안한다. 또한 XML 트리의 동일한 위치에서 삭제된 레이블을 재사용하여 레이블의 길이를 제어한다. 제안한 재사용 알고리즘은 삭제된 모든 레이블을 동일한 위치에 삽입할 때 레이블의 길이를 줄일 수 있다. 실험 결과에서 제안된 기법은 순서에 민감한 질의 및 업데이트를 효율적으로 처리할 수 있다.

Given the structure of XML data, path and tree pattern matching algorithms play an important role in XML query processing. To facilitate decisions or relationships between nodes, nodes in an XML tree are typically labeled in a way that can quickly establish an ancestor-descendant on relationship between two nodes. However, these techniques have the disadvantage of re-labeling existing nodes or recalculating certain values if insertion occurs due to sequential updates. Therefore, in current labeling techniques, the cost of updating labels is very high. In this paper, we propose a new labeling technique called Fast XML encoding, which supports the update of order-sensitive XML documents without re-labeling or recalculation. It also controls the length of the label by reusing deleted labels at the same location in the XML tree. The proposed reuse algorithm can reduce the length of the label when all deleted labels are inserted in the same location. The proposed technique in the experimental results can efficiently handle order-sensitive queries and updates.

키워드

과제정보

이 논문은 2023년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No.NRF-2021R1A2C1012827)

참고문헌

  1. X. Wu, M.-L. Lee, W. Hsu, "A prime number labeling scheme for dynamic ordered XML trees," In proc. of International Conference on Data Engineering, pp. 66-78, 2004. DOI: 10.1109/ICDE.2004.1319985.
  2. J-H. Choi and M. Koo, "A study on the offering of the latest film information using XML Parser," The Journal of the Convergence on Culture Technology (JCCT), vol. 3, no.1, pp. 19-23, 2017. DOI: 10.17703/JCCT.2017.3.1.19.
  3. H. Ko and M. Yang, "An effective XML schema conversion technique for improving XML document reusability using pattern list," International Journal of Internet, Broadcasting and Communication (JIIBC), vol. 9, no.2, pp.11-19, 2017. DOI: 10.7236/IJIBC.2017.9.2.11.
  4. Y. Jung, M. Kang, G. Cha, and S. Kwang, "Open Trade Technical Model using ebXML for FTA with China and Korea," International Journal of Advanced Culture Technology (IJACT) vol. 2, no. 1, pp. 25-29, 2014. DOI: 10.17703/IJACT.2014.2.1.025.
  5. A. Berglund, S.Boag, D.Chamberlin, M. F. Fernandez, M. Kay, J. Robie, J. Simeon, XML Path Language (XPath) 2.0, W3C working draft, 2005.
  6. S. Boag, D. Chamberlin, M. F. Fernandez, D. Florescu, J. Robie, J. Simeon, XQuery 1.0, W3C working draft, 2005.
  7. C. Zhang, J. F. Naughton, D. J. DeWitt, Q. Luo, G. M. Lohman, "On supporting containment queries relational database management systems," In proc. of International ACM SIGMOD Conference on Management of data, pp. 425-436, 2001. DOI: 10.1145/375663.375722.
  8. J. McHugh, S. Abiteboul, R. Goldman, D. Quass, J. Widom, "Lore: A database management system for semistructured data, ACM SIGMOD Record, vol. 2, no. 3, pp. 54-66, 1997. DOI: 10.1145/262762.262770.
  9. Q. Li, B. Moon, "Indexing and querying XML data for regular path expressions," In proc. of International VLDB Conference, pp. 361-370, 2001.
  10. M. Yoshikawa, T. Amagasa, "XRel: A path-based approach to storage and retrieval of XML documents using relational databases," ACM Transaction Internet Technology, vol. 1, no. 1, pp. 110-141, 2001. DOI: 10.1145/383034.383038.
  11. Tatarinov, S. D. Viglas, K. Beyer, J. Shanmugasundaram, E. Shekita, C. Zhang, "Storing and querying ordered XML using a relational database system," In proc. of International ACM SIGMOD Conference Management of Data, pp. 204-215, 2002. DOI: 10.1145/564691.564715.
  12. E. Cohen, H. Kaplan, T. Milo, Labeling dynamic XML trees, In proc. of ACM SIGMOD-SIGACT-SIGART symposium on Principles of Database Systems, pp. 271-281, 2002. DOI: 10.1145/543613.543648.
  13. C. Li, T. W. Ling, M. Hu, "Efficient processing of updates in dynamic XML data," In proc. of International Conference on Data Engineering, pp. 13-22, 2006. DOI: 10.1109/icde.2006.58.
  14. P. O'Neil, E. O'Neil, S. Pal, I. Cseri, G. Schaller, "Ordpaths: Insert-friendly XML node labels," In proc. of Iternational ACM SIGMOD Conf., pp. 903-908, 2004. DOI: 10.1145/1007568.1007686.
  15. C. Li, T. W. Ling, M. Hu, "Reuse or never reuse the deleted labels in XML query processing based on labeling schemes," In proc. of International Conference on Database Systems for Advanced Applications, pp. 659-673, 2006. DOI: 10.1007/11733836_46.
  16. S. Abiteboul, H. Kaplan, T. Milo, "Compact labeling schemes for ancestor queries," In proc. of 12th ACM-SIAM Symporsium on Discrete Algorithms, pp. 547-556, 2001. DOI: 10.1137/s0097539703437211.