An Indexing Model for Efficient Structure Retrieval of XML Documents

XML 문서의 효율적인 구조 검색을 위한 색인 모델

  • 박종관 (대우정보시스템(주)) ;
  • 손충범 (충북대학교 대학원 정보통신공학과) ;
  • 강형일 (주성대학교 멀티미디어정보통신공학부) ;
  • 유재수 (충북대학교 정보통신공학과 및 컴퓨터통신연구소) ;
  • 이병엽 (대우정보시템 e-솔루션사업팀)
  • Published : 2001.10.01

Abstract

In this paper, we propose an indexing model for efficient structure retrieval of XML documents. The proposed indexing model consists of structured information that supports a wide range of queries such as content-based queries and structure-attribute queries at all levels of the document hierarchy and index organizations that are constructed based on the information. To support structured retrieval, a new representation method for structured information is presented. Using this structured information, we design content index, structure index, and attribute index for efficient retrieval. also, we explain processing procedures for mixed queries and evaluate the performance of proposed indexing model. It is shown that the proposed indexing model achieves better retrieval performance than the existing method.

본 논문에서는 XML 문서의 효율적인 구조 검색을 위한 색인 모델을 제안한다. 색이 모델은 문선 계층상의 모든 레벨에서 내용 기반 질의와 구조 및 에트리뷰트 질의와 같은 다양한 질의를 지원하기 위한 구조정보와 이를 이용한 색이 구조로 구성된다. 구조검색을 지원하기 위해 새로운 구조정보 표현 방법을 제안한다. 제안한 구조정보 표현 방법에 따라 표현된 구조정보를 이용해 효율적인 검색을 위한 내용 색인, 구조 색인, 에트리뷰트 색인을 구성한다. 또한 내용과 구조가 혼합된 질의의 처리과정을 설명하고, 제안하는 색인 모델의 성능평가를 보임으로써 기존의 방법보다 성능이 우수함을 보인다.

Keywords

References

  1. 민영수, 강승헌, 강형일, 유재수, 이하욱, 최한석, 'XML 문서를 위한 구조정보 추출기의 설계 및 구현', 한국정보과학회 '99 가을 학술발표논문집(I), 한국정보과학회, pp,81-83, 1999
  2. 연제원, 조정수, 이강찬, 이규철, 'XML 문서 구조검색을 위한 저장 시스템 설계', 한국정보과학회 학술발표논문집(B), 제26권 제1호, pp.3-5 1999
  3. Brian Lowe, Justin Zobel, Ron Sacks-Davis 'A Formal Model for Databases of Structured Text,' Proceedings of the Fourth International Conference on Database Systems for Advanced Applications (DASFAA '95), pp.449-456, 1995
  4. Chow, J. H., Cheng, J., Chang, D., Xu, J., 'Index Design for Structured Documents Based on Abstraction,' Proceedings of the 6th International Conference on Database Systems for Advanced Applications, pp.89-96, 1999 https://doi.org/10.1109/DASFAA.1999.765740
  5. Extensible Markup Language(XML) 1.0, 'http://www.w3.org/TR/1998/REC-xml-19980210'
  6. Jang, H. C., Kim, Y. I., Shin, D. W., 'An Effective Mechanism for Index Update in Structured Documents,' ACM, 1999 https://doi.org/10.1145/319950.320031
  7. Lee, Y. K., Yoo, S. J., Yoon, K. R and Berra, P. B., 'Index Structures for Structured Documents,' Proc. Digital Library 96, pp.91-99, 1996 https://doi.org/10.1145/226931.226950
  8. Kanemoto, H., Kato, H., Kinutani, H., Yoshikawa, M., 'An efficiently updatable index scheme for structured documents,' Database and Expert Systems Applications, pp.991-996, 1996 https://doi.org/10.1109/DEXA.1998.707525
  9. R. Sacks-Davis, T. Arnold-Moore, and J. Zobel, 'Database systems for structured documents,' Proc. The International Symposium on Advanced Database Technologies and Their Integration (ADTI '94), Nara, Japan, pp.277-283, 1994
  10. Shin, D. W., Jang, H. C., Jin, H. L., 'BUS : An Effective Indexing and Retrieval Scheme in Structured Documents,' Proc. Digital Libraries 98, 1998 https://doi.org/10.1145/276675.276702
  11. Sung-Geun Han, Jeong-Han Son, Jae-Woo Chang and Zong-Chel Zhoo, 'Design and Implementation of a Structured Information Retrieval System for SGML documents,' Database Systems for Advanced Applications, pp.81-88, 1999 https://doi.org/10.1109/DASFAA.1999.765739
  12. Tuong Dao, Ron Sacks-Davis, James A. Thom, 'An Indexing Scheme for Structured Documents and its Implementation,' Proceedings of the Fifth International Conference on Database Systems for Advanced Applications (DASFAA '97), pp.125-134, 1997
  13. Tuong Dao, 'An Indexing Model for Structured Documents to Support Queries on Content, Structure and Attributes,' Proceedings of ADL'98, pp.88-97, 1998 https://doi.org/10.1109/ADL.1998.670383
  14. V. Christophides, S. Abiteboul, S. Cluet, M. Schol, 'From Structured Documents to Novel Query Facilities,' SIGMOD, pp.313-324, 1994 https://doi.org/10.1145/191839.191901
  15. 한성근외 4명, '동적 환경에 적합한 SGML 인덱스 관리자의 설계 및 구현', 한국정보처리논문지, 제6권 제10호, 1999