MIRAGE-III 디지털도서관에서 가상문서 검색 서버의 설계 및 구현

Design and Implementation of a Retrieval Server for Virtual Documents in the MIRAGE-III Digital Library

  • 이용배 (충남대학교 컴퓨터과학과) ;
  • 맹성현 (충남대학교 정보통신공학부)
  • 발행 : 2002.04.01

초록

인터넷이용의 급증에 따라 지식정보화사회 전반의 작업들이 분산환경의 디지털도서관에 저장되어 있는 멀티미디어 컨텐츠를 쉽고 신속하게 찾아 새로운 정보를 생성 또는 공유하는 작업을 통해 이루어진다. 이를 위해 핵심적으로 연구해야 할 부분은 원격지에 흩어져 있는 정보를 효과적으로 연결시켜서 의미있고 일관된 형태로 보여지도록 하는 것이다. 이 목적을 달성하기 위해 디지털도서관에서는 물리적으로 홑어져 있는 정보들이 논리적으로 일관되게 표현될 수 있는 가상공간을 제공해야 하며 가상공간에서 정보가 표현되었을 때 사용자가 원하는 정보를 신속하게 수집하여 제시할 수 있어야 한다. 가상문서(Virtual Document)란 특정 저장장소에 저장되어 존재하던 물리적 문서(Physical Document)들을 대상으로 사용자에게 필요한 일부분 또는 전체를 동적으로 연결하여 통합한 문서를 의미한다. MIRAGE-III 디지털도서관에서는 일반 텍스트문서와 XML로 기술된 구조화된 가상문서를 대상으로 내용기반 검색을 수행한다. 이 시스템에서는 XML 문서구조를 기반으로 부분문서의 검색이 가능하며 문서의 속성 및 계층구조에 대한 검색과 문서간의 링크관계를 이용한 검색도 가능하다. 본 논문에서는 MIRAGE-III 디지털도서관에서의 질의어처리기 및 검색기를 설계하고 구현한 방법론에 대하여 기술한다.

One of the most important functions digital libraries need to offer is to help users find necessary information in a distributed environment in the most efficient and effective manner. In order to meet the goal, it is desirable to link scattered pieces of information and present them as a logically coherent whole when the user wants it, so that he or she doesn't need to know their physical location. The virtual document is an integrated document that the total or part of the physical documents stored in a specific repository are linked dynamically. Our MIRAGE-III digital library system provides a content-based retrieval of physical documents and the virtual documents in XML. This system provides a retrieval of partial documents, attributes and hierarchical structures and linked-documents based in structured documents like XML or SGML. In this paper we describe a methodology of design and implementation of the query processor and retrieval server in the MIRAGE-III digital library system.

키워드

참고문헌

  1. Sung Hyon Myaeng, Mann-Ho Lee, Ji-Hoon Kang, Eun-Il Cho, Yong-Bae Lee, Dong-Soo Lim, Jeong-Mook Lim, Hyo-Jung Oh, Jung-Shik Yang, 'A Digital Library System for Easy Creation/Manipulation of New Documents from Existing Resources', Proceedings of RIAO 2000, pp. 196-208, April 2000
  2. Tuong Dao, 'An Indexing Model for Structured Documents to Support Queries on Content, Structure and Attributes', Proceedings of ADL '98, 1998 https://doi.org/10.1109/ADL.1998.670383
  3. T. Dao, R. Sacks-Davis and J. A. Thom, 'An Indexing Scheme for Structured Documents and its Implementation', Proceedings of the 5th International Conference on Database System for Advanced Applications, April 1997
  4. Sung Hyon Myaeng, Dong-Hyun Jang, Mun-Seok Kim, Zong-Cheol Zhoo, 'A Flexible Model for Retrieval of SGML Documents', Proceedings of ACM SIGIR '98, pp. 138-145, 1998 https://doi.org/10.1145/290941.290980
  5. Ian A. Macleod, 'Storage and Retrieval of Structured Documents', Information Proceeding & Management, Vol. 26, No. 2, 1990 https://doi.org/10.1016/0306-4573(90)90025-W
  6. Lee, Y. K., Yoo, S. J., Yoon, K. & Berra, P. B., 'Index Structure for Structured Documents', in Digital Library '96, 1996 https://doi.org/10.1145/226931.226950
  7. 맹성현, 주종철, 문서구조화와 정보검색, 정보과학회지 제16권 제8호, 1998
  8. Brian E. Travis, Dale C. Waldt, The SGML Implementation Guide, Springer, 1995
  9. Charles F. Goldfarb, The SGML Handbook, Clarendon Press, Oxford, 1990
  10. W. Eliot Kimber, 'What's New and Cool in HyTime', 1997. (available at http://www.isogen.com/papers/newcool.html)
  11. Simon ST. Laurent, XML A Primer, MIS:Press, 1998
  12. eXtensible Markup Language(XML) version 1.0, recommendation 1998. (available at http://www.w3c.org/XML/)
  13. Eric Miller, 'An Introduction to the Resource Description Framework', D-Lib Magazine, May 1998
  14. W3C, Resource Description Framework(RDF) Schema Specification 1.0, 2000. (available at http://www.w3c.org/TR/2000/CR-rdf-schema-20000327/)
  15. Thibadeau, R. et al., 'E-Commerce Catalog Construction: An Experiment with Programmable XML for Dynamic Documents', D-lib Magazine, February 1999
  16. William Y. Arms, Christophe Blanchi, Edward A. Overly, 'An Architecture for Information in Digital Libraries', D-lib Magazine, February 1997
  17. S. Payette, C. Lagoze, 'Flexible and Extensible Digital Object and Repository Architecture(FEDORA)', Proceeding of the 2nd European Conference on Digital Libraries, September 1998
  18. Maristella Agosti, Information Retrieval and Hypertext, in Information Retrieval and Hypertext, Kluwer Acadeic Publishers, 1996
  19. Ricardo Baeza-Yates, Berthier Ribeiro-Neto, 'Structured Queries', in Modern Information Retrieval, Addison Wesley, pp. 106-109, 1999
  20. 맹성현, 장동현, 이용배, 구조화 정보검색 모델 및 알고리즘 개발에 관한 연구, 한국전자통신연구원 위탁과제 최종보고서, 1998
  21. 이계준, 신동욱, 권택근, 'XML 문서의 검색을 위한 효율적인 색인기법과 질의언어(TQL)의 설계', 한국정보과학회 가을 학술발표논문집 Vol. 26, No. 2, 1999
  22. T. Dao, R. Sacks-Davis and J. A. Thom, 'Indexing Structured Text for Queries on Containment Relationships', Proceedings of the 7th Australian Database Conference, Jan. 1996
  23. Dublin Core Community, Dublin Core Metadata Initiative, recommendation 1999. (available at http://purl.org/DC/documents/)
  24. Baker, T. 'Language for Dublin Core', D-lib Magazine, December 1998
  25. Ricardo Baeza-Yates, Berthier Ribeiro-Neto, 'Structured Text Retrieval Model', in Modern Intermation Retrieval, Addison Wesley, pp. 61-65, 1999
  26. Klemens Bohm, Adrian Muller, Eric Neuhold, 'Structured Document Handling - a Case for Integrating Database and Information Retrieval', Proceedings of the third International Conference on Information and Knowledge Management, 1994 https://doi.org/10.1145/191246.191271
  27. 맹성현, 분산환경에서의 멀티미디어 가상문서의 표현 및 검색에 관한 연구, 충남대학교 소프트웨어 연구센터 최종보고서, 1999