Abstract
In this paper, we propose an integrated information retrieval system for distributed multiple KRISTAL-2002 systems by using the metadata information. This system integrates current systems for different areas or systems for the same area with the different schemas so that the users can get the answers by once from the whole systems. The proposed system composes of the Source Server Manager(SSM) supporting the mapping between the integrated metadata database and source server, the Integrated Metadata Manager(ISM) for registering and managing the metadata and schema mapping, the Distributed Query Processor (DQP) for processing the user query into the source server query, the Distributed Data Set Integrated Manager(DDSIM) for transforming the total retrieval results by merging to the HTML format, and the integrated retrieval engine for managing the query results. It is assumed that the integrated metadata follows ISO/IEC 11179 metadata registration procedure with the metadata registry system which is a subsystem of the proposed system. There are two kinds of queries for users; the basic query and the detailed query. The users may select the databases or organizations for results by their own choices before giving the queries. The proposed system has been developed over KRISTAL-2002 systems with $Visual C^{++}\;and\;C^{++}-CGI$ and tested and verified with the six database systems.
본 논문에서는 메타데이터fmf 이용하여 분산된 KRISTAL-2002 기반의 시스템을 통합 검색하는 정보검색시스템의 구현 방법을 제안한다. 이 시스템은 서로 다른 분야에서 사용되고 있는 기개발된 정보검색시스템을 통한 검색하거나, 같은 분야의 시스템이라도 스키마가 다를 경우에 이를 사용자가 마치 하나의 시스템에서 검색하는 것과 같은 통합검색을 수행할 수 있도록 해준다. 본 시스템은 통합메타데이터베이스와 원천서버간의 스키마 매핑을 지원하는 원천서버관리기, 메타데이터를 등록하고 원천서버의 정보와 통합 메타데이터간의 매핑을 관리하고 지원하는 통합메타데이터 관리기, 통합검색을 위한 사용자 신의를 각 원천서버에 적합한 질의로 생성하여 처리하는 분산질의 처리기, 검색된 결과를 통합하여 사용자 화면으로 출력하기 위해 HTML 문서로 변환하는 분산 데이터 셋 관리기, 그리고 통합검색을 위한 통합검색 엔진으로 구성되어 있다. 통합메타데이터는 본 시스템의 일부분인 메타데이터 등록기를 이용하여 ISO/IEC 11179에서 정의된 표준화된 절차고 등록되었다고 가정하여 사용하였다. 사용자는 하나의 통합시스템에서 검색하는 것과 같이 통합검색 화면에서 검색대상 시스템을 선정하고 기본검색과 상세검색을 수행하며, 분야별 혹은 기관별로 검색하고 결과를 볼 수 있도록 하였다. 본 시스템은 KRISTAL-2002 시스템을 기반으로 Visual C++와 C++ CGI를 이용하여 리눅스 상에서 개발되었으며 6개의 서로 다른 데이터베이스fmf 이용하여 실험, 검증하였다.