• Title/Summary/Keyword: XML 문서 검색

Search Result 468, Processing Time 0.029 seconds

Design of a Retrieval System using Metadata in XML Links (XML 링크의 메타데이타를 이용한 검색 시스템의 설계)

  • 김상준;김은정;배종민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.157-159
    • /
    • 2000
  • 인터넷의 보편화로 정보 교환이 활발해지면서 일반 사용자들에게 필요한 정보를 손쉽게 취득하게 해주는 정보 검색 시스템의 역할이 아주 중요하게 되었다. 일반적인 정보 검색은 사용자의 질의에 대해 문서내의 색인어 발생 빈도를 기반으로 관련 문서를 찾 준다. 본 논문에서는 XML 링크 정보를 이용하여 링크를 검색하여 관련 문서를 찾아주는 정보 검색 시스템을 제시한다. 이를 위해 XML 링크에서 ROLE 속성값인 메타 데이터를 색인하여 저장하고 링크에 대한 모든 정보를 저장하고, 이를 기반으로 특정 주제에 대한 검색시, 특정 주제로 가장 많이 링크된 문서를 검색한다. 제시한 방법을 현재 웹상에서 주로 이용되는 HTML 문서를 기반으로 분석해 본 결과 그 필요성을 확인할 수 있었다.

  • PDF

Design of An Efficient XML Documents Storage schema Using ORDB (객체관계 데이터 베이스를 이용한 효율적인 XML 문서 저장 스키마 설계)

  • 최윤진;이언배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.4-6
    • /
    • 2004
  • 본 논문에서는 객체관계 데이터베이스를 이용하여 XML문서를 저장하기 위한 효율적인 XML문서 저장 스키마를 제안한다. 제안하는 저장 스키마는 XML 문서를 구성하는 모든 구성요소를 모델링하여 데이터베이스 테이블을 구성하였으므로 스키마 생성과정에서 일부 구성요소를 다루지 않음으로 인해 발생할 수 있는 정보 손실 가능성을 제거하였다. 또한 이는 DTD 독립적인 저장 스키마이므로 모든 XML 문서에 대해 공통 스키마로 이용될 수 있어 효율적이며 저장 및 검색의 투명성을 높일 수 있는 장정이 있다. 제안한 스키마는 상용 객체관계 데이터베이스인 오라클 9i에 적용하여 테이블을 구성하고 저장 및 검색과정을 실험하였으며 실험결과 XML문서의 모든 구성요소에 대해 정보 손실 없이 다양한 형태의 검색이 가능함을 확인하였다.

  • PDF

Development of XML DBMS based on Generic Data Model (Generic Data Model 기반의 XML DBMS 개발)

  • 임종선;주경수
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.359-362
    • /
    • 2002
  • XML DBMS는 XML 문서의 직접적인 접근과 문서의 부분, 문서와 그 문서의 부분들을 통한 질의를 할수 있는 능력을 가져야 한다. 이러한 XML DBMS의 사용은 복잡한 계층적 관계의 범위로부터 데이터를 얻어내는데 특히 유용하게 사용될 수 있다. 일반적으로 XML DBMS를 구축하기 위해서는 다른 DBMS 위에 덧붙이거나, 처음부터 새로 만들거나, 새 제품을 구입할 수 있을 것이다. 처음부터 생성하는 것은 메모리 할당과 문서 조각의 효율적인 검색을 신중히 생각해야 한다. 또한 XML DBMS를 구입하는 것은 기존의 자료가 없고, 프로젝트가 현존하는 XML DBMS를 원할 경우에는 가장 좋은 솔루션이다. 다른 DBMS 위에 XML DBMS를 구축하는 것은 빠르게 구축할 수 있고, 하부를 구성하는 DBMS의 저장소를 사용할 수 있다는 이점이 있다. 또한 현재 존재하는 애플리케이션들과 기존의 자료와 통합이 쉬울 수 있다. 본 논문은 XML DBMS를 Generic Data Model을 기반으로 하여 설계 및 구현을 하였다. 이는 관계형 데이터베이스에 XML 문서를 저장, 삭제, 검색 할 수 있는 XML Repository system 위에 XML 어댑터를 접목시키는 방법을 사용하였다. 이 방법은 비용이 많이드는 XML DBMS를 사용하지 않고, 기존에 사용되는 DBMS를 이용하여 구축하기 때문에 적은 비용으로도 XML DBMS를 구현할 수 있다.

  • PDF

Design of XPath Query Processor Using SQL: 1999 (SQL:1999를 이용한 XPath질의 처리기의 설계)

  • 황정수;홍의경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.160-162
    • /
    • 2004
  • 인터넷에서 XML은 새로운 정보 환경의 요구사항인 확장성과 문서 관계성의 우수성을 만족하는 표준이다. 이러한 XML 문서 안의 정보 검색을 위해서 XPath 질의어가 널리 사용 중이다. 또한, XML 문서의 체계적인 운용을 위해 데이터베이스에 효율적으로 저장하고 검색하는 연구들이 진행되고 있다. 본 연구에서는 분할 저장 시스템에서 RDBMS 또는 ORDBMS에 XML 문서를 저장하고 검색할 수 있도록 하는 XPath 질의 처리기를 SQL:1999를 이용하여 설계함으로써 좀더 정확하고 빠르게 처리가 가능하도록 하였다.

  • PDF

Design and Implementation of a Retrieval Server for Virtual Documents in the MIRAGE-III Digital Library (MIRAGE-III 디지털도서관에서 가상문서 검색 서버의 설계 및 구현)

  • Lee, Yong-Bae;Maeng, Sung-Hyon
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.8 no.2
    • /
    • pp.219-230
    • /
    • 2002
  • One of the most important functions digital libraries need to offer is to help users find necessary information in a distributed environment in the most efficient and effective manner. In order to meet the goal, it is desirable to link scattered pieces of information and present them as a logically coherent whole when the user wants it, so that he or she doesn't need to know their physical location. The virtual document is an integrated document that the total or part of the physical documents stored in a specific repository are linked dynamically. Our MIRAGE-III digital library system provides a content-based retrieval of physical documents and the virtual documents in XML. This system provides a retrieval of partial documents, attributes and hierarchical structures and linked-documents based in structured documents like XML or SGML. In this paper we describe a methodology of design and implementation of the query processor and retrieval server in the MIRAGE-III digital library system.

Clustering XML Documents Considering The Weight of Large Items in Clusters (클러스터의 주요항목 가중치 기반 XML 문서 클러스터링)

  • Hwang, Jeong-Hee
    • The KIPS Transactions:PartD
    • /
    • v.14D no.1 s.111
    • /
    • pp.1-8
    • /
    • 2007
  • As the web document of XML, an exchange language of data in the advanced Internet, is increasing, a target of information retrieval becomes the web documents. Therefore, there we researches on structure, integration and retrieval of XML documents. This paper proposes a clustering method of XML documents based on frequent structures, as a basic research to efficiently process query and retrieval. To do so, first, trees representing XML documents are decomposed and we extract frequent structures from them. Second, we perform clustering considering the weight of large items to adjust cluster creation and cluster cohesion, considering frequent structures as items of transactions. Third, we show the excellence of our method through some experiments which compare which the previous methods.

A Design and Implementation of XML Document storing and retrieval Framework based on a variant k-ary complete tree and RDF Metadata (가변 K진 완전트리와 RDF메타정보에 기반한 XML문서 저장 및 검색 프레임워크의 설계 및 구현)

  • 김규태;정회경;이수연
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.7 no.4
    • /
    • pp.612-622
    • /
    • 2003
  • This paper studied and proposed a XML document storing-and-retrieval framework based on a variant k-ary complete tree and a RDF metadata, which is composed of an effective storing module to store xml documents, a retrieving module to retrieve xml documents, and a connecting module to make this system intemperate in the web environment. In this storing module, DTD independent DOM based decomposition model using a method of addressing unique ill using a variant k-ary complete tree is adopted and is implemented. Query Processing Module includes a XPath query process and a content based retrieval function using word index for content information. To retrieve more exactly data, a structural retrieval using RDF metadata is adopted and implemented. In order to implement effectively XML document storing and retrieval system in the web environment, API using XML-RPC, API using HTTP's GET, PUT, POST and API using SOAP have been adopted and implemented.

The Path Inverted Index Technique for XML Document Retrieval (XML 문서 검색을 위한 경로 역 색인 기법)

  • Moon, Kyung-Won;Hwang, Byung-Yeon
    • The KIPS Transactions:PartD
    • /
    • v.17D no.2
    • /
    • pp.103-110
    • /
    • 2010
  • Recently, many XML document management systems using the advantage of RDBMS have been actively developed for the storage, processing and retrieval of XML documents. However, fractional pattern-matching query such as the LIKE operations cannot take the advantage of the index of RDBMS because these operations have deteriorated retrieval performance through its inefficient comparison processing. The hierarchical XML storage technique which stores XML documents in RDBMS efficiently, and the path inverted index technique are proposed in this paper. It regards the element of an XML document as a keyword, and focuses on organizing a posting file with path identifiers and sequences to reduce the retrieval time of path based query. Through simulations, our methods have shown about 60% better performance than the conventional method using RDBMS in searching.

Publishing Relational Data to XML Using XPATH (XPATH를 이용하여 관계형 데이터를 XML문서로 출판)

  • 남궁숙;홍의경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.55-57
    • /
    • 2002
  • XML은 확장성, 호환성, 정보의 구조화의 우수성으로 인터넷상에서 정보 교환의 표준으로 자리 매김하고 있다 그러나 대부분의 비즈니스 데이터는 관계형 데이터베이스 시스템에 저장되어 있고 앞으로도 상당한 기간 동안 그러할 것이다. 이에 따라. 관계형 데이터를 XML 문서로 변환, 출판하기 위한 연구가 활발히 진행 중이다. 본 연구에서 관계형 데이터를 XPATH 질의어를 동하여 검색하고 XML 문서로 변환하기에 적합하도록 관계형 데이터베이스의 저장 스키마를 설계하였다. 그리고, XPATH 질의어를 SQL 문장으로 변환하여 관계형 데이터를 검색하였고, 질의 결과를 DOM 형식의 XML 문서로 생성하였다.

  • PDF

Performance Evaluation of XML Document Storage System (XML 문서 저장 시스템의 성능 평가)

  • 박민경;홍의경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.82-84
    • /
    • 2001
  • 최근 정보교환을 위한 표준으로 XML의 활용이 늘어나면서 XML 문서의 저장 및 검색에 관한 연구가 활발히 진행되어 왔다. 본 연구에서는 저장하부구조로서 객체관계 데이터베이스시스템(Odysseus)뿐만 아니라 RDBMS를 이용하여 XML 문서 저장 시스템의 성능을 평가한다. XML 문서가 특정 DTD(Document Type Definition)를 따르게 되면 XML 문서를 파싱하고 그에 맞는 스키마를 설계해야 하는 단점이 있지만 DTD와 결합된 XML 문서는 XML-QL과 같은 질의 언어를 사용하여 휠씬 다양만 질의를 수행할 수 있게 한다. 따라서 DTD 의존적인 XML 문서 저장 시스템을 특정 자료를 통해 설계해 볼 필요가 있다. 여기서는 증권 정보를 이용해서 저장 시스템을 설계하고 대용량 데이터의 검색 시간을 측정함으로써 이 시스템의 성능을 평가한다. 또한 시스템간의 성능을 비교하고 성능 개선을 위한 방법을 제시한다.

  • PDF