• Title/Summary/Keyword: XML 문서 검색

Search Result 468, Processing Time 0.028 seconds

Development of Automatic XML Converter for Multimedia Technical Documents (멀티미디어 기술문서를 위한 자동 XML 변환기 개발)

  • 박건일;김유성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.45-47
    • /
    • 1999
  • 전자도서관과 같은 문서 정보 검색 시스템의 구축을 위한 중요한 요소 기술은 지금까지 출판물로 만들어 놓은 기존의 방대한 자료와 이미 다양한 형식으로 전자문서화 되어 있는 문서정보를 사용자에게 얼마나 단일 형식으로 통일화시켜 효과적으로 제공할 수 있는가이다. 본 논문은 이러한 문제에 있어서 표준화된 단일 전자문서 형식으로 XML 문서를 적용시키기 위해 국립 중앙 도서관 표준 SGML DTD를 XML DTD로 재정의한 후, 일반적이로, 다양한 특성을 지닌 멀티미디어 기술 문서를 표준화된 XML 문서로 자동 변환하는 자동 XML 변환기를 개발하는 것을 목적으로 하고 있다. 자동 XML 변환기는 다양한 문서형식의 전자문서를 표준화된 XML 문서로 자동변환함으로써 문서 정보검색 시스템에서의 문서정보의 교환, 저장방법상의 표준화 및 문서 형식의 단일화를 제공해 줄 수 있다.

  • PDF

Retrieval algorithm for Web Document using XML DOM (XML DOM을 이용한 웹문서 검색 알고리즘)

  • 김노환;정충교
    • Journal of the Korea Computer Industry Society
    • /
    • v.2 no.6
    • /
    • pp.775-782
    • /
    • 2001
  • Until recently Web retrieval engine has presented a demanded document to users according to the amount and the frequency of inquired key words in each document under the assumption that the more key words a document has, the more accessible it is. This method of searching doesn't matter to a normal document such as HTML Web data in which structural information is not involved. However, Web data realized in XML contains structural information and modeling of graphic forms is also available. Therefore, in the case of XML, this method leads to no less trouble since it depends only on the frequency of key words. We consider that this problem can be resolved by way of inquiry which is similar to SQL. This form of inquiry enables us to snatch an exact data we want in a quick and clear way with a full advantage of structural quality of XML, overcoming the shortcomings of frequency-based engine. In this paper, We aim to design a model of information retrieval system of XML data using XML DOM and consider its algorithm related with it.

  • PDF

Path Combining System of XML Documents based on Relational DBMS (관계형 DBMS 기반의 XML 문서 경로 통합 시스템)

  • Lee, Bum-Suk;Hwang, Byung-Yeon
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.4
    • /
    • pp.415-422
    • /
    • 2008
  • With the increasing use of XML, considerable research is being conducted on the XML document management systems for more efficient storage and searching of XML documents. Depending on the base systems, these researches can be classified into object-oriented DBMS (OODBMS) and relational DBMS (RDBMS). OODBMS-based systems are better suited to reflect the structure of XML-documents than RDBMS based ones. However, using an XML parser to map the contents of documents to relational tables is a better way to construct a stable and effective XML document management system. The proposed X-Binder system uses an RDBMS-based inverted index; this guarantees high searching speed but wastes considerable storage space. To avoid this, the proposed system incorporates a path combining module agent that combines paths with sibling relations, and stores them in a single row. Performance evaluation revealed that the proposed system reduces storage wastage and search time.

  • PDF

An Efficient Indexing Method For XML Documents Using Pre-Order List (Pre-Order List를 이용한 XML문서의 효과적인 색인방법)

  • 김영;박상호;박선;이주홍;홍준식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.154-156
    • /
    • 2004
  • 최근 XML은 인터넷상의 데이터의 표현 및 교환의 표준으로 인식되면서 XML에 대한 많은 연구가 이루어지고 있다 특히 XML문서의 정보량이 방대해짐에 따라 빠른 검색의 필요로 많은 인덱싱 기법들이 제안되었다. 최근의 연구 중, 패스를 기반으로 하는 인덱싱 기법들은 중간노드와 최하위노드의 검색, 조상-후손관계의 조인연산 등에서 성능이 떨어지는 경향이 있다. 이를 보완하기 위해 연구된 Numbering-Scheme 기반의 인덱싱 기법들은 대부분의 검색에서 우수한 성능을 보인다. 그러나 하위 노드가 늘어나는 경우엔 검색 오버헤드가 커질 수 있으며, 대량의 XML 문서나 구조가 다른 XML 문서가 추가되면 인덱스와 데이터 값의 재조정이 필요하게 된다. 이러한 문제를 해결하기 위하여 본 논문은 Numbering-Scheme을 기반으로 각 노드별 노드범위(Node-Range)와 Pre-Order List물 추가하여 검색성능을 높이고, 데이터의 삽입, 삭제에 효과적인 인덱싱 기법을 제안한다.

  • PDF

Design and Implementation of EDI Construction System using XQuery Processor based on Relational Database System (관계 데이터베이스 시스템 기반 XQuery 질의 처리기를 이용한 EDI 구축 시스템의 설계 및 구현)

  • 김지선;홍의경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.190-192
    • /
    • 2003
  • XML이 확장성과 문서 관계성의 우수성을 인정 받아 새로운 정보 공유 환경의 데이터 교환의 표준으로 각광 받으면서 기존의 EDI와 연동하여 XML을 사용할 수 있는 XML/EDI 시스템의 필요성이 대두되었다. 본 연구는 EDI 전자 문서를 관계 데이터베이스 시스템(RDBMS)을 통해 XML 문서 형식으로 저장하고 검색할 수 있게 하기 위해서 서울시립대학교에서 설계한 XML 문서 저장 기법을 사용하였으며. XPath, XQuery 질의를 SQL문 으로 변환시켜서 수행함으로써 EDI 전자 문서에 대한 검색 및 원하는 정보로만 구성된 EDI 문서 생성을 가능하게 하였다.

  • PDF

An Experimental Study on the Performance of Element-based XML Document Retrieval (엘리먼트 기반 XML 문서검색의 성능에 관한 실험적 연구)

  • Yoon, So-Young;Moon, Sung-Been
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.1 s.59
    • /
    • pp.201-219
    • /
    • 2006
  • This experimental study suggests an element-based XML document retrieval method that reveals highly relevant elements. The models investigated here for comparison are divergence and smoothing method, and hierarchical language model. In conclusion, the hierarchical language model proved to be most effective in element-based XML document retrieval with regard to the improved exhaustivity and harmed specificity.

Design of XML Document Management System based on Schema (스키마 기반의 XML문서 관리 시스템 설계)

  • 조윤기;김영란
    • Journal of the Korea Society of Computer and Information
    • /
    • v.6 no.4
    • /
    • pp.85-93
    • /
    • 2001
  • As progressing rapidly to the information society and increasing greatly the amount of information, many researchers have been made utilizing XML to store and retrieval the information effectively. But, many other existing method could not support various structured retrieval method for specific parent, children and sibling nodes. In this paper, we propose (1)an effective method of representation for structured information and of indexing mechanism using OETID(Ordered Element Type ID) for effective management and structured retrieval of the XML documents. Also it contains another proposal that is (2) a documents integration mechanism for retrieval result and storing technique to store structural information of the XML documents. With our methods, we could effectively represent structural information of XML documents, and could directly access the specific elements and process various queries by simple operations.

  • PDF

A Experimental Study on the Usefulness of Structure Hints in the Leaf Node Language Model-Based XML Document Retrieval (단말노드 언어모델 기반의 XML문서검색에서 구조 제한의 유용성에 관한 실험적 연구)

  • Jung, Young-Mi
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.1 s.63
    • /
    • pp.209-226
    • /
    • 2007
  • XML documents format on the Web provides a mechanism to impose their content and logical structure information. Therefore, an XML processor provides access to their content and structure. The purpose of this study is to investigate the usefulness of structural hints in the leaf node language model-based XML document retrieval. In order to this purpose, this experiment tested the performances of the leaf node language model-based XML retrieval system to compare the queries for a topic containing only content-only constraints and both content constrains and structure constraints. A newly designed and implemented leaf node language model-based XML retrieval system was used. And we participated in the ad-hoc track of INEX 2005 and conducted an experiment using a large-scale XML test collection provided by INEX 2005.

Design and Implementation of a XML Repository System using RDBMS and IRS (RDBMS와 IRS를 이용한 XML 저장관리 시스템 설계 및 구현)

  • Gang, Hyeong-Il;Choe, Yeong-Gil;Lee, Jong-Seol;Yu, Jae-Su;Jo, Gi-Hyeong
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.7 no.1
    • /
    • pp.1-11
    • /
    • 2001
  • 본 논문에서는 관계형 데이타베이스인 오라클과 IRS중 하나인 BRS를 사용하여 XML 저장관리 시스템을 설계 및 구현한다. XML저장관리 시스템의 내용 검색과 인덱스 추출을 위해 BRS 검색 시스템을 사용하였으며, XML 문서, 구조정보, DTD, 이미지 등을 저장하기 위해 오라클을 사용하였다. 본 논문에서 구현한 저장관리 시스템은 질의 처리기, 검색결과생성기, XML 객체관리자, XML 인덱스 관리자, 구조검색엔진 등으로 구성된다. 구현된 XML 저장관리 시스템은 XML 문서에 대한 내용검색뿐만 아니라 구조적 특징 또는 대트리뷰트에 기반한 검색을 효율적으로 제공한다. 구현한 저장관리 시스템은 문서 저장 시간, 문서 추출 시간, 내용 검색 시긴 등에 대해서 분할 모델 저장관리 시스템과 비교한다.

  • PDF

An Efficient Path Combining Strategy of XML Document (XML 문서의 효율적인 경로 통합 기법)

  • Lee, Bum-Suk;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.19-22
    • /
    • 2005
  • XML은 비즈니스 메시징, 웹사이트 정보 통합, 그리고 카탈로그 통합 등의 분야에서 다양한 데이터를 표현하기 위한 포맷으로 급격하게 성장했다. 그러나 XML 데이터의 형태가 고정되어 있지 않기 때문에 전통적인 질의 방법이 항상 정확한 결과를 보여주지는 않는다. 또한 객체 지향 DBMS가 이 영역에 적합한지의 여부는 아직 명확하지 않다. 따라서 XML 데이터를 효율적으로 검색하기 위해 기존의 관계형 DBMS와 연계하여 구조 유사성을 기반으로 하는 검색 기법이 연구되고 있다. 그 중 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스를 이용한 검색 시스템은 다른 XML 문서 검색 시스템보다 훨씬 빠른 수행 속도를 보여주지만, 3차원의 메모리 구조를 사용하여 많은 저장공간을 필요로 하는 단점이 있다. 본 논문에서는 XML 문서를 저장할 때 경로들 사이의 유사성을 이용하여 XML 데이터의 경로를 통합하는 기법에 대해 소개한다. 이렇게 통합된 경로를 이용하여 생성하는 3차원 비트맵 인덱스는 그 크기가 상당히 줄어들게 되고, 기존의 연구에서 보여주었던 문제점들을 해결하게 되었다.

  • PDF