• Title/Summary/Keyword: XML 색인

Search Result 110, Processing Time 0.025 seconds

Indexing Model and Weight Assignment on Keywords for Contents based Retrieval in XML Documents (XML 문서의 내용기반 검색을 위한 인덱싱 모델 및 색인어의 가중치 부여)

  • 한예지;한창우;서동혁;김수희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.103-105
    • /
    • 2004
  • 본 논문에서는 XML 문서의 내용을 효율적으로 검색하기 위해 필요한 메타데이터의 스키마몰 개발하고 이론 바탕으로 구축되는 내용기반 인덱싱 모델을 제안한다. 제안하는 내용기반 인덱싱 모델은 엘리먼트타입에 따라 랭킹 검색과 불리언 검색을 지원한다. 랭킹 검색 결과의 재현도와 정확도를 높이기 위해, 검색 결과의 출력 기준 노드가 리프 노드와 내부 노드인 경우를 구별하여 색인어에 대한 가중치를 부여하고, 이를 이용하여 질의와 엘리먼트간의 유사도를 계산하는 방법을 제안한다.

  • PDF

Design of XML Document Management System based on Schema (스키마 기반의 XML문서 관리 시스템 설계)

  • 조윤기;김영란
    • Journal of the Korea Society of Computer and Information
    • /
    • v.6 no.4
    • /
    • pp.85-93
    • /
    • 2001
  • As progressing rapidly to the information society and increasing greatly the amount of information, many researchers have been made utilizing XML to store and retrieval the information effectively. But, many other existing method could not support various structured retrieval method for specific parent, children and sibling nodes. In this paper, we propose (1)an effective method of representation for structured information and of indexing mechanism using OETID(Ordered Element Type ID) for effective management and structured retrieval of the XML documents. Also it contains another proposal that is (2) a documents integration mechanism for retrieval result and storing technique to store structural information of the XML documents. With our methods, we could effectively represent structural information of XML documents, and could directly access the specific elements and process various queries by simple operations.

  • PDF

Ordered Indexing Technique for Storing XML Data Using Relational Databases (관계형 데이터베이스 기반 색인을 이용한 XML 테이터의 저장 기법)

  • 손대준;정병수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.205-207
    • /
    • 2004
  • 인터넷의 급속한 발전으로 인해 다양한 종류의 데이터들이 증가하게 되었으며 이러한 데이터의 표현과 데이터 교환을 위해 XML이 사실상의 표준으로 빠르게 자리 잡아 가고 있다. XML문서를 데이터로 저장 시 오랜 기간에 걸쳐서 성숙된 RDBMS를 사용하여 XML데이터를 RDBMS로 저장 시 발생할 수 있는 단편화 방지와 XML질의의 효과적인 질의 처리에 대한 많은 연구들이 제안되었다. 본 논문에서는 XML 문서를 관계형 데이터베이스 스키마로 저장 시 발생할 수 XML문서내의 엘리먼트의 관계에 대한 정보를 저장하기 위해서 추가적으로 발생하는 정보의 수를 줄이고 엘리먼트간의 관계를 효과적으로 저장할 수 있는 방법에 대해서 연구한다.

  • PDF

A Path Combining Strategy for Efficient Storing of XML Documents (XML 문서의 효율적인 저장을 위한 경로 통합 기법)

  • Lee, Bum-Suk;Hwang, Byung-Yeon
    • Journal of Korea Multimedia Society
    • /
    • v.9 no.10
    • /
    • pp.1257-1265
    • /
    • 2006
  • As XML is increasingly used, the need of researches which are related with XML in various fields is also augmented. Many XML document management systems have been actively developed especially for the storage, processing and retrieval of XML documents. The BitCube is a three dimensional bitmap index system that could be manipulated efficiently and improves the performance of document retrieval. However, the site of index is increase rapidly, when a new bit is added to the axis. This problem is caused by its three dimensional memory structure with document, path and word. We suggest a path combining strategy of XML documents in this paper to solve the problem of BitCube that mentioned above. To reduce the size of index, our approach combines sibling nodes that has same ancestor paths, and transforms word axis into value axis. The method reduces the size of index, when the system com poses the three dimensional bitmap index. It also improves the speed of retrieving, and takes efficiency in storage space.

  • PDF

Information Retrieval from XML Documents based on Contents (내용기반 XML 문서의 검색)

  • 김수희;조명찬;한예지
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.73-75
    • /
    • 2003
  • 이 연구에서는 XML 문서의 효율적인 검색을 위해 XML 데이터에서 색인어를 추출하고 가중치를 부여하여 내용기반 인덱스를 구축하고, 질의와 문서간의 유사도가 높은 문서들을 사용자에게 제공함으로써 기존의 경로 중심 혹은 패턴매칭 형태의 XML 문서 검색 기능을 확장하고자 한다. 내용기반 검색을 지원하는 XML 문서 검색시스템을 설계하고, 내용기반 검색과 관련한 이슈들을 논의한다. 개발 중에 있는 연구용 프로토타입 시스템을 이용하여 질의에 대한 내용기반 검색 결과를 간단히 소개한다.

  • PDF

Design of a Retrieval System using Metadata in XML Links (XML 링크의 메타데이타를 이용한 검색 시스템의 설계)

  • 김상준;김은정;배종민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.157-159
    • /
    • 2000
  • 인터넷의 보편화로 정보 교환이 활발해지면서 일반 사용자들에게 필요한 정보를 손쉽게 취득하게 해주는 정보 검색 시스템의 역할이 아주 중요하게 되었다. 일반적인 정보 검색은 사용자의 질의에 대해 문서내의 색인어 발생 빈도를 기반으로 관련 문서를 찾 준다. 본 논문에서는 XML 링크 정보를 이용하여 링크를 검색하여 관련 문서를 찾아주는 정보 검색 시스템을 제시한다. 이를 위해 XML 링크에서 ROLE 속성값인 메타 데이터를 색인하여 저장하고 링크에 대한 모든 정보를 저장하고, 이를 기반으로 특정 주제에 대한 검색시, 특정 주제로 가장 많이 링크된 문서를 검색한다. 제시한 방법을 현재 웹상에서 주로 이용되는 HTML 문서를 기반으로 분석해 본 결과 그 필요성을 확인할 수 있었다.

  • PDF

Retrieval of Large scaled XML Documents based on Path Query using Inverted indexes (역 색인을 이용한 경로 질의 기반 대용량 XML문서 검색)

  • Moon, Kyung-Won;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.35-38
    • /
    • 2005
  • 1998년 XML 문서 표준이 제안된 이래, 다양한 응용 분야에서 XML은 데이터를 표현하는 표준으로 자리잡아 가고 있다. 특히, 인터넷상의 많은 데이터들이 XML 형태로 작성되고 변환됨에 따라 다량의 XML 데이터가 생성되고 있다. 따라서 현재 XML 문서의 저장 및 질의 처리 기법의 연구가 활발하게 진행되고 있다. 하지만 기존의 연구는 대용량 XML 문서를 다루기에는 미흡한 점이 있다. 본 논문에서는 인터넷상의 널리 퍼져있는 방대하고, 다양한 구조의 XML문서들을 대상으로 패스 기반 질의를 빠르게 처리할 수 있는 검색 기법을 제안한다. 제안된 기법은 인터넷상에 산재해 있는 여러 XML 문서를 관계형 데이터베이스에 효율적으로 저장하고 질의를 통해 인터넷상 XML 문서의 엘리먼트를 빠르게 검색하는데 주안점을 둔다. 먼저, XML 문서를 관계형 데이터베이스에 효율적으로 저장하는 계층형 XML 저장 기법을 제안하고, 정보 검색 시스템에서 많이 사용하는 역 인덱스를 사용하여 저장된 XML 문서에 대한 검색 성능을 향상시킨다.

  • PDF

COVA: A Distance Learning System supporting Content-based Lecture Retrieval (COVA: 내용 기반 강의 검색을 지원하는 원격 학습 시스템)

  • 차광호
    • Journal of KIISE:Databases
    • /
    • v.31 no.2
    • /
    • pp.99-107
    • /
    • 2004
  • Education and training are expected to change dramatically due to the combined impact of the Internet, database, and multimedia technologies However, the distance learning is often impeded by the lack of effective tools and system to manage and retrieve the lecture contents effectively. This paper introduces a prototype system called COVA that enables remote users to access specific parts of interest by contents from a large lecture database. COVA includes several novel techniques to achieve the content-based lecture retrieval in distance teaming: (1) The XML-based semistructured model to represent lecture contents; (2) The technique to build structural summaries, i.e., schemas, of XML lecture databases; (3) Index structures to speed up the search to find appropriate lecture contents.

The Improvement of XML document repository based on The Static Table (정적 테이블 기반의 XML 문서 저장 시스템 개선)

  • Kwon, Hoon;Kim, Jeong-Hee;Kwak, Ho-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.178-180
    • /
    • 2004
  • 본 논문에서는 XML 문서를 관계형 데이터베이스에 저장하는 XML 문서 저장 시스템을 제안한다. 제안 시스템은 XML 문서 구조인 DTD(Document Type Definition)를 보완한 XML Schema를 XML 문서의 기반 구조로 사용하며, 또한 XML 문서의 저장과 색인의 효율성 밀 유효성 검사를 위해 XML 문서에 대한 저장구조를 XML Schema와 XML Instance 문서간의 통함 정적 테이블과 필드들을 가지는 형태로 생성, 처리토록 하였으며, 그 결과 XML 문서와 XML Schema간의 구조상의 유효성을 증대시킬 수 있음을 알 수 있었다.

  • PDF