• Title/Summary/Keyword: XML 색인

Search Result 110, Processing Time 0.046 seconds

Efficient Indexing Technique for Retrieval of an XML Document and Design of Query Language (TQL) (XML 문서의 검색을 위한 효율적인 색인 기법과 질의 언어(TQL)의 설계)

  • 이계준;신동욱;권택근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.57-59
    • /
    • 1999
  • 현재 WWW(World Wide Web), 사무 자동화 시스템(Office Information System), 전자 도서관(Digital Library) 등의 빠른 발전으로 인하여 정보가 기하급수적으로 증가하였다. 이러한 방대한 양의 정보를 처리하기 위하여 많은 인터넷 기반의 문서 표준들이 출현하였고, 대표적으로 XML(eXtensible Markup Language)이 차세대 인터넷 전자 문서의 표준으로 많은 곳에 응용되고 있다. 이에 따라 XML 문서의 정보들을 효율적이고 정확하게 저장하고 이용, 검색 할 수 있는 기능을 요구되어졌다. 현재 대부분의 연구들은 XML 문서에 대한 구조적인 정보만을 저장하고 검색하는 기능만을 지원 할 뿐 검색된 결과에 대한 재사용이나 재구성에 대한 기능의 제공은 미흡한 실정이다. 본 논문에서는 현재 검색기들이 제공하는 XML 문서에 대한 구조적인 검색 기능을 확장하여 XML 문서를 보다 효율적으로 검색하기 위하여 새로운 색인 기법을 제안하고, 데이터베이스 내에 저장된 XML문서에 대해 구조적인 검색과 이것을 바탕으로 문서를 재구성하고 재사용하는 기능을 수행할 수 있도록 새로운 질의어(TQL)을 설계하였다.

  • PDF

The Path Inverted Index Technique for XML Document Retrieval (XML 문서 검색을 위한 경로 역 색인 기법)

  • Moon, Kyung-Won;Hwang, Byung-Yeon
    • The KIPS Transactions:PartD
    • /
    • v.17D no.2
    • /
    • pp.103-110
    • /
    • 2010
  • Recently, many XML document management systems using the advantage of RDBMS have been actively developed for the storage, processing and retrieval of XML documents. However, fractional pattern-matching query such as the LIKE operations cannot take the advantage of the index of RDBMS because these operations have deteriorated retrieval performance through its inefficient comparison processing. The hierarchical XML storage technique which stores XML documents in RDBMS efficiently, and the path inverted index technique are proposed in this paper. It regards the element of an XML document as a keyword, and focuses on organizing a posting file with path identifiers and sequences to reduce the retrieval time of path based query. Through simulations, our methods have shown about 60% better performance than the conventional method using RDBMS in searching.

Structural join mechanism for efficient query in XML document (XML 문서에서 효율적인 질의를 위한 구조 조인 메커니즘)

  • Lee Myung-Jin;Kim Hee-Kyung;Chae Ki-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.100-102
    • /
    • 2006
  • 인터넷 환경에서 데이터 저장과 전송을 위한 표준으로 XML이 부각되고 있다. 이에 따라 XML자체에 대한 관심뿐 아니라 XML 질의 처리를 위한 연구도 활발하게 이루어지고 있다. 이러한 연구는 XML문서 자체의 내용 뿐 아니라 구조에 대한 질의에 대해서도 진행되고 있다. 구조에 대한 질의를 위해 경로 질의가 사용되고 있으며, 최근 경로 질의를 효과적으로 처리하기 위하여 여러 가지 색인 기법들이 연구되고 있다. 본 연구에서는 기존에 제안된 대표적인 두 가지 색인기법인, 경로 색인 기법과 구조 조인 기법에 대한 특징에 대해 살펴보고, 구조 조인 기법에 대한 기존연구의 알고리즘의 성능을 개선시킬 수 있는 메커니즘을 제안하였다. 기존 연구에서는 질의에 해당하는 모든 엘리먼트들을 비교하여 결과를 뽑아내지만 제안한 메커니즘은 입력 값의 형태를 변형하여 비교하는 엘리먼트의 수를 줄여 더 적은 조인연산을 수행함으로서 성능을 향상시킬 수 있었다. 이러한 결과를 4절에서 실험을 통해 검증하였다. 실험 결과 기존 방법에 비해 실험한 질의에 따라 최대 34%, 최소 7%의 성능 향상을 이룰 수 있었다.

  • PDF

Weighting of XML Tag using User's Query (사용자 질의를 이용한 XML 태그의 가중치 결정)

  • Woo Seon-Mi;Yoo Chun-Sik;Kim Yong-Sung
    • The KIPS Transactions:PartD
    • /
    • v.12D no.3 s.99
    • /
    • pp.439-446
    • /
    • 2005
  • XML is the standard that can manage systematically WWW documents and increase retrieval efficiency. Because XML documents have the information of contents and that of structure in single document, users can get more suitable retrieval result by retrieving the information of content as well as that of logical structure. In this paper, we will propose a method to calculate the weights of XML tags so that the information of XML tag is used to index decision. A proposed method creates term vector and weight vector for XML tags, and calculates weight of tag by reflecting user's retrieval behavior (user's query). And it decides the weights of index terms of XML document by reflecting the weights of tags. And we will perform an evaluation of proposed method by comparison with existing researches using weights of paragraphs.

Course Indexing system using XML Component in WBI (WBI상에서 XML요소를 이용한 교과 색인 시스템)

  • Chae, Seung-Chun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1179-1182
    • /
    • 2002
  • 오늘날 정보의 중요성의 증가와 신속한 정보검색의 필요성에 따라 정보관리의 현대화가 요구되고 있는데 부응해 색인생산의 전산화를 기하기 위한 시스템을 활용하지 않은 전자문서의 표준화로 기술된 XML의 요소를 정보검색을 할 수 있도록 설계를 통해 일반 웹 문서가 전자문서로 서로 교환될 수 있는 그리고 색인기능을 지원하여 정보를 검색하고 기존의 텍스트와 여러 다양한 형태의 정보를 구조적으로 표현할 수 있어 웹을 통한 학습자에게 웹 문서를 쉽게 습득할 수 있도록 구조화된 문서의 표준인 XML의 요소를 이용한 교과색인 시스템을 웹에서 이루어지는 형태의 학습자료로 보다 쉽게 만들고 문서의 교환과 내용을 색인이 원활히 이루어지도록 교과색인 시스템을 구현하여 교사와 학생간의 상호 작용하는 웹 교과색인을 연구하였다.

  • PDF

Design and Implementation of XML Indexing and Query Scheme Based on Database Concept Structure (데이터베이스의 개념구조에 기반한 XML 문서의 색인 및 질의 스키마의 설계 및 구현)

  • Choo Kyo-Nam;Woo Yo-Seob
    • The KIPS Transactions:PartD
    • /
    • v.13D no.3 s.106
    • /
    • pp.317-324
    • /
    • 2006
  • In this paper, we propose a new indexing technique to solve various queries which have a strong good point not only database indexing schema take advantage of converting from semi-structured data to structured data but also performance is more faster than before. We represent structure information of XML document between nodes of tree that additional numbering information which can be bit-stream without modified structure of XML tree. And, We add in indexing schema searching incidental structure information in the process. In Querying schema, we recover ancestor nodes through give information of node using indexing schema in complete path query expression as well as relative path query expression. Therefore, it takes advantage of making derivative query expression with given query. In this process, we recognize that indexing and querying schema can get searched result set faster and more accurate. Because response time is become shorter by bit operating, when query occur and it just needs information of record set earch node in database.

The design of XML document repository based on Static Table considering the efficiency of storing and indexing (저장과 색인의 효율성을 고려한 정적 테이블 기반의 XML 문서 저장 시스템 설계)

  • 홍석건;김정희;곽호영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.205-207
    • /
    • 2003
  • 본 논문에서는 XML 문서를 관계형 데이터베이스에 저장하는 XML 문서 저장 시스템을 제안한다. 제안 시스템은 XML 문서 구조인 DTD(Document Type Definition)를 보완한 XML Schema를 XML 문서의 기반구조로 사용하며, 또한 XML 문서의 저장과 색인의 효율성을 위해 XML 문서에 대한 저장 구조는 정적 테이블과 필드들을 가지는 데이터베이스를 기 생성하여 처리토록 하여, 제안 시스템을 이용한 애플리케이션에서 활용하기 용이하도록 하였다.

  • PDF

Weight decision of the XML Tag using Relationship Probability (관계성 확률을 이용한 XML 태그의 가중치 결정)

  • Jeong, Hye-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.699-702
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하거나 HTML 문서 태그의 중요도 결정에 관한 연구들이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그의 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 인용된 문서간의 관계를 알아보고 서로 연관이 있을 확률을 계산하여 그 기대치만큼 색인어에 대한 가중치에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

  • PDF

Course Indexing system using XML Component in WBI (WBI상에서 XML요소를 이용한 교과 색인 시스템)

  • 채승천;백석찬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.706-708
    • /
    • 2002
  • 오늘날 정보의 중요성의 증가와 신속한 정보검색의 필요성에 따라 정보관리의 현대화가 요구되고 있다. 이에따라 색인생산의 전산화를 기하기 위한 시스템을 활용하지 않은 전자문서의 표준화로 기술된 XML의 요소를 정보검색을 할 수 있도록 설계를 통해 일반 웹 문서가 전자문서로 서로 교환될 수 있다 그리고 색인기능을 지원하여 정보를 검색하고 기존의 텍스트와 여러 다양한 형태의 정보를 구조적으로 표현할 수 있어 웹을 통한 학습자에게 웹 문서를 쉽게 습득할 수 있다. 본 논문에서는 구조화된 문서의 표준인 XML의 요소를 이용한 교과색인 시스템을 웹에서 이루어지는 형태의 학습자료로 보다 쉽게 만들고 문서의 교환과 내용에 대한 색인이 원활히 이루어져 교사와 파생간의 상호작용하는 교과색인 시스템을 설계 및 구현하였다.

  • PDF

Bit Coordinate indexing for Multi-channel XML Data Broadcasting (다중 채널상으로 XML 데이터 방송을 위한 비트 좌표 색인 기법)

  • Park, Sang-Hyun;Ryu, Byung-Gul;Lee, Jung-Hyun;Lee, SangKeun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.87-90
    • /
    • 2010
  • 본 논문에서는 무선 방송 환경에서 XML에 대한 다양한 사용자 질의에 대하여 다중 채널을 통해 효과적으로 질의의 결과를 전송하기 위한 색인 기법을 고려한다. 이를 위해 서버측에서는 질의 결과뿐만 아니라 원본 XML상에서 질의 결과가 위치하는 계층 정보까지 파악이 가능한 비트 좌표 기반 색인 기법을 제안한다. 제안 기법의 시뮬레이션을 통해 다중 채널의 효과뿐만 아니라 색인으로 인해 빠른 응답시간을 가짐을 보인다.