• 제목/요약/키워드: XML 문서 검색

Search Result 468, Processing Time 0.025 seconds

A Indexed Technique for Local search based on XML Document (XML 문서를 기반으로 한 Local 검색을 위한 색인 기법)

  • 정혜진;유춘식;김용성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.728-730
    • /
    • 2003
  • 오늘날 방대한 양의 정보를 관리하고 검색하기 위해 정보를 효율적으로 처리 할 수 있는 방안에 대해서 많은 연구가 진행되고 있다. 본 논문에서는 문서를 구조화하기 위한 방법으로써 XML을 기반으로 하고, 이를 효과적으로 검색하기 위해서 색인기법을 제안하므서 CD-ROM이나 하드 디스크와 Locai 보조 기억 장치에 저장되어 있는 문서 파일을 효율적으로 검색할 수 있도록 한다.

  • PDF

A Clustering Technique using Common Structures of XML Documents (XML 문서의 공통 구조를 이용한 클러스터링 기법)

  • Hwang, Jeong-Hee;Ryu, Keun-Ho
    • Journal of KIISE:Databases
    • /
    • v.32 no.6
    • /
    • pp.650-661
    • /
    • 2005
  • As the Internet is growing, the use of XML which is a standard of semi-structured document is increasing. Therefore, there are on going works about integration and retrieval of XML documents. However, the basis of efficient integration and retrieval of documents is to cluster XML documents with similar structure. The conventional XML clustering approaches use the hierarchical clustering algorithm that produces the demanded number of clusters through repeated merge, but it have some problems that it is difficult to compute the similarity between XML documents and it costs much time to compare similarity repeatedly. In order to address this problem, we use clustering algorithm for transactional data that is scale for large size of data. In this paper we use common structures from XML documents that don't have DTD or schema. In order to use common structures of XML document, we extract representative structures by decomposing the structure from a tree model expressing the XML document, and we perform clustering with the extracted structure. Besides, we show efficiency of proposed method by comparing and analyzing with the previous method.

XML Global Schema Generation Model of XML Documents Considering Conflicts on Local Schema Integration (지역 스키마간 충돌 문제를 고려한 XML 문서의 전역 스키마 생성 모델)

  • 김정희;곽호영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.70-72
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

XML Join Query Processing using Structured Information from Multiple Documents (다중 문서에서 구조 정보를 이용한 XML 조인 질의 처리)

  • 정성호;김병곤;정헌석;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.100-102
    • /
    • 2002
  • XML 문서에 대한 다양한 질의를 위해서 W3C에서는 XQL, XML-QL, XML-GL, XQUERY와 같은 질의어를 제안하였다. 이들 질의어는 다양한 질의 유형의 분류와 표현은 가능하나, 조인 질의의 경우 단순 조인 질의만을 지원할 뿐, XML 문서의 구조나 텍스트 정보의 유사성을 이용한 보다 다양한 조인 질의에 대한 연구가 미비하였다. 본 논문에서는 다중 문서에 대한 조인 질의를 체계적이고 효과적으로 표현하기 위해, 문서에 대한 조인 질의를 여러 타입으로 분류하였다. 또한 효율적인 질의처리를 위하여 다양한 일반 조인 질의 및 정보검색 기능을 지원하는 유사성 조인 연산자(similarity join operator), 순수 구조 기반 조인을 지원하는 구조 조인 연산자(structured join operator)를 지원하도록 XML 질의어인 QUILT를 확장하였다. 특히, 구조 정보만을 이용한 질의시 구조의 깊이(depth)정보를 이용하여 사용자의 요구에 맞게 질의 검색 범위를 설정하고, XML 문서에 대한 질의 문을 좀더 간결하게 표현할 수 있도록 설계하였다.

  • PDF

Extension of a XML Query Language to Support Links (링크를 지원하기 위한 XML 질의어의 확장)

  • 문찬호;강현철;서상구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.6-8
    • /
    • 2000
  • XML 문서의 폭발적인 확산에 따라 Web상의 각 사이트는 XML 문서를 분산 저장하여 관리하고 있다. 그리고 XML 문서들 간에는 다양한 링크를 통해 관련된 정보를 참조할 수 있다. 그러나 현재까지 XML과 관련하여, 링크를 지원하는 질의어 개발이나 링크를 활용한 XML 검색 시스템 개발에 대한 연구는 미비하다. 본 논문에서는, 실제 Web상에 분산되어 저장된 전자 문서들 중 하이퍼링크로 연결된 XML 문서들을 대상으로, 링크를 지원하기 위해 기존 XML 질의어를 확장에 대해 연구하였다. 이를 위해 XML 링크를 지원하는 질의의 유형을 분류하고, 링크를 지원하기 위한 XML 질의어의 확장에 대해 기술한다. 그리고 링크를 활용한 XML 질의 처리 방안에 대해 기술한다.

  • PDF

Design and Implementation of XQL Query Processing System using a Relational Database (관계형 데이터베이스를 이용한 XQL질의 처리시스템의 설계 및 구현)

  • 김경원;이지훈;장복선;김천식;손기락
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.1-3
    • /
    • 2002
  • XML이 웹 문서의 표준이며, 문서교환용 언어로서 사용되고있다. 따라서, 향후 많은 XML문서의 보관 및 관리 그리고 XML문서를 위한 질의어 처리는 매우 중요할 것으로 본다. 지금가지, XML문서의 저장 및 검색과 관련한 연구 및 제품개발이 여러 업체에 의해서 있어왔고, 지금도 연구 및 개발이 진행되고 있다 하지만 효율적일 XML문서의 저장 및 검색을 위한 시스템은 아직까지 없었다. 따라서, 본 논문에서는 XML문서를 트리 형태로 저장하는 방식인,DFS-numbering방식을 이용하여 문서를 저장하고 XQL질의 글 처리찬 수 있는 효율적인 시스템을 선계 및 구현하고자 한다.

  • PDF

Representing and retrieving the Structured Information of XML Documents (XML 문서에 포함된 구조 정보의 표현과 검색)

  • Jo, Yun-Gi;Jo, Jeong-Gil;Lee, Byeong-Ryeol;Gu, Yeon-Seol
    • The KIPS Transactions:PartD
    • /
    • v.8D no.4
    • /
    • pp.361-366
    • /
    • 2001
  • As growing the number of Webs, the total amount of accessible information has been greater than ever. To storage and retrieve the vast information on the Webs effectively, many researchers have been made utilizing XML (extensible Markup Language). In this paper, we propose an effective method of representation and retrieval mechanism for the structured retrieval of the XML documents : (1) the fixed sized LETID (Leveled Element Type ID) that contains the information of elements such as parent node, sibling nodes, and identical sibling nodes, and the hierachical information of current node, and (2) content index, structure index, attribute index model, and the information retrieval algorithm for the structured information retrieval. With our methods, we can effectively represent the structured information of XML documents, and can directly access the specific elements by simple operations to process various queries.

  • PDF

A Search Method for Components Based-on XML Component Specification (XML 컴포넌트 명세서 기반의 컴포넌트 검색 기법)

  • Park, Seo-Young;Shin, Yoeng-Gil;Wu, Chi-Su
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.2
    • /
    • pp.180-192
    • /
    • 2000
  • Recently, the component technology has played a main role in software reuse. It has changed the code-based reuse into the binary code-based reuse, because components can be easily combined into the developing software only through component interfaces. Since components and component users have increased rapidly, it is necessary that the users of components search for the most proper components for HTML among the enormous number of components on the Internet. It is desirable to use web-document-typed specifications for component specifications on the Internet. This paper proposes to use XML component specifications instead of HTML specifications, because it is impossible to represent the semantics of contexts using HTML. We also propose the XML context-search method based on XML component specifications. Component users use the contexts for the component properties and the terms for the values of component properties in their queries for searching components. The index structure for the context-based search method is the inverted file indexing structure of term-context-component specification. Not only an XML context-based search method but also a variety of search methods based on context-based search, such as keyword, search, faceted search, and browsing search method, are provided for the convenience of users. We use the 3-layer architecture, with an interface layer, a query expansion layer, and an XML search engine layer, of the search engine for the efficient index scheme. In this paper, an XML DTD(Document Type Definition) for component specification is defined and the experimental results of comparing search performance of XML with HTML are discussed.

  • PDF

Incremental Clustering of XML Documents based on Similar Structures (유사 구조 기반 XML 문서의 점진적 클러스터링)

  • Hwang Jeong Hee;Ryu Keun Ho
    • Journal of KIISE:Databases
    • /
    • v.31 no.6
    • /
    • pp.699-709
    • /
    • 2004
  • XML is increasingly important in data exchange and information management. Starting point for retrieving the structure and integrating the documents efficiently is clustering the documents that have similar structure. The reason is that we can retrieve the documents more flexible and faster than the method treating the whole documents that have different structure. Therefore, in this paper, we propose the similar structure-based incremental clustering method useful for retrieving the structure of XML documents and integrating them. As a novel method, we use a clustering algorithm for transactional data that facilitates the large number of data, which is quite different from the existing methods that measure the similarity between documents, using vector. We first extract the representative structures of XML documents using sequential pattern algorithm, and then we perform the similar structure based document clustering, assuming that the document as a transaction, the representative structure of the document as the items of the transaction. In addition, we define the cluster cohesion and inter-cluster similarity, and analyze the efficiency of the Proposed method through comparing with the existing method by experiments.

An RDBMS-based Inverted Index Technique for Path Queries Processing on XML Documents with Different Structures (상이한 구조의 XML문서들에서 경로 질의 처리를 위한 RDBMS기반 역 인덱스 기법)

  • 민경섭;김형주
    • Journal of KIISE:Databases
    • /
    • v.30 no.4
    • /
    • pp.420-428
    • /
    • 2003
  • XML is a data-oriented language to represent all types of documents including web documents. By means of the advent of XML-based document generation tools and grow of proprietary XML documents using those tools and translation from legacy data to XML documents at an accelerating pace, we have been gotten a large amount of differently-structured XML documents. Therefore, it is more and more important to retrieve the right documents from the document set. But, previous works on XML have mainly focused on the storage and retrieval methods for a large XML document or XML documents had a same DTD. And, researches that supported the structural difference did not efficiently process path queries on the document set. To resolve the problem, we suggested a new inverted index mechanism using RDBMS and proved it outperformed the previous works. And especially, as it showed the higher efficiency in indirect containment relationship, we argues that the index structure is fit for the differently-structured XML document set.