• Title/Summary/Keyword: XML Index

Search Result 121, Processing Time 0.026 seconds

The Query Optimization Techniques for XML Data using DTDs (DTD를 이용한 XML 데이타에 대한 질의 최적화 기법)

  • Chung, Tae-Sun;Kim, Hyoung-Joo
    • Journal of KIISE:Databases
    • /
    • v.28 no.4
    • /
    • pp.723-731
    • /
    • 2001
  • As XML has become and emerging standard for information exchange on the World Wide Web it has gained attention in database communities of extract information from XML seen as a database model. Data in XML can be mapped to semistructured dta model based on edge-labeled graph and queries can be processed against it Here we propose new query optimization techniques using DTDs(Document Type Definitions) which have the schema information about XML data. Our techniques reduce traditional index techniques Also, as they preserve source database structure, they can process many kinds of complex queries. we implemented our techniques and provided preliminary performance results.

  • PDF

Implementation of Algebra and Data Model based on a Directed Graph for XML (방향 그래프 기반 XML 데이터 모델과 대수 구현)

  • Park, Seong-Hui;Choe, Eun-Seon;Ryu, Geun-Ho
    • The KIPS Transactions:PartD
    • /
    • v.8D no.6
    • /
    • pp.799-812
    • /
    • 2001
  • As XML become more popular for encoding data and exchanging format on the web, recent work on processing XML Document in DBMS has been performed. However, there is no formal data model for XML, and there is lack of research on XML algebra for processing complex XML query and even the mediators have many restrictions. Therefore, this paper proposes formal data model and algebra based on directed edge labeled graph for XML query. To implement algebra, not only algorithms of operation for algebra are presented, but also they are implemented using access method and path index based on RDBMS or ORDBMS. In particular, experiments to show the effectiveness of the implemented algebra are performed on XML documents on EST data which are semistructured data.

  • PDF

A Search Method for Components Based-on XML Component Specification (XML 컴포넌트 명세서 기반의 컴포넌트 검색 기법)

  • Park, Seo-Young;Shin, Yoeng-Gil;Wu, Chi-Su
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.2
    • /
    • pp.180-192
    • /
    • 2000
  • Recently, the component technology has played a main role in software reuse. It has changed the code-based reuse into the binary code-based reuse, because components can be easily combined into the developing software only through component interfaces. Since components and component users have increased rapidly, it is necessary that the users of components search for the most proper components for HTML among the enormous number of components on the Internet. It is desirable to use web-document-typed specifications for component specifications on the Internet. This paper proposes to use XML component specifications instead of HTML specifications, because it is impossible to represent the semantics of contexts using HTML. We also propose the XML context-search method based on XML component specifications. Component users use the contexts for the component properties and the terms for the values of component properties in their queries for searching components. The index structure for the context-based search method is the inverted file indexing structure of term-context-component specification. Not only an XML context-based search method but also a variety of search methods based on context-based search, such as keyword, search, faceted search, and browsing search method, are provided for the convenience of users. We use the 3-layer architecture, with an interface layer, a query expansion layer, and an XML search engine layer, of the search engine for the efficient index scheme. In this paper, an XML DTD(Document Type Definition) for component specification is defined and the experimental results of comparing search performance of XML with HTML are discussed.

  • PDF

An Identifying Method of XML Document based on Bitmap Indexing using Path Construction Similarity (경로 구성 유사도를 이용한 비트맵 인덱싱 기반 XML 문서 인식 기법)

  • Lee, Jae-Min;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1515-1518
    • /
    • 2003
  • XML의 대표적인 특징은 기존의 다른 컨텐츠와는 달리 문서의 구조를 기술할 수 있다는 것이다. 구조적 정보는 활용 방법에 파라 XML문서의 다양한 처리에 있어 성능을 향상시키는 핵심적인 요소가 될 수 있다. 그러나 XML 태그의 자기 서술적인 특성에서 비롯되는 구조적 표현의 차이는 오히려 문서의 식별을 어렵게 하는 원인이 된다. 본 논문에서는 기존의 비트맵 인덱스(Bitmap Index)를 이용한 XML 문서 검색 시스템이 다양한 구조적 유사성을 판별할 수 없는 단점을 보완 가능하도록 경로 중심의 유사 문서 인식 기법을 제안한다. 이 기법은 '경로 구성 유사도'와 '유사 경로 테이블'을 통해 기존의 비트맵 인덱스가 갖는 유사 경로를 인식하지 못하는 단점을 해결하고 검색의 유연성을 부여함으로써 보다 양질의 검색 결과를 도출할 수 있다. 또 이것은 기존 시스템의 Bit-wise 연산에 완전히 이식됨으로써 비트맵 인덱스의 장점인 빠른 성능을 그대로 유지할 수 있게 된다.

  • PDF

Planning of XML Based Model for the Construction of Effective KSC 1 System (효율적인 KSCI 체제 구축을 위한 XML기반 모델 설계)

  • 이계준;조현양;최재황;손강렬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.49-51
    • /
    • 2001
  • 과학기술 논문의 수준을 평가하고, 국내 학술지 및 기관간의 연구능력 비교 분석의 척도로 사용하기 위한 KSCI(Korean Science Citation Index : 한국과학기술인용색인) 구축 및 활성화를 위하여 XML을 기반으로 하는 모델을 설계하였다. KSCI 데이터베이스는 인용만 논문과 인용된 논문들 사이의 관계를 정의하고 논문을 작성한 저자들에 대한 인력DB의 구축과 연계를 통하여 구성되어진다. 이러한 과정에서 발생되어지는 표준화 과정과 데이터베이스간의 연계를 효율적으로 주진하고 효율적인 KSCI 데이터베이스를 구축하기 위한 XML 표준을 설계하였다. 첫째, 데이터베이스틀의 연계를 위한 모델을 설계, 둘째, 인용된 논문과 인용한 논문에서의 서지정보. 저널정보, 참고문헌정보에 대한 XML DTD를 정의 셋째, 저자와 공저자들에 대한 인력DB 구축을 위한 XML DTD를 정의하였다. 본 논문은 KSCI데이터베이스 구축을 통해서 데이터에 대한 상호 교환, 공동 활용을 보다 효율적으로 수행하고 안정적인 체제 구축을 고려하여 모델을 설계하였다.

  • PDF

Design for Storaging Well-Formed XML Data without DTD using $CSB^+$-Tree Index ($CSB^+$-Tree 인덱스를 이용한 DTD가 없는 Well-Formed XML 문서 저장 기법)

  • 신성현;김진호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.124-126
    • /
    • 2004
  • 최근 인터넷 상에서 정보 양이 증대함에 따라 DTD 기반의 XML을 이용하여 방대한 정보를 효율적으로 저장하고 검색하기 위한 많은 연구들이 진행되고 있다 하지만 DTD의 문서를 작성에는 많은 노력이 필요하고, 문서 구조의 검사가 필요 없는 간단한 문서만 사용하는데 있어서 DTD 작성은 불필요한 작업이 아닐 수 없다. 하지만 DTD 문서가 없을 경우에도 XML 기본 문법만 맞으면 문서를 파싱할 수 있고, 불필요한 네트? 부담을 줄이기 위해 DTD없이 전송한 수 있다. 따라서 본 연구에서는 DTD가 없는 Well-Formed XML 문서를 구성하는 엘리먼트의 구조를 통해 정보를 추출하고, 주기억장치의 효율적인 저장 공간을 활용한 CS$B^{+}$-Tree 인덱스를 이용하여 Well-formed XML 문서를 저장하기 위한 기법을 제안한다.

  • PDF

Design and Implementation of Index Algorithm for XQL Query Processing System (XQL질의 처리시스템을 위한 인덱스 알고리즘 설계 및 구현)

  • 장복선;손기락
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.217-219
    • /
    • 2002
  • 효율적인 문서 교환을 구해 의미 있는 태그를 사용하는 XML문서가 인터넷상에서 널리 사용되고 있다. 이 XML문서를 저장하고 검색하기 위해 여러 분야에서 시스템이 개발되었지만 특별히 각광을 받는 시스템은 없었다. 본 연구에서는 관계형 데이터베이스에 XML문서를 트리 형태로 저장하고, 저장된 데이터베이스의 정보를 검색하기 위해 XQL질의처리 시스템을 개발하였다. 또한, 본 논문에서는 XQL질의 처리에 있어 사용자가 보다 체계적이고 편리하게 정보를 검색할 수 있도록 하기 위한 인덱스 알고리즘의 설계 및 구현하였다.

  • PDF

Development of a Korea SCI System for Efficient Citation Analysis (효율적인 인용분석을 위한 한국 SCI 시스템의 개발)

  • 이계준;조현양;최재황;윤희준
    • Journal of KIISE:Databases
    • /
    • v.31 no.2
    • /
    • pp.174-182
    • /
    • 2004
  • In order to produce information the author usually reference other authors' work. A citation index leads users to papers by citations. Citations lead the user to desired information. In this paper, KSCI(Korea Science Citation Index) which defines the relationships between citing documents and cited documents has been constructed. KSCI System is to solve problems for recursive retrieval in ISI's SCI(Science Citation Index) Path Encoding Indexing technique was used to solve the problems. From the analysis of data, this system has efficiency about 8.98% in the aspect of data storage. In the aspect of retrieval, there was efficiency between citing documents and cited documents, especially there was over 40% of efficiency in the retrieval of cited documents. It is concluded that suggested KSCI system will provide efficient storage and retrieval system.

Efficient Data Publishing Method for Protecting Sensitive Information by Data Inference (데이터 추론에 의한 민감한 정보를 보호하기 위한 효율적인 데이터 출판 방법)

  • Ko, Hye-Kyeong
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.5 no.9
    • /
    • pp.217-222
    • /
    • 2016
  • Recent research on integrated and peer-to-peer databases has produced new methods for handling various types of shared-group and process data. This paper with data publishing, where the publisher needs to specify certain sensitive information that should be protected. The proposed method cannot infer the user's sensitive information is leaked by XML constraints. In addition, the proposed secure framework uses encrypt to prevent the leakage of sensitive information from authorized users. In this framework, each node of sensitive data in an eXtensible Markup Language (XML) document is encrypted separately. All of the encrypted data are moved from their original document, and are bundled with an encrypted structure index. Our experiments show that the proposed framework prevents information being leaked via data inference.