• 제목/요약/키워드: XML Query

검색결과 357건 처리시간 0.024초

XML 응용시스템 개발을 위한 설계방안 (A Design Methodology for XML Applications)

  • 김경수;주경수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.39-42
    • /
    • 2000
  • Extensible Markup Language(XML) is fast emerging as the dominant standard for representing data in the World Wide Web. Sophisticated query engines that allow users to effectively tap the data stored in XML documents will be crucial to exploiting the full power of XML. While there has been a great deal of activity recently proposing new semi-structured data models and query languages for this purpose, this paper explores the more conservative approach of using traditional relational database engines for processing XML documents conforming to Document Type Descriptors(DTDs). In this paper, we describe how to generate relational schemas from XML DTDs. The main issues that must be addressed inc]ode (a) dealing with the complexity of DTD element specifications (b) resolving the conflict between the two-level nature of relational schemas (table and attribute) vs. the arbitrary nesting of XML DTD schemas and (c) dealing with set-valued attributes and recursion. We now propose a set of transformations that can be used to "simplify" any arbitrary DTD without undermining the effectiveness of queries over documents conforming to that DTD.

  • PDF

XML 문서 검색을 위한 경로 역 색인 기법 (The Path Inverted Index Technique for XML Document Retrieval)

  • 문경원;황병연
    • 정보처리학회논문지D
    • /
    • 제17D권2호
    • /
    • pp.103-110
    • /
    • 2010
  • 최근에 관계형 데이터베이스 관리 시스템(RDBMS)의 장점을 이용하여 XML로 표현된 문서를 효과적으로 저장, 관리, 검색하는 XML 문서관리 시스템에 대한 많은 연구들이 활발하게 진행되어 왔다. 그러나 경로 질의 중에서 LIKE 연산과 같은 부분 패턴 매칭 질의의 경우는 비효율적인 비교 연산으로 인해 검색 성능이 현저하게 떨어지기 때문에 RDBMS의 색인의 효과를 볼 수 없다. 본 논문에서는 XML 문서를 RDBMS에 효율적으로 저장하는 계층형 XML 저장 기법과 경로 역 색인 기법을 제안한다. 제안하는 기법은 XML문서의 엘리먼트를 키워드로 보고 해당 키워드가 속한 경로의 식별자와 시퀀스로 포스팅 파일을 구성하여 경로 기반 질의의 검색 속도를 향상하는데 주안점을 둔다. 검색 성능에 관한 실험을 통해서 제안된 기법이 기존의 RDBMS를 이용한 기법보다 약 60% 우수한 성능을 가지고 있음을 입증한다.

동적 프레디킷 : 허포크라테스 XML 데이타베이스를 위한 효율적인 액세스 통제 방법 (Dynamic Predicate: An Efficient Access Control Mechanism for Hippocratic XML Databases)

  • 이재길;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.473-486
    • /
    • 2005
  • 최근에 Agrawal 등이 제안한 히포크라테스 데이타베이스는 관계형 데이타베이스에 프라이버시 보호 기능을 추가한 데이타베이스 모델이다. 본 논문의 저자들은 히포크라테스 데이타베이스 모델을 XML 데이타베이스에 적용할 수 있도록 확장한 히포크라테스 XML 데이타베이스 모델[4]을 제안하였다. 본 논문에서는 동적 프레디킷(dynamic predicate)이라는 새로운 개념을 제안하고, 히포크라테스 XML 데이타베이스 모델에서의 액세스 통제에 이 개념을 적용한다. 동적 프레디킷은 권한에 의해 액세스가 허용되는지를 결정하는데 적용될 수 있는 질의 처리 도중에 동적으로 생성되는 조건을 나타낸다. 동적 프레디킷은 권한 검사를 질의 계획에 효과적으로 통합하여 액세스가 허용되지 않은 엘리먼트들이 질의 처리 과정에서 일찍 제외될 수 있게 해준다. 합성 데이타와 실제 데이타를 사용하여 기존의 액세스 통제 방법과 질의 처리 시간을 비교하는 다양한 실험을 수행한 결과, 본 논문에서 제안한 액세스 통제 방법은 하향식 액세스 통제 방법에 비하여 최대 219배, 상향식 액세스 통제 방법에 비하여 최대 499배 성능을 향상시킴을 보였다. 본 논문의 주요 공헌은 히포크라테스 XML 데이타베이스 모델 상에서 동적 프레디킷을 사용하여 액세스 통제 방법을 질의 계획에 효과적으로 통합할 수 있도록 한 것이다.

지역 질의 생성기반 전역 XQuery 질의 처리 기법 (A Global XQuery Query Processing based on Local XQuery Query Generation)

  • 박종현;박원익;김영국;강지훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.11-20
    • /
    • 2010
  • XML 뷰는 분산 환경에서 이종 데이터들을 XML 데이터처럼 바라보며 XML로 통합하기 위한 방법으로 제안되었으며, 전역 XML 뷰는 분산되어 있는 다양한 형태의 이종 데이터들을 단일의 XML 데이터처럼 바라보며 질의할 수 있도록한다. 이때사용자가 사용하는표준질의어는 XQuery이며, 전역XML 뷰를대상으로 작성된 질의가 바로 전역XQuery 질의이다. 그러므로이를효과적으로 처리하기위한방법은분산 환경에서이종데이터들사이의 통합 및 검색을 위한 연구의 주제이다. 기존 SQL 질의 처리에서 알 수 있는 것처럼, 분산 질의 처리를 위한 방법들 가운데 가장 범용적으로 사용되는 방법 중 하나는 전역 질의를 지역 질의로 분할하여 분할된 지역 질의들을 처리하고, 그 결과를 취하여 전역 질의의 결과로 재구성하는 것이다. 그러나 XQuery는 FOR 절과 같은 SQL 질의어에서는 찾아볼 수 없는 복잡한 구조적 특성을 갖는다. 그러므로 전역 XQuery 질의의 처리를 위해 지역 질의를 생성하기 위해서는 고려해야 할 사항들이 존재한다. 본 논문에서는 전역 SQL 질의 처리를 위한 지역 질의 생성 기법을 전역 XQuery 질의의 처리를 위해 적용할 때 발생하는 문제점을 정의하고 이를 해결하기 위한 방법을 제안한다. 또한, 제안한 방법을 기반으로 하는 전역 XQuery 질의 처리기를 구현하여 그 효율성을 보인다.

An Efficient Search Method For XML document

  • Qian, Xie;Cho, Dong-Sub
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1287-1290
    • /
    • 2011
  • Because of the rapid development of internet, there are more and more documents stored by the XML-based format. When there is a great deal of XML documents, how to get the valuable Information is an important subject. This paper proposes an effective XML document search method to search text contents and structures of XML documents. We build the keyword matrix of text contexts and structure matrixes of structures in XML documents to improve the efficiency of query time. When there is a great deal of XML documents, the search method we propose can improve much efficiency of query time.

경로 식별자를 이용한 다중 정규경로 처리기법 (Processing of Multiple Regular Path Expressions using PID)

  • 김종익;정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.274-284
    • /
    • 2002
  • XML에 대한 질의는 데이타 그래프 내 경로에 대한 질의를 기반으로 하며 그래프 내의 임의의 경로를 표시하기 위해 정규식을 사용한다. 일반적으로 의미있는 질의를 표현하기 위해서는 질의 내에 여러 개의 정규식을 포함하는 경우가 많다. 그럼에도 불구하고 기존의 연구는 주로 단일 정규식으로 이루어진 질의의 최적화 방법을 다루고 있다. 본 논문에서는 데이타 그래프를 탐색하지 않고 다중 정규 경로 질의를 처리할 수 있는 방을 제시한다. 본 논문에서는 다중 정규 경로를 효율적으로 처리하기 위해서 데이타 그래프 상의 임의의 두 노드 사이에 경로가 존재하는지를 직접 알 수 있는 방법인 경로 식별자를 제안하고 경로 식별자를 만드는 방법을 제공한다. 또한 본 논문에서 제안된 방법을 구현하여 그 성능에 대한 결과를 제공한다.

시그니처 기반 블록 탐색을 통한 XML 질의 최적화 기법 (An XML Query Optimization Technique by Signature based Block Traversing)

  • 박상원;박동주;정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.79-88
    • /
    • 2002
  • 인터넷에서 사용되는 많은 데이터들이 XML로 표현되고 있는 추세이다. 이러한 XML 데이터는 트리 형태로 표현되므로 이것을 저장하고 질의하는 시스템으로 그 모델링 능력 때문에 객체 저장소가 적합하다. 객체 저장소에서 XML의 각 노드는 객체로 저장된다. XML 질의의 특징은 정규 경로식으로 표현되는 것이며 이것은 XML 트리의 각 객체를 탐색하면서 처리된다. 정규 경로식을 지원하기 위하여 여러 인덱스들이 제안되었지만 이러한 인덱스들은 디스크 공간이라는 제약 때문에 모든 가능한 경로에 대한 인덱스를 제공하지는 못한다. 이러한 상태에서 정규 경로식을 잘 지원하기 위해서 블록 탐색과 시그니처 방법을 이용하여 질의를 효과적으로 처리하는 최적 객체 탐색 기법을 제안하였다. 시그니처는 트리의 각 노드에 시그니처를 첨가하여 탐색 범위를 줄이는 것이다. 블록 탐색은 한 페이지 내에 있는 접근 가능한 객체들을 미리 처리함으로써 디스크 I/O를 줄이는 것이다. 이와 같은 두가지 방법을 같이 이용하면 일반적인 질의 처리보다 월등히 나은 성능을 보인다는 것을 실험을 통하여 보였다.

관계 DBMS 기반 XML 저장시스템 상에서의 XML 뷰 인덱싱 (XML View Indexing Using an RDBMS based XML Storage System)

  • 박대성;김영성;강현철
    • 인터넷정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.59-73
    • /
    • 2005
  • 질의 결과를 캐쉬한 후 후속 질의 처리에 사용하는 것은 중요한 질의 최적화 기법으로서 이에는 실체뷰 기법과 뷰 인덱싱이 있다. 관계 데이터베이스에 대하여 많이 연구된 이들 기법은 XML이 웹 상에서 데이터 교환의 표준으로 부각된 이래 최근 XML 데이터에 대해서도 연구되고 있다. XML 뷰 인덱싱은 XML 질의의 결과인 XML 뷰 xv를 XML 뷰 인덱스(XVI)라는 구조로 표현한다. XVI는 xv의 소스 문서 엘리먼트들의 식별자 및 xv에 대한 정보를 저장한다. xv에 대한 XVI는 XML 엘리먼트의 식별자만을 저장하지 엘리먼트 자체를 저장하는 것이 아니다. 따라서 xv가 요청되면 그것의 XVI를 통해 xv의 하부 소스 XML 문서에 대해 실체화(materialization) 과정이 수행되어야 한다. 본 논문은 XVI 관리 시스템과 관계 DBMS 기반의 XML 저장 시스템의 통합 문제를 다룬다. 제안된 시스템은 두개의 서로 다른 상용 관계 DBMS에 대하여 Windows 2000 Server 환경에서 각각 Java로 구현되어 XML 뷰 인덱싱을 통한 XML 질의 처리의 성능 향상 및 XML 뷰 인덱싱의 오버헤드 평가에 이용되었다. 성능 실험 결과 관계 DBMS 기반의 XML 저장 시스템 상에서 XML 뷰 인덱싱은 매우 효율적이며 그 오버헤드는 미미하다는 것을 확인하였다.

  • PDF

ebXML등록 및 저장소에서 XQuery 지원 (XQuery Support for ebXML Registry and Repository)

  • 곽기욱;이원근;이상돈;최한석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1843-1846
    • /
    • 2002
  • ebXML 등록 및 저장소는 ebXML 프레임워크의 핵심부로 거래에 필요한 컨텐츠를 등록 저장 검색하는 기능을 제공한다. 거래 파트너간 상호 협업을 위해서는 등록된 기업 정보를 검색하는 것이 필수적이다. 현재 표준인 ebXML Registry Service 2.1 명세에서는 Filter Query와 SQL Query에 기반한 검색을 지원하고 있다. 본 논문에서는 ebXML 등록 및 저장소에서 XQuery에 기반한 검색지원 시스템을 제안한다. 이를 위해서 주요 검색 질의를 XQuery로 지원하는 과정을 기술하고 이를 지원하기 위한 시스템을 설계한다.

  • PDF

CxQuery(Chamois XML query language)의 XQuery 변환기 구현 (Implementation of CXQuery to XQuery Converter)

  • 이민영;이월영;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.124-126
    • /
    • 2005
  • XML 문서로부터 정보를 검색하거나 추출하기 위해 쓰이는 질의 표준으로 XQuery 제안되었다. 하지만 사용자들이 XQuery를 사용하기 위해서는 XML문서의 구조를 알아야만 한다는 단점을 가지고 있다. 이에 문서 구조에 의존하지 않는 질의인 CXQuery가 제안되었지만 CXQuery가 XML을 파싱하여 DBMS에 저장한 뒤 DBMS에서 질의를 처리하기 때문에 XML문서를 직접 처리하지 못하고 한 단계 변환의 과정을 필요로 한다는 단점을 가지고 있다. 이 논문에서는, 사용자가 질의한 CXQuery를 그에 해당하는 XQuery로 변환하는 변환기를 개발함으로써 CXQuery의 문서 구조 독립적인 질의가 용이 하도록 하고 XML문서에 대해 직접적으로 질의 처리가 가능하도록 하였다.

  • PDF