• 제목/요약/키워드: XML path processing

검색결과 78건 처리시간 0.02초

XML 실체뷰를 이용한 XML 질의 처리 : 경로 표현식의 분할 처리 및 결과 통합 (Processing XML Queries Using XML Materialized Views : Decomposition of a Path Expression and Result Integration)

  • 문찬호;강현철
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.621-638
    • /
    • 2003
  • 웹 상에서 XML 문서의 수요가 증가함에 따라 XML 문서를 자원으로 갖는 웹 서비스 응용들이 증가하고 있다. 이들 웹 서비스 응용에서 질의 처리 시 성능 향상을 위해 XML 데이타에 대한 뷰 메커니즘을 고려할 수 있다. XML 질의 결과를 실체뷰로 유지하고, 하부 XML 문서에 대한 원래의 질의를 관련된 실체뷰에 대한 질의로 변환하여 수행한다면 질의 응답시간을 줄일 수 있을 것이다. 실체뷰를 이용한 질의 처리의 유형으로는 $\circled1$ 실체뷰로부터 원하는 결과를 모두 얻을 수 있는 유형과 $\circled2$ 질의 결과의 일부는 실체뷰에 존재하지만 일부는 하부 XML 문서로 부터 검색해야 하는 유형이 있다. 본 논문에서는 두 번째 유형에 대하여 연구한다. 본 논문의 질의는 여러 XML 질의어들이 갖는 핵심적인 기능 중 하나인 XML 경로 표현식이다. 본 논문에서는 먼저, XML 저장소 내 하부 XML 문서들로부터 도출된 XML 실체뷰의 저장 구조를 제시 한 후, 주어진 XML 질의를 실체뷰에 대한 질의와 하부 데이타에 대한 질의로 분할하는 알고리즘과 분할 질의의 결과를 통합하는 알고리즘을 제시한다. 그리고, 성능 평가를 통하여 실체뷰를 이용한 질의 분할 처리가 성능 향상을 가져오는 조건을 구한다.

경로를 표시하지 않는 XML 질의 (XML Queries without Path Expressions)

  • 이월영;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.204-218
    • /
    • 2005
  • XML은 수 많은 응용들에서 데이타를 교환하기 위한 표준으로 급속도로 출현되었다. XML 데이타에 대해 효율적인 질의를 지원하기 위하여 많은 질의어들도 설계되었다. 이러한 질의어들은 사용자들이 XML 문서 구조를 알아야 사용할 수 있고 구조에 대한 검색 조건을 명시해야만 한다. 이러한 XML 문서에 대해 경로 기반으로 하는 질의는 XML이 계층적 구조이기 때문에 당연한 것 이다. 그러나 이러한 현재의 경로 기반의 질의를 보충하기 위하여, 사용자들이 XML 문서에 대하여 경로를 사용하지 않는 질의도 필요하다. 이 논문에서 우리는 XML 문서 구조를 모르고도 질의할 수 있는 질의 표현을 설계하고, 이 경로를 명시하지 않는 질의를 평가하기 위한 질의 처리기를 개발하였다.

XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법 (Two-Dimensional Grouping Index for Efficient Processing of XML Filtering Queries)

  • 여대휘;이종학
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.123-135
    • /
    • 2013
  • 본 논문에서는 XML 필터링 질의의 효율적 처리를 위한 이차원 그룹핑 색인기법인 2DG-index를 제안한다. 최근 XML데이터의 질의 처리를 위해 조상-후손관계 또는 부모-자식관계 등의 구조적 관계를 효율적으로 처리하기 위한 많은 연구들이 수행되었다. 그러나 이러한 연구들은 경로 질의에만 초점을 두고 있으며 특정 조건 값을 포함하는 필터링 질의에 대해서는 고려하지 않고 있다. 2DGindex는 필터링 질의를 효율적으로 처리하기 위한 방안으로 XML 스키마의 경로 도메인과 필터링 데이터 값의 도메인으로 구성된 이차원 도메인 공간상의 색인 엔트리들의 클러스터링을 다루는 색인기법이다. 2DG-index의 성능평가를 위하여 특정 조건 값을 포함하는 질의의 유형을 세 가지로 분류하고, 이러한 질의 유형별로 2DG-index의 질의처리 성능을 기존의 일차원 색인구조를 이용하는 색인기법인 데이터 값별로 그룹핑한 DG-index와 경로별로 그룹핑한 PG-index와 비교하여 2DG-inedx의 효율성을 입증한다.

XML 질의 처리를 위한 효율적인 시퀀스 매칭 기법 (An Efficient Sequence Matching Method for XML Query Processing)

  • 서동민;송석일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.356-367
    • /
    • 2008
  • 인터넷 상에서 정보 표현 및 교환의 표준으로 XML이 대두되면서 데이타베이스 연구 분야에서는 XML 질의 처리에 대한 중요성이 커지고 있다. 그리고 과거 몇 년간 빠른 XML 질의 처리를 위해 XISS, XR-트리와 같은 구조적 XML 질의 처리 기법이 제안되었다. 하지만 구조적 XML 질의 처리는 가지 경로 질의 처리를 위해 많은 조인 비용이 요구되는 문제를 가지고 있다. 최근에는 구조적 XML 질의 처리 기법의 조인 문제를 해결하기 위해 ViST와 PRIX와 같은 시퀀스 매칭 기반의 XML 질의 처리 기법이 제안되었다. 시퀀스 매칭 기반의 XML 질의 처리 기법은 가지 경로 질의를 다수의 부질의로 분리하지 않고 질의 시퀀스가 문서 내에 포함되는지만 비교하기 때문에 조인 비용이 요구되지 않는 장점을 가지고 있다. 하지만 ViST는 최적화되지 못한 번호부여 기법을 사용함으로써 질의 처리 시 구조 관계를 정확하게 판단하지 못하고, PRIX는 질의와 문서의 NPS와 LPS를 비교하는데 많은 비용이 요구된다. 따라서 본 논문에서는 XML 질의 처리 성능 향상을 위해 상향식 질의 처리를 사용하는 효율적인 시퀀스 매칭 기법을 제안한다. 또한 본 논문의 성능 평가에서는 제안하는 기법을 ViST PRIX와 비교하여 제안하는 기법이 와일드-카드('*'와 '//')를 포함하는 선형 경로 질의뿐만 아니라 가지 경로 질의 처리에 대해 향상된 성능을 나타냄을 보인다.

스트림된 XML 조각들의 효율적인 질의 처리 (Effective Query Processing on Streamed XML Fragments)

  • 고혜경
    • 한국IT서비스학회지
    • /
    • 제12권2호
    • /
    • pp.257-268
    • /
    • 2013
  • Query processing on streamed XML fragments is one of key issues in XML databases. In this paper, XFSeed (XML Fragment Processor with Seed label) is proposed to provide effective query processing by removing many redundant path evaluations and minimizing the number of fragments processed. The conducted experimental results reveal that the proposed scheme efficiently handles query processing and reduces memory usage.

XML 구조 문맥을 사용한 효율적인 경로 표현식 조인 알고리즘 (An Efficient Path Expression Join Algorithm Using XML Structure Context)

  • 김학수;신영재;황진호;이승미;손진현
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.605-614
    • /
    • 2007
  • XML 데이터 검객을 위한 표준 질의 언어로서 XQuery와 XPath가 W3C에 의해 표준으로 제정되었다. XQuery와 XPath를 보편적으로 사용함에 따라, 최근 연구는 방대한 XML 데이터베이스에서 XPath 경고 표현식에 대한 효율적인 질의 처리를 위한 데이터 구조 및 알고리즘 개발에 초점을 두고 있다. 최근에, XPath 경로 표현식을 처리할 때 XML 엘리먼트 사이의 구조적 관계(조상-자손, 부모-자식)를 결정하는 구조적 조인의 개념은 중요한 XPath 프로세싱 기법중의 하나가 되었다. 그러나 XPath 질의 처리에서 자주 발생하는 구조적 조인들은 높은 비용을 요구한다. 본 논문에서, 우리는 XPath 질의들을 효율적으로 처리하기 위해 제안한 구조적 인덱스(SI) 기반의 새로운 구조적 조인 알고리즘(SISJ)을 제안한다. 실험 결과에서는 이전의 알고리즘보다 근소하게 더 효율적인 성능을 보여 준다. 그러나 재귀성이 높은 문서에 대해서는 제안기법의 가지치기 특성으로 인해 약 30% 이상의 성능향상을 보였다.

XML 문서에서의 레이블 경로 발생 빈도수에 따른 스키마 추출 방법 (The Schema Extraction Method using the frequency of Label Path in XML documents)

  • 김성림;윤용익
    • 인터넷정보학회논문지
    • /
    • 제2권4호
    • /
    • pp.11-24
    • /
    • 2001
  • 인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하는 XML 문서는 정해진 스키마를 가지고 있지 않다. XML 문서를 기존의 관계형 데이터베이스나 객체 지향 데이터베이스 질의어에 바로 적용하기에는 부적합하여 이러한 XML 문서에 대해 스키마를 추출하는 방법과 질의어에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 XML문서의 레이블 경로발생 빈도 수에 따른 여러 단계의 스키마를 추출하는 방법을 제시하고, 이를 실험하여 그 효율성을 보인다.

  • PDF

색인된 XML 문서에서 레벨 정보를 이용한 효과적인 구조 조인 기법 (Efficient Structural Join Technique using the Level Information of Indexed XML Documents)

  • 이윤호;최일환;김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.641-649
    • /
    • 2005
  • 오늘날 인터넷의 발달과 함께 XML이 많이 사용됨에 따라, XML 저장소와 질의 처리에 관한 연구가 활발하게 이뤄지고 있다. XML에서는 경로 질의를 사용하는데, 이러한 경로 질의를 효과적으로 처리하기 위하여 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법이 각광을 받고 있다. 구조 조인 기법은 엘리먼트들의 포함 관계를 살펴 질의를 처리한다. 특히 문서 전체에 대한 탐색을 하지 않고 해당하는 엘리먼트들의 역색인 리스트만을 비교하여 질의 처리를 수행하는 장점을 갖는다. 하지만 구조 조인 기법은 실제 질의 결과에 포함되지 않는 불필요한 엘리먼트들도 탐색해야 하는 비효율성을 가진다. 따라서 본 논문에서는 구조 조인 기법의 성능을 개선하는 레벨 구조 조인 기법을 제안한다. 제안하는 기법은 경로 질의 내 엘리먼트 사이의 관계 정보와 XML 문서 내의 엘리먼트들의 레벨 분포 정보를 이용한다. 이를 통해 구조 조인을 수행할 때, 비교되는 역색인 리스트 내의 모든 엘리먼트들이 아닌, 특정 레벨에 해당하는 엘리먼트들만을 이용하여 비교를 수행함으로써 질의 처리의 속도를 향상시킬 수 있다.

XML 데이타베이스에서 경로-지향 질의처리를 위한 병렬 매치 방법 (A Parallel Match Method for Path-oriented Query Processing in iW- Databases)

  • 박희숙;조우현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.558-566
    • /
    • 2005
  • XML은 인터넷상에서 데이타를 표현하고 교환하기 위한 새로운 표준이다. 본 논문에서는, XML문서에 대한 경로-지향 질의어의 평가를 위한 새로운 접근법에 대하여 기술한다. 본 논문의 접근법에서는, 경로-지향 질의어의 평가속도를 개선하기 위해 경로서명을 이용하는 병렬 매치 인덱싱 구조의 제안과 함께 데이타베이스 안에 저장된 엘리먼트들의 경로서명들과 입력된 질의어의 경로서명 사이에 매치작업을 수행하기 위한 병렬 매치 알고리즘을 설계한다. 먼저, 병렬 매치 구조를 형성하기 위해서는 XML 문서상의 모든 경로서명들에 대한 이진 트라이를 구성한 다음 이들을 병렬 매치 인덱싱 구조로 변환한다. 경로-지향 질의어의 검색 연산을 수행하기 위해 병렬 매치 인덱싱 구조와 병렬 매치 알고리즘을 사용한다. 본 논문에서 제안한 방법에서 알고리즘의 시간 복잡도는 XML 문서내의 경로서명의 수에 대하여 로그값에 비례한다.

XML 질의의 수행성능 향상을 위한 트리 구조 XPath 질의의 축약 기법에 관한 연구 (A Tree-structured XPath Query Reduction Scheme for Enhancing XML Query Processing Performance)

  • 이민수;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.585-596
    • /
    • 2007
  • 일반적으로 XML 데이터는 트리 형태의 계층적인 구조를 가지고 있으며, XML 데이터의 저장 및 검색도 이러한 특성을 반영한다. 따라서 XML 데이터를 데이터베이스화 할 때에 XML 엘리먼트 간의 이러한 계층 관계를 반영하여 XML 데이터를 구조화하여 저장하고, 사용자의 검색을 지원하기 위해서는 질의에 명세 된 엘리먼트 구조 간의 계층 관계를 계산하여 처리하는 방법이 필요하다. 구조적 조인(structural joins) 연산은 이 문제의 한 해결책으로서 노드 번호 매기기 방식(node numbering scheme)에 기반한 XML 데이터베이스에 대하여 효율적인 계층 관계 연산 기법을 제시하고 있다. 하지만 계층 관계가 복잡하게 중첩되어 있는 트리 구조의 XML 질의를 처리하려면 여전히 다수의 구조적 조인을 수행해야 하기 때문에 질의 처리 비용이 많이 드는 또 다른 문제를 갖게 된다. 이에 본 논문에서는 선행 연구에서 제안된 트리 구조의 XML 질의 처리시에 필요한 다수의 중첩된 구조적 조인들의 수행비용을 효과적으로 줄이기 위한 사전 처리 방법으로서 동등 클래스 개념을 적용한 정규 표현식(regular expression)으로 된 경로 질의(path query)의 길이를 단축하는 경로식 단축 알고리즘을 소개하며 특히 분기 노드(branch node)가 포함된 경로식 단축 알고리즘을 제안한다. 제안한 알고리즘이 XML 경로식 질의 처리 시간을 평균적으로 1/3로 단축할 수 있음을 실험을 통해서 확인한다.