• 제목/요약/키워드: XML query processing

검색결과 217건 처리시간 0.019초

XML 데이터 처리에서 시맨틱 (Semantics in XML Data Processing)

  • 진민
    • 한국산학기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.1327-1335
    • /
    • 2011
  • XML은 계층적이고 스스로 기술하는 구조를 가지는 데이터를 표현하기에 좋지만 XML 자체는 시맨틱을 가지고 있지 않다. 하지만 XML이 널리 새로운 응용에서 사용됨에 따라 XML 시맨틱이 필요하게 되었다. 이 논문은 XML 데이터 처리 환경에서 시맨틱을 조사하였다. XML 시맨틱은 사용 용도에 따라 구조적 시맨틱, 관계 시맨틱, 확장 시맨틱과 시맨틱 웹으로 분류할 수 있다. 그리고 질의 처리와 같이 XML 문서 관리에서 활용하기 위해 확장된 관계 시맨틱을 제안한다.

XML 질의의 수행성능 향상을 위한 트리 구조 XPath 질의의 축약 기법에 관한 연구 (A Tree-structured XPath Query Reduction Scheme for Enhancing XML Query Processing Performance)

  • 이민수;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.585-596
    • /
    • 2007
  • 일반적으로 XML 데이터는 트리 형태의 계층적인 구조를 가지고 있으며, XML 데이터의 저장 및 검색도 이러한 특성을 반영한다. 따라서 XML 데이터를 데이터베이스화 할 때에 XML 엘리먼트 간의 이러한 계층 관계를 반영하여 XML 데이터를 구조화하여 저장하고, 사용자의 검색을 지원하기 위해서는 질의에 명세 된 엘리먼트 구조 간의 계층 관계를 계산하여 처리하는 방법이 필요하다. 구조적 조인(structural joins) 연산은 이 문제의 한 해결책으로서 노드 번호 매기기 방식(node numbering scheme)에 기반한 XML 데이터베이스에 대하여 효율적인 계층 관계 연산 기법을 제시하고 있다. 하지만 계층 관계가 복잡하게 중첩되어 있는 트리 구조의 XML 질의를 처리하려면 여전히 다수의 구조적 조인을 수행해야 하기 때문에 질의 처리 비용이 많이 드는 또 다른 문제를 갖게 된다. 이에 본 논문에서는 선행 연구에서 제안된 트리 구조의 XML 질의 처리시에 필요한 다수의 중첩된 구조적 조인들의 수행비용을 효과적으로 줄이기 위한 사전 처리 방법으로서 동등 클래스 개념을 적용한 정규 표현식(regular expression)으로 된 경로 질의(path query)의 길이를 단축하는 경로식 단축 알고리즘을 소개하며 특히 분기 노드(branch node)가 포함된 경로식 단축 알고리즘을 제안한다. 제안한 알고리즘이 XML 경로식 질의 처리 시간을 평균적으로 1/3로 단축할 수 있음을 실험을 통해서 확인한다.

XML 데이터베이스 다차원 타입상속 색인구조의 조율 알고리즘 (A Tuning Algorithm for the Multidimensional Type Inheritance Index of XML Databases)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.269-281
    • /
    • 2011
  • XML 데이터베이스에서 타입상속 개념의 질의처리를 지원하기 위한 다차원 타입상속 색인구조(Multidimensional Type Inheritance Index: MD-TIX)에 대하여, 본 논문에서는 질의 패턴에 따라 색인성능을 향상시키기 위한 색인구조의 조율 알고리즘을 제안한다. MD-TIX는 중첩 엘리먼트와 타입상속 계층이 포함된 복합 형태의 XML 질의처리를 지원하기 위하여 다차원 색인구조를 이용한다. MD-TIX의 조율 알고리즘에서는 먼저 사용자 질의 형태에 대한 질의 정보로서 색인구조를 구성할 색인 페이지 영역들의 모양을 결정하고, 이러한 모양의 페이지 영역들을 갖도록 하는 구간반분 전략을 적용함으로써 최적의 MD-TIX 색인구조를 구성한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 제안한 조율 알고리즘을 적용함으로서 최적의 MD-TIX를 구성할 수 있었으며, 경로 길이가 2인 경우에 주어지는 중첩 술어에 대한 삼차원 질의 영역의 경우, 모양이 편향된 정도에 따라 질의처리의 성능이 매우 크게 향상됨을 알 수 있었다.

스트리밍 XML 데이터의 빈발 구조 마이닝 (Mining of Frequent Structures over Streaming XML Data)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.23-30
    • /
    • 2008
  • 유비쿼터스 환경에서 상황정보 인식 분야를 연구하면서 가장 밑바탕에서 기초가 될 수 있는 것은 인터넷 기술과 XML(Extensible Markup Language)이다. 인터넷을 통한 통신에서 XML 데이터의 사용이 일반화되고 있으며 데이터의 형태는 연속적이다. 그리고 XML 스트림 데이터에 대한 질의를 처리하기 위한 방안들이 제시되고 있다. 이 논문에서는 스트림 데이터에 대한 질의처리를 효율적으로 수행하기 위한 기반연구로써 XML을 레이블의 순서화된 트리로 모델링하여 온라인 환경에서 빈발한 구조를 추출하는 마이닝 방법을 제안한다. 즉, 지속적으로 입력되는 XML 데이터의 구조를 트리로 모델링하고 각각의 트리를 하나의 트리 집합의 구조로 표현하여 현재 윈도우 시점에서 빈발한 구조를 정확하고 빠르게 추출하는 방법을 제시한다. 제시하는 방법은 XML의 질의 처리 및 색인 구성의 기초 자료로 활용될 수 있다.

유효한 XML 스트링에 대한 효율적이고 안전한 질의 처리 (An Efficient and Secure Query Processing on Valid XML Streams)

  • 변창우;안은주;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.235-246
    • /
    • 2009
  • 기존 서버에서 담당하던 접근제어를 서버에 비해 제약을 갖는 클라이언트에서 처리하고자 하는 요구가 생겨남에 따라 자원 제약을 갖는 환경에서 효율적이고 안전하게 실의를 처리할 수 있는 방법이 필요하게 되었다. 기존의 접근제어 연구는 안전성에 초점을 맞추어 왔기 때문에 효율성 측면에 대한 고려가 적었으며, 최근 스트림 환경에서 보안 문제가 대두되면서 접근제어를 포함한 보안 측면의 연구가 시작되었다. 본 논문은 XML 데이터 스트립을 PDA나 휴대용 단말기와 같은 자원의 제약이 있는 클라이언트에서 안전하고 효율적으로 다루기 위한 방법을 제안한다. 본 연구는 유효한 XML 스트림 환경에서 첫째로 한정된 메모리 내에서 안전한 결과를 내기 위해 오버 헤드가 매우 적은 접근제어 처리 방법을 제안하고 있으며, 둘째로 접근제어 추가로 인한 오버헤드를 상쇄시키기 위해 처리 단계 마다 최적화가 가능한 부분들을 찾아 성능을 개선하는 방법을 제안한다. 실험을 통해 제안하는 방법의 우수성을 분석한다.

ORDBMS를 사용한 XML 질의 캐쉬의 효율적인 지연 갱신 (Efficient Deferred Incremental Refresh of XML Query Cache Using ORDBMS)

  • 황대현;강현철
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.11-22
    • /
    • 2006
  • XML 문서의 생성 및 활용도가 증가함으로 인해 XML 문서를 데이터베이스에 저장하여 관리하는 기법이 활발히 연구되고 있다. 관계형 또는 객체 관계형 데이터베이스 관리 시스템(RDBMS/ORDBMS)을 XML 문서의 저장소로 사용하는 것은 현재 가장 실용적인 방법으로 받아들여지고 있다. 데이터베이스에 저장된 XML 문서에 대한 빠른 질의 처리를 위하여 XML 질의 캐쉬를 사용할 수 있다. 그러나 XML 질의 캐쉬의 사용은 하부 자료의 변경에 대한 일관성 유지비용이 든다. 본 논문에서는, ORDBMS를 XML 질의 캐쉬와 하부 XML 자료의 저장소로 사용하고 변경로그를 사용하여 XML 질의 캐쉬를 지연 갱신할 때, XML 질의 캐쉬에 대한 비효율적인 갱신의 원인인 변경로그에 저장된 동일한 XML 문서에 대한 중복 변경을 제거 또는 여과하는 알고리즘을 제시한다. 또한 이를 바탕으로 XML 질의 캐쉬의 갱신에 사용할 최적화된 SQL 문을 생성한다. 실험을 통해 본 논문에서 제안한 XML 질의 캐쉬의 지연 갱신 방법의 효율성을 보인다.

XML 문서의 상향식 질의처리를 지원하는 효율적인 색인구조 (An Efficient Index Structure for Bottom-Up Query Processing of XML Documents)

  • 서동민;김은재;성동욱;유재수;조기형
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.101-113
    • /
    • 2006
  • XML에서의 질의는 경로 질의를 사용하고, 경로 질의를 효과적으로 처리하기 위한 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법과 더불어 접미사(suffix) 트리를 이용한 기법이 제안되고 있다. 그 중에서 가장 대표적인 기법이 ViST(Virtual Suffix Tree) 이다. ViST는 질의 처리 시간을 줄이기 위해서 접미사 트리와 B+ 트리를 이용하여 질의 처리에 참여하는 엘리먼트만을 비교한다. 그러나 실제 문서에서 조상-후손 관계가 아닌 엘리먼트도 후손으로 보고 처리하는 문제점으로 인해 디스크 접근이 많아지는 비효율성을 지닌다. 따라서 본 논문에서는 ViST의 문제점을 해결하는 색인구조를 제안하고 이 색인구조에 알맞은 질의 처리기법을 제안한다. 그리고 다양한 질의 처리 실험을 통해 기존에 제안된 색인구조에 비해 향상된 질의 처리 성능을 나타냄을 보인다.

  • PDF

XML 문서에서의 레이블 경로 발생 빈도수에 따른 스키마 추출 방법 (The Schema Extraction Method using the frequency of Label Path in XML documents)

  • 김성림;윤용익
    • 인터넷정보학회논문지
    • /
    • 제2권4호
    • /
    • pp.11-24
    • /
    • 2001
  • 인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하는 XML 문서는 정해진 스키마를 가지고 있지 않다. XML 문서를 기존의 관계형 데이터베이스나 객체 지향 데이터베이스 질의어에 바로 적용하기에는 부적합하여 이러한 XML 문서에 대해 스키마를 추출하는 방법과 질의어에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 XML문서의 레이블 경로발생 빈도 수에 따른 여러 단계의 스키마를 추출하는 방법을 제시하고, 이를 실험하여 그 효율성을 보인다.

  • PDF

실체뷰 캐쉬 기법을 이용한 XML 질의 처리 시스템의 구현 (Implementation of XML Query Processing System Using the Materialized View Cache-Answerability)

  • 문찬호;박정기;강현철
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.293-304
    • /
    • 2004
  • 데이터베이스 기반의 웹 응용을 위한 캐슁 기법이 최근 많이 연구되고 있다. 자주 제기되는 질의의 결과를 캐쉬 해두면 반복 질의를 위한 재사용은 물론 관련 질의의 처리에 이용될 수 있다. 웹 상에서 데이터 교환의 표준으로 XML이 등장한 이래 현재 웹 응용들은 네트워크 상의 원격 XML소스로부터 데이터 검색을 수행하는 경우가 많아졌는데 이의 효율적인 지원을 위해 검색 결과를 캐쉬 하는 것은 유용하다. 본 논문은 XML 질의를 관련 XML 캐쉬를 이용하여 처리하는 시스템의 구현 및 성능 평가에 관한 것이다. XML 질의로 XQuery, XPath, XQL 등과 같은 모든 XML 질의어의 핵심 요소인 경로 표현식을 대상으로 하였고, XML 캐쉬는 XML 실체뷰를 고려하였고, 캐쉬를 이용한 XML 질의 변환 알고리즘은 [13]에 제시된 것을 대상으로 하였다. [13]의 질의 변환 알고리즘을 지원하는 프로토타입 XML저장 시스템이 관계 DBMS를 이용하여 구현되어 다양한 성능 실험에 이용되었다. 구현의 주요 이슈에 대하여 자세히 기술한다. 성능 실험 결과를 통해 캐쉬를 이용한 XML질의 처리의 효율성을 확인하였고, 기존 연구와의 성능 비교도 기술하였다.

XML 질의처리를 위한 다차원 타입상속 색인구조의 할당기법 (An Assignment Method of Multidimensional Type Inheritance Indexes for XML Query Processing)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-15
    • /
    • 2009
  • 본 논문에서는 XML 데이터베이스에서 XML 질의처리를 효율적으로 지원하기 위한 다차원 타입상속 색인구조(MD-TIX)들의 할당기법을 제시한다. MD-TIX는 중첩요소와 여러 타입상속 계층으로 이루어진 중첩술어의 처리를 효율적으로 지원하기 위하여 다차원 색인구조를 이용하는 색인기법이다. 본 논문에서는 타겟 타입 또는 도메인 타입의 대치가 있는 Xpath로 표현된 여러 중첩술어들의 접속으로 구성된 복합질의의 관점에서 MD-TIX 색인들의 할당에 따른 질의처리 기법들을 분석하고, 그 결과로서 가장 효과적인 객인 할당기법을 제시한다. 먼저, XML문서의 변경에 따른 MD-TIX 색인구조의 운용과 하나의 중첩술어를 가지는 질의처리에 대한 MD-TIX 색인의 할당에 대하여 분석한다. 그리고 경로들 사이에 공통의 부경로가 있는 겹침 경로 상에 주어지는 여러 개의 중첩술어들로 구성된 보다 일반적인 질의의 관점에서 MD-TIX 색인의 운용과 그 할당기법을 제시한다.

  • PDF