• 제목/요약/키워드: XML Databases

검색결과 230건 처리시간 0.023초

XML 질의처리를 위한 다차원 타입상속 색인구조의 할당기법 (An Assignment Method of Multidimensional Type Inheritance Indexes for XML Query Processing)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-15
    • /
    • 2009
  • 본 논문에서는 XML 데이터베이스에서 XML 질의처리를 효율적으로 지원하기 위한 다차원 타입상속 색인구조(MD-TIX)들의 할당기법을 제시한다. MD-TIX는 중첩요소와 여러 타입상속 계층으로 이루어진 중첩술어의 처리를 효율적으로 지원하기 위하여 다차원 색인구조를 이용하는 색인기법이다. 본 논문에서는 타겟 타입 또는 도메인 타입의 대치가 있는 Xpath로 표현된 여러 중첩술어들의 접속으로 구성된 복합질의의 관점에서 MD-TIX 색인들의 할당에 따른 질의처리 기법들을 분석하고, 그 결과로서 가장 효과적인 객인 할당기법을 제시한다. 먼저, XML문서의 변경에 따른 MD-TIX 색인구조의 운용과 하나의 중첩술어를 가지는 질의처리에 대한 MD-TIX 색인의 할당에 대하여 분석한다. 그리고 경로들 사이에 공통의 부경로가 있는 겹침 경로 상에 주어지는 여러 개의 중첩술어들로 구성된 보다 일반적인 질의의 관점에서 MD-TIX 색인의 운용과 그 할당기법을 제시한다.

  • PDF

의미 기반의 XML키워드 검색을 위한 효율적인 인덱스 구조 (An Efficient Index Structure for Semantic-based XML Keyword Search)

  • 이형동;김성진;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.513-525
    • /
    • 2006
  • XML 키워드 검색에서의 검색 결과는 일반적으로 질의 키워드를 모두 포함하는 원소 중 가장 구체적 원소들로 정의된다. 키워드 검색의 정확도 향상을 위하여 XML 원소의 레이블과 온톨로지, 개념모델, 시소러스 둥의 의미 정보가 사용되고 있다. 본 논문에서는 의미 정보를 이용하여 검색 결과로 반환 가능한 개념들이 정의되고 사용자가 검색하려는 개념이 해석 가능할 경우 효율적 질의 처리를 위한 계층 인덱스를 제안한다. 계층 인덱스는 각 키워드 포스팅의 XML 원소들을 원소가 속한 개념들의 상하 관계에 따라 구별하여 저장하고, 검색 결과 산출 가능성이 있는 개념에 속한 원소들만을 선별적으로 읽어서 제한된 조합으로 질의 결과 후보가 되는 최소 공통 선조들을 산출할 수 있도록 한다. 본 논문에서는 계층 인덱스의 구성 원리와 구성 방법, 계층 인덱스를 이용한 질의 처리 방법을 기술한다. DBLP의 XML문서와 INEX2003의 XML 문서 집합을 이용한 실험에서 의미 기반 계층 인덱스는 우수한 성능을 나타내었다.

XML 스트림 데이타에 대한 적응력 있는 질의 처리 시스템 (An Adaptive Query Processing System for XML Stream Data)

  • 김영현;강현철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.327-341
    • /
    • 2006
  • 센서 네트워크, 모니터링, SDI (selective dissemination of information) 등과 같이 스트림 데이타를 생성하는 응용의 증가로 스트림 데이타에 대한 질의 처리를 효율적으로 지원하기 위한 연구가 활발히 수행되고 있다. 특히 SDI와 같은 웹 환경의 응용은 XML 스트림에 대한 질의 처리를 필요로 하는데, XML은 웹 환경에서 데이타 교환의 표준이므로 이에 대한 연구는 아주 중요하다. 그러나 현재까지 제시된 XML 스트림 질의 처리 시스템들은 정적인 질의 계획을 사용하기 때문에 동적으로 변하는 스트림 데이타에 대해 적응력 있게 대처하지 못하는 문제가 있다. 반면 관계 데이타 스트림에 대한 질의 처리 시스템들은 질의 연산자 라우팅 기법을 통해 동적인 질의 계획을 사용함으로써 적응력 있는 질의 처리를 지원한다. 본 논문에서는 관계 데이타 모델을 사용하는 시스템의 적응력 있는 질의 처리 모델을 적용하여XML 스트림에 대한 적응력 있는 질의 처리를 수행할 수 있는 시스템을 제안한다. 그리고 기존의 XML을 기반으로 하는 대표적인 시스템인 YFilter와 본 논문이 제안하는 시스템의 성능을 비교, 평가하여 본 논문이 제안하는 시스템의 효율성을 보인다.

객체-관계형 데이터베이스에 의한 XML문헌의 검색성능 평가 (Retrieval Performance of XML Documents Using Object-Relational Databases)

  • Kim, Hee-Sop
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.189-210
    • /
    • 2004
  • 본 연구의 목적은 객체-관계형 데이터베이스 접근에 의한 XML 문헌의 검색 성능을 평가하는 것이다. 본 논문에서는 INEX(Initiative for the Evaluation of XML retrieval)에서의 XML 문헌의 색인 및 검색 방법에 대하여, 그리고 실험 방법론들에 대하여 기술하고 있다. 대부분의 전통적인 정보검색 성능평가 실험에서와 같이 본 연구에서 사용된 테스트 콜렉션(test collection)은 문헌(즉, XML 문헌), 토픽, ad hoc 검색, 적합성 판단, 평가로 이루어졌다. 그리고 ORDBMS 기술들을 기반으로 개발된 전용 XML 데이터베이스의 일종인 EXIMA$^{TM}$ Supply을 사용하여 INEX에서 제공한 대규모 XML 문헌들을 저장하고 검색하였다. 본 논문에서는 실험에서 사용한 시스템에 대한 개략적인 기능들과 색인 및 검색 과정 그리고 INEX 2002에서의 성능평가 결과에 대하여, 앞으로 개선되어야 할 기능에 대하여 논하고 있다.

XML 데이터베이스에서 효율적인 경로처리를 위한 구조적 세미조인 기법 (Structural Semi-Join Operators for Efficient Path Processing in XML Databases)

  • 손석현;신효섭
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권2호
    • /
    • pp.252-256
    • /
    • 2010
  • 구조적 조인은 효율적인 XML 질의 처리를 위한 핵심 연산자 중의 하나이다. 구조적 조인은 대용량의 XML 노드들을 대상으로 계층관계(조상-자손 및 부모-자식관계)를 형성하는 쌍을 효율적으로 계산한다는 측면에서, 경로패턴으로 표현된 질의를 처리하는 데 주로 사용될 수 있다. 하지만 구조적 조인 알고리즘은 XML의 경로 처리과정에서 많은 오버헤드를 야기 시킨다. 이에 대한 개선된 연산자인 구조적 세미조인은 효율적인 처리를 위하여 XML 노드간의 조인 결과를 조상노드 혹은 자손노드로 한정시키는 새로운 연산자이다. 본 논문에서는 구조적 세미조인 알고리즘을 소개하고, 구조적 세미조인을 이용한 경로처리 알고리즘을 제시한다. 실험을 통하여 개선된 방식의 구조적 세미조인 알고리즘이 XML 경로처리에 있어서 매우 효율적임을 보여준다.

스트리밍 XML 데이타에서 영역 윈도우를 사용한 조인 질의의 범위 최소화 기법 (Scope Minimization of Join Queries using a Range Window on Streaming XML Data)

  • 박석;김미선
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.224-238
    • /
    • 2006
  • XML이 인터넷 상에서 데이타 교환의 표준으로 자리매김하면서 스트리밍 환경의 XML 데이타에 대한 효과적인 조인 질의 처리도 증가하고 있다. 튜플 단위로 처리하는 기존의 데이타베이스 기법을 스트리밍 XML 데이타에 적용했을 때 제한된 메모리 사용에 따른 메모리 한계를 초과하는 문제가 발생한다. 또한 구조적인 특징을 가지는 XML 데이타에 대한 질의 경로 탐색 및 특정 부분 데이타에 대한 접근에 소모되는 처리 비용이 급격히 증가하는 문제가 발생하게 된다. 근본적으로 전체 데이타가 아닌 부분 데이타를 저장하고 질의 처리해야 하는 스트리밍 환경에 적용하기에는 부적절하다. 따라서 스트리밍 XML 데이타에 맞는 저장 기법으로 적은 메모리의 사용을 통해 빠르게 조인 프레디킷을 만족하는 부분 스트리밍 데이타를 검색할 수 있는 새로운 기법이 요구된다. 본 논문에서는 적은 메모리 사용을 위한 저장 기법을 위해 PCDATA와 CDATA에 해당되는 부분만을 추출하여 저장한다. 그리고 빠른 조인 프레디킷(Predicate) 비교를 위해 DTD의 구조정보 중 지시자(Cardinality) "*" 와 "+"를 기초하여 영역 윈도우(Range Window)를 설정하여 질의에 만족하는 윈도우만을 선택적으로 조인하는 기법을 제안하여 문제를 해결한다.

빈번히 갱신되는 XML 문서에 대한 프라임 넘버 레이블링 기법 (An Improved Method of the Prime Number Labeling Scheme for Dynamic XML Documents)

  • 유지열;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권1호
    • /
    • pp.129-137
    • /
    • 2006
  • XML 레이블링 기법은 엘리먼트 간의 조상-자손 관계 및 형제들 간의 순서 둥을 쉽게 결정할 수 있도록 하는 색인을 위한 인코딩(encoding)이라고 할 수 있다. 특히 근래에는 Web Services 및 AXML (Active XML)과 같은 기술에 동적 XML 문서가 등장하게 되었고 이로 인해 동적 XML 레이블링 기법이 필요하게 되었다. 대표적인 동적 레이블링 기법인 프라임 넘버 레이블링(prime number labeling)기법은 XML 문서의 엘리먼트 간의 부모-자식간의 관계를 소수의 특성을 이용하여 결정할 수 있도록 하는 기법이다. 이 기법은 새로운 엘리먼트가 삽입이 될 때 부여되는 레이블이 기존의 레이블 정보를 변화시키지 않는다는 장점이 있으나 형제간의 순서를 결정하는 순서 값(Order number)을 갱신하기 위해 추가의 연산 및 자료구조를 유지하는 비용을 갖는 단점을 가지고 있다. 본 논문에서는 이러한 비용을 줄이기 위해 요소의 순서정보를 나타내는 오더 값을 공유하는 기법과 삽입되는 위치에 따라 레이블의 값 또는 오더 값을 이용하여 형제간의 순서를 결정할 수는 방법을 제안하여 기존방법보다 적은 비용으로 처리할 수 있도록 하였다.

XML Repository System Using DBMS and IRS

  • Kang, Hyung-Il;Yoo, Jae-Soo;Lee, Byoung-Yup
    • International Journal of Contents
    • /
    • 제3권3호
    • /
    • pp.6-14
    • /
    • 2007
  • In this paper, we design and implement a XML Repository System(XRS) that exploits the advantages of DBMSs and IRSs. Our scheme uses BRS to support full text indexing and content-based queries efficiently, and ORACLE to store XML documents, multimedia data, DTD and structure information. We design databases to manage XML documents including audio, video, images as well as text. We employ the non-composition model when storing XML documents into ORACLE. We represent structured information as ETID(Element Type Id), SORD(Sibling ORDer) and SSORD(Same Sibling ORDer). ETID is a unique value assigned to each element of DTD. SORD and SSORD represent an order information between sibling nodes and an order information among the sibling nodes with the same element respectively. In order to show superiority of our XRS, we perform various experiments in terms of the document loading time, document extracting time and contents retrieval time. It is shown through experiments that our XRS outperforms the existing XML document management systems. We also show that it supports various types of queries through performance experiments.

인트라넷에서의 웹 서비스를 이용한 이기종 RDB간의 데이터 이주 (The Migration of Data Between Heterogeneous RDBs Using Web Service in Intranet)

  • 박유신;정계동;최영근
    • 한국통신학회논문지
    • /
    • 제30권11B호
    • /
    • pp.758-771
    • /
    • 2005
  • 현재 기업 내의 정보 시스템들은 개별적이고 다양한 형태의 데이터베이스를 활용하여 업무적으로 발생하는 대량의 데이터를 저장하고 관리하고 있다. 이렇게 개별적으로 존재하는 데이터베이스에 저장된 데이터들을 이주시키기 위해 기업들은 EAI, MDR, DW 등의 기술을 활용하고 있다. 하지만 이러한 기술들은 도입 비용 및 유지관리에 많은 비용을 요구할 뿐만 아니라 각 벤더들마다 요구하는 환경이 상이하다는 문제점을 가지고 있다. 이러한 기존 기술들의 문제점을 해결하기 위해 본 논문에서는 정 서비스를 기반으로 이기종 관계데이터베이스 간의 데이터 및 의미적인 제약 조건을 이주하는 데이터 이주 시스템을 설계한다. 점 서비스를 사용함으로써 기업들은 기존의 웹 환경을 활용할 수 있으므로 도입 비용 및 유지관리 비용을 절감할 수 있고 각각의 시스템들은 XML 포맷을 사용함으로 플랫폼 및 시스템 환경, 구현언어에 독립적으로 데이터를 이주할 수 있다.

순차 패턴 마이닝을 사용한 두 XML 문서간 최대 유사 경로 추출 (Extracting Maximal Similar Paths between Two XML Documents using Sequential Pattern Mining)

  • 이정원;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.553-566
    • /
    • 2004
  • 최근 XML 저장 기법, 질의 최적화, 인덱싱 등의 XML 관련 기술이 활발히 연구되고 있다. 이와 관련하여 하나의 DTD나 XML Schema로 정의된 고정 구조를 공유하는 문서 집합이 아니라 다양한 구조를 가진 문서 집합인 경우 다중 문서간의 구조적 유사성이나 차이점 등을 파악할 필요가 있다. 예를 들어 서로 다른 사이트나 문서 관리 시스템에서 도출된 문서들을 합병하거나 분류할 필요가 있을 때, 문서를 처리하기 위해 공유 구조를 발견하는 일은 매우 중요하다. 본 연구에서는 다양한 문서들의 구조를 구성하는 경로들간의 유사성을 파악하기 위해 기존의 순차패턴 마이닝 알고리즘(1)을 변형하여 두 XML 문서간 최대 유사 경로를 추출한다. 몇 가지 실험을 통해 본 논문에서 제안한 변형된 순차패턴 마이닝 알고리즘이 두 문서간의 최대 유사 경로를 찾아내고 또한 두 문서간의 정확한 공유 경로 및 최대 유사 경로를 정확히 찾을 수 있음을 보인다. 또한 실험 결과 분석을 위해 최대 유사 경로를 기반으로 정의된 유사성 척도가 XML 문서를 정확하게 분류할 있음을 보인다.