• 제목/요약/키워드: XML Indexing

검색결과 110건 처리시간 0.023초

MD-TIX: XML 질의의 효율적 처리를 위한 다차원 타입상속 색인기법 (MD-TIX: Multidimensional Type Inheritance Indexing for Efficient Execution of XML Queries)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제10권9호
    • /
    • pp.1093-1105
    • /
    • 2007
  • 본 논문에서는 XML 데이터베이스의 색인구조로 다차원 화일구조를 이용하는 다차원 타입상속 색인기법인 MD-TIX를 제안한다. 일차원 색인구조를 이용하는 기존의 XML 데이터베이스 색인기법에서는 타입상속계층과 중첩요소가 포함된 복합 형태의 질의들에 대한 처리를 잘 지원하지 못한다. MD-TIX에서는 XML 데이터베이스의 중첩요소에 대한 색인기법을 위하여 이차원 타입상속 계층 색인기법(2D-THI)을 다차원으로 확장하여 사용한다. 2D-THI는 타입상속 계층의 단순요소에 대한 색인기법으로 킷값 도메인과 타입식별자 도메인으로 구성된 이차원 도메인 공간상에서 요소들의 클러스터링을 다루는 색인기법이다. 본 논문의 MD-TIX에서는 색인된 중첩요소를 표현하는 경로상의 각 타입상속 계층마다 하나의 타입식별자 도메인을 할당하여 구성된 다차원 도메인 공간상에서 색인 엔트리들의 클러스터링을 다룬다. 따라서 HD-TIX에서는 기존의 색인기법에서 지원하기 어려운 질의의 대상 범위가 타입상속 계층상의 임의의 타입들로 제한되거나, 질의에 포함된 복합요소들의 도메인이 타입상속 계층상의 임의의 타입들로 제한되는 경우에도 잘 지원할 수 있다.

  • PDF

XML 뷰 인덱싱 (XML Vicw Indexing)

  • 김영성;강현철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.252-272
    • /
    • 2003
  • 뷰는 이질적인 데이타의 통합 및 여과(filtering) 기능을 통해서 데이타베이스의 필요한 부분을 제공한다. 많은 정보가 쏟아지고 있는 웹 환경의 데이타 교환 표준인 XML에 대해서도 뷰의 개념은 유용하다. 본 논문은 XML 뷰 인덱싱이라고 명명한 XML 뷰를 구현하는 기법을 제안한다. XML 뷰는 XML 뷰에 대한 정보와 더불어 뷰를 구성하는 하부 XML 엘리먼트에 대한 식별자를 저장하는 구조인 XML 뷰 인덱스로 표현된다. XML 뷰 인덱스가 XML 엘리먼트 자체가 아닌 식별자만을 저장하므로, 사용자가 XML 뷰를 요청하면 하부 XML 문서를 기반으로 XML 뷰를 실체화해야 한다. 또한, 하부 XML 문서에 대한 변경에 대하여 XML 뷰 인덱스의 일관성을 유지하기 위한 효율적인 점진적 갱신 기법이 필요하다. 본 논문에서는 XML 뷰 인덱싱을 위한 자료구조와 알고리즘을 제안하고 구현하였다. 성능 평가 결과 XML 뷰 인덱싱을 사용하는 것이 매번 뷰를 재생성하는 경우보다 질의 재수행 시간이 적게 걸렸다. XML 뷰 인덱싱 기법이 실체화 시간으로 인해 XML 실체뷰 기법보다 질의 재수행 시간은 많이 걸리지만, 저장 공간 면에서는 약 30배 정도 효율적인 것으로 나타났다.

노드 범위와 Pre-Order List를 이용한 XML문서의 효율적 색인기법 (An Efficient Index Scheme of XML Documents Using Node Range and Pre-Order List)

  • 김영;박상호;이주홍
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.23-32
    • /
    • 2006
  • 본 논문에서는 최근 방대해지는 XML문서의 효율적인 관리를 위해서 노드 범위와 Pre-Order List를 이용한 XML문서들의 인덱싱 기법을 제안한다. 기존의 제안된 인덱싱 기법들은 크게 패스(Poth)와 넘버링(Numbering)을 기반으로 하고 있다. 그러나, 패스기반의 인덱싱 기법은 중간 노드와 최하위 노드의 검색과 조상-후손관계의 조인연산에 의해 효율이 떨어지는 단점을 가진다. 또한, 넘버링기반의 방법은 XML문서의 모든 노드에 번호를 부여하기 때문에 검색-오버헤드가 증가하는 문제를 가지며, 인덱스를 위해 많은 공간이 낭비된다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해서 모든 XML문서에 노드범위 (Node Range)와 Pre-Order List를 이용한 인덱싱 기법을 제안한다. 이 방법은 유사한 구조의 XML문서가 많을수록 인덱스의 크기를 효과적으로 줄일 수 있으며, 검색 성능을 효율적으로 높일 수 있다. 또한 XML문서의 삽입, 삭제가 용이하다.

  • PDF

관계 DBMS 기반 XML 저장시스템 상에서의 XML 뷰 인덱싱 (XML View Indexing Using an RDBMS based XML Storage System)

  • 박대성;김영성;강현철
    • 인터넷정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.59-73
    • /
    • 2005
  • 질의 결과를 캐쉬한 후 후속 질의 처리에 사용하는 것은 중요한 질의 최적화 기법으로서 이에는 실체뷰 기법과 뷰 인덱싱이 있다. 관계 데이터베이스에 대하여 많이 연구된 이들 기법은 XML이 웹 상에서 데이터 교환의 표준으로 부각된 이래 최근 XML 데이터에 대해서도 연구되고 있다. XML 뷰 인덱싱은 XML 질의의 결과인 XML 뷰 xv를 XML 뷰 인덱스(XVI)라는 구조로 표현한다. XVI는 xv의 소스 문서 엘리먼트들의 식별자 및 xv에 대한 정보를 저장한다. xv에 대한 XVI는 XML 엘리먼트의 식별자만을 저장하지 엘리먼트 자체를 저장하는 것이 아니다. 따라서 xv가 요청되면 그것의 XVI를 통해 xv의 하부 소스 XML 문서에 대해 실체화(materialization) 과정이 수행되어야 한다. 본 논문은 XVI 관리 시스템과 관계 DBMS 기반의 XML 저장 시스템의 통합 문제를 다룬다. 제안된 시스템은 두개의 서로 다른 상용 관계 DBMS에 대하여 Windows 2000 Server 환경에서 각각 Java로 구현되어 XML 뷰 인덱싱을 통한 XML 질의 처리의 성능 향상 및 XML 뷰 인덱싱의 오버헤드 평가에 이용되었다. 성능 실험 결과 관계 DBMS 기반의 XML 저장 시스템 상에서 XML 뷰 인덱싱은 매우 효율적이며 그 오버헤드는 미미하다는 것을 확인하였다.

  • PDF

모바일 데이터 브로드캐스팅을 위한 트리 기반의 인덱싱 방법 (A Tree-Based Indexing Method for Mobile Data Broadcasting)

  • 박미화;이용규
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.141-150
    • /
    • 2008
  • 무선 모바일 환경에서 통신 장비의 에너지와 전송 대역폭 효율을 위해 방송 기법이 널리 사용되고 있다. 기존에는 비계층적 데이터를 대상으로 한 인덱싱 연구들이 있었으나, 웹과 이동통신 환경에서 널리 사용되는 XML 데이터에 대한 방송 인덱싱 연구는 미미한 실정이다. 본 연구에서는 XML문서에 대한 새로운 방송 인덱싱 방법으로 TOP 트리를 제안한다. TOP 트리는 XML 문서에 포함된 엘리먼트들을 같은 경로를 갖는 엘리먼트 그룹으로 분류한 후, 해당 그룹을 순서화된 고유 ID가 부여된 노드로 구성하고 엘리먼트 그룹간의 관계를 간선으로 연결한 경로 요약 트리이다. 본 논문에서는 TOP 트리 기반 방송 스트림 생성 방법과다중 경로 질의 처리 방법을 제안하고 실험을 통해 제안 방법의 우수성을 입증한다.

  • PDF

XML 문서의 다양한 구조 검색을 위한 효율적인 동적 색인 모델 (An Efficient Dynamic Indexing Model for Various Structure Retrievals of XML Documents)

  • 신승호;손충범;강형일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.48-60
    • /
    • 2004
  • 정보 표현의 기본 단위인 엘리먼트로 구성되는 XML 문서 내에서 동적으로 구조 변경이 이루어진다. 이때 XML 문서의 구조변경은 빠른 검색을 위해 기존의 색인 구조 정보의 변경 없이 효율적으로 처리되어야 한다. 이를 위해 본 논문에서는 XML 문서의 구조 변경 시 기존의 색인 구조에 효율적으로 수용될 수 있는 동적 색인 모델을 제안한다. 제안하는 동적 색인 모델은 다양한 구조 검색을 지원하기 위한 구조 정보 표현 방법과 효율적인 구조 검색을 지원하기 위한 동적 색인 구조로 구성된다. 제안하는 색인 기법이 기존의 동적 색인을 지원하는 기법보다 내용 색인, 구조 색인, 애트리뷰트 색인 측면에서 우수함을 성능 평가를 통해 보인다.

XML 문서의 유사 경로 검색을 위한 인덱싱 시스템 (An Indexing System for Retrieving Similar Paths in XML Documents)

  • 이범석;황병연
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.171-178
    • /
    • 2008
  • 1998년 W3C에 의해 XML 표준이 제정된 이래로, XML을 사용하는 문서가 급증하였다. 이에 따라 방대한 양의 XML 문서들을 효율적으로 관리하고 검색하기 위한 많은 시스템들이 개발되고 있다. 특히 비트맵 인덱스 기법을 사용한 BitCube는 이러한 분야의 대표적인 시스템이다. 비트맵 인덱스 기법을 이용하여 유사한 경로를 대상으로 클러스터링을 수행한 경로 비트맵 인덱스 시스템(LH06)은 기존의 BitCube 시스템이 유사경로 검색을 할 수 없는 문제점을 개선하였다. 유사경로 검색 시스템은 정확히 일치하는 경로뿐만 아니라, 사용자가 질의한 경로와 유사한 경로까지도 빠르게 검색해 낼 수 있다는 장점을 가진다. 그러나 경로 사이의 유사도를 계산하는 알고리즘이 가진 몇 가지 문제점들로 인해 유사하다고 볼 수 있는 두 경로의 유사도를 계산할 수 없어서 서로 다른 클러스터로 인식되고, 이는 의미 없는 클러스터의 수를 증가시키는 문제점을 야기한다. 이러한 문제점의 해결을 위해 본 논문에서는 보다 합리적이고 정확한 경로 유사도 계산 방법을 제안하고, 기존 시스템과의 성능평가를 통해 제안하는 방법이 더 낫다는 것을 증명한다.

2D-THI: XML 데이테베이스를 위한 이차원 타입상속 계층색인 (2D-THI: Two-Dimensional Type Hierarchy Index for XML Databases)

  • 이종학
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.265-278
    • /
    • 2006
  • 본 논문에서는 XML 데이터베이스의 타입상속 계층에 대한 색인기법으로 이차원 색인구조를 이용하는 이차원 타입상속 색인기법인 2D-THI를 제안한다. XML 스키마는 타입상속을 지원하는 XML 문서를 위한 스키마 모델 중에 하나이다. 기존의 XML 데이터베이스를 위한 색인기법은 XML 스키마상의 타입상속 계층에 대한 XML 질의를 지원하지 못한다. 따라서 본 논문에서는 XML 질의의 타입상속 계층을 지원하기 위한 색인기법으로 다차원 파일구조를 이용하는 이차원 색인구조를 구성한다. 이차원 색인구조에서 한 축은 색인된 엘리먼트의 킷값 도메인으로 구성하고 다른 한 축은 타입상속 계층의 타입 식별자 도메인으로 구성한다. 이와 같은 이차원 색인구조를 이용함으로써 사용자 질의 패턴에 따라 두 도메인 사이에서 객인 엔트리들의 클러스터링 정도를 조정함으로써 질의처리의 성능을 향상시킬 수 있다. 본 논문에서 제안한 2D-THI의 성능 평가를 위하여, 비용 모델을 개발하고 이를 통하여 2D-THI를 기존의 객체지향 데이터베이스에서 사용하고 있는 CH-index와 CG-tree와 같은 클래스 계층 색인기법들과 색인의 성능을 비교평가 한다. 성능평가의 결과로서, CH-index와 CG-tree에서는 특정 형태의 XML 질의의 경우에만 좋은 성능을 보인 반면, 본 논문에서 제안한 2D-THI에서는 주어진 질의 형태에 따라 최적의 질의처리 성능을 제공할 수 있음을 보인다.

  • PDF

B+-tree를 이용한 XML 색인기법 (Indexing of XML with B+-tree)

  • 권국봉;홍동권
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.94-100
    • /
    • 2006
  • 인터넷을 바탕으로 하는 컴퓨팅 패러다임의 변환은 인터넷에서 디지털 정보 교환의 표준으로 확고한 자리를 굳힌 XML의 사용을 가속화시키고 있다. 이로 인해 XML 데이터의 양이 기하급수적으로 증가하고 보다 효율적으로 XML 데이터를 저장하고 질의하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 대용량의 데이터 중심 XML를 효과적으로 관리하기 위한 방안으로 그래프 중심의 색인 방법을 연구, 제안한다. 논문에서 제안한 XML 색인은 XML 데이터와 XML 구조 정보를 크게 3개의 구성 성분으로 표현한 후, 메인 메모리 자료구조로 표현된 각 그래프들을 노드 아이디를 키로 사용하여 B+트리에 각 노드를 사상하고 B+트리를 디스크에 저장하여 이들 색인 모델에 대해 지속성을 부여하였다. 본 논문에서 제안한 색인 방법을 통해 XML 데이터의 크기에 따라 질의 처리시간이 선형적으로 증가하는 결과를 얻을 수 있었다.

XML 문서의 효율적인 구조 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure Retrieval of XML Documents)

  • 박종관;손충범;강형일;유재수;이병엽
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.451-460
    • /
    • 2001
  • 본 논문에서는 XML 문서의 효율적인 구조 검색을 위한 색인 모델을 제안한다. 색이 모델은 문선 계층상의 모든 레벨에서 내용 기반 질의와 구조 및 에트리뷰트 질의와 같은 다양한 질의를 지원하기 위한 구조정보와 이를 이용한 색이 구조로 구성된다. 구조검색을 지원하기 위해 새로운 구조정보 표현 방법을 제안한다. 제안한 구조정보 표현 방법에 따라 표현된 구조정보를 이용해 효율적인 검색을 위한 내용 색인, 구조 색인, 에트리뷰트 색인을 구성한다. 또한 내용과 구조가 혼합된 질의의 처리과정을 설명하고, 제안하는 색인 모델의 성능평가를 보임으로써 기존의 방법보다 성능이 우수함을 보인다.

  • PDF