• 제목/요약/키워드: indexing structures

검색결과 80건 처리시간 0.022초

XML 문서의 분할 인덱스 기법 (Indexing Methods of Splitting XML Documents)

  • 김종명;진민
    • 한국멀티미디어학회논문지
    • /
    • 제6권3호
    • /
    • pp.397-408
    • /
    • 2003
  • 기존의 Numbering 스킴을 이용한 XML 데이터의 인덱스 정의 방법은 개체가 삽입, 삭제, 갱신될 경우 인덱스가 재정의되어야 하는 문제점이 있다. 이러한 문제를 해결하기 위해서 본 논문은 블록단위의 인덱스기법을 제안한다. 블록과 블록사이는 많아야 하나의 관계가 유지 되도록 XML 데이터를 블록단위로 나누고, 각 블록에 대해 Numbering 스킴을 적용하여 인덱스를 정의한다. 이렇게 정의된 인덱스는 XML 데이터의 삽입, 삭제, 갱신의 경우 인덱스 재정의에 따른 오버헤드를 상당히 줄일 수 있다. 또한 XML 질의를 지원하기 위해 정의된 인덱스를 이용하여 두 개체사이의 관계를 검색하는 Parent-Child Block Merge Algorithm과 Ancestor-Descendent Block Merge Algorithm을 제안한다. 그리고 Ancestor-Descendent관계를 빠르게 검색하기 위하여 블록식별자가 부모의 정보를 유지하는 방법을 소개하고 이를 이용한 Parent-Child Block Merge Algorithm과 Ancestor-Descendent Block Merge Algorithm을 제안한다.

  • PDF

XML 뷰 인덱싱 (XML Vicw Indexing)

  • 김영성;강현철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.252-272
    • /
    • 2003
  • 뷰는 이질적인 데이타의 통합 및 여과(filtering) 기능을 통해서 데이타베이스의 필요한 부분을 제공한다. 많은 정보가 쏟아지고 있는 웹 환경의 데이타 교환 표준인 XML에 대해서도 뷰의 개념은 유용하다. 본 논문은 XML 뷰 인덱싱이라고 명명한 XML 뷰를 구현하는 기법을 제안한다. XML 뷰는 XML 뷰에 대한 정보와 더불어 뷰를 구성하는 하부 XML 엘리먼트에 대한 식별자를 저장하는 구조인 XML 뷰 인덱스로 표현된다. XML 뷰 인덱스가 XML 엘리먼트 자체가 아닌 식별자만을 저장하므로, 사용자가 XML 뷰를 요청하면 하부 XML 문서를 기반으로 XML 뷰를 실체화해야 한다. 또한, 하부 XML 문서에 대한 변경에 대하여 XML 뷰 인덱스의 일관성을 유지하기 위한 효율적인 점진적 갱신 기법이 필요하다. 본 논문에서는 XML 뷰 인덱싱을 위한 자료구조와 알고리즘을 제안하고 구현하였다. 성능 평가 결과 XML 뷰 인덱싱을 사용하는 것이 매번 뷰를 재생성하는 경우보다 질의 재수행 시간이 적게 걸렸다. XML 뷰 인덱싱 기법이 실체화 시간으로 인해 XML 실체뷰 기법보다 질의 재수행 시간은 많이 걸리지만, 저장 공간 면에서는 약 30배 정도 효율적인 것으로 나타났다.

시공간 데이타베이스에서 영역 합 질의를 위한 색인 기법 (An Indexing Technique for Range Sum Queries in Spatio - Temporal Databases)

  • 조형주;최용진;민준기;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.129-141
    • /
    • 2005
  • 시공간 데이타베이스는 최근에 많은 주목을 받았지만, 영역 합 질의에 대한 연구는 그 중요성에 비하여 많이 부족하다. 영역 합 질의를 처리하기 위하여, 많은 양의 데이타에 대한 직접적인 접근은 엄청난 계산 비용을 야기하기 때문에, 최근에 기존 색인 기법을 활용한 materialization 방법이 제안되었다. 간단하면서 효과적인 방법은 시공간 조건을 가지는 윈도우 질의를 효율적인 처리하는 MVR-tree에 materialization 방법을 적용하는 것이다. 그러나, MVR-tree는 노드들 사이의 존재하는 원형 경로 때문에, 중간 노드에 미리 계산된 합을 유지하는 것이 불가능하다. 다른 색인 구조들에 기초한 집합적 구조(aggregate structures)는 만족스러운 질의 성능을 제공하지 못 한다. 본 논문에서는 적응적 분할 기법을 사용하는 새로운 색인 기법(Adaptive Partitioned Aggregate R-Tree, APART)과 다양한 환경에서 영역합 질의를 효율적으로 처리하는 질의 처리 알고리즘을 제안한다. 실험 결과는 APART의 성능이 다양한 상황에서 기존의 집합적 색인 기법들보다 2배 이상 우월하다는 것을 보여준다.

대용량 데이터의 내용 기반 검색을 위한 분산 고차원 색인 구조 (A Distributed High Dimensional Indexing Structure for Content-based Retrieval of Large Scale Data)

  • 최현화;이미영;김영창;장재우;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.228-237
    • /
    • 2010
  • 고차원 데이터에 대한 다양한 색인 구조가 제안되어 왔음에도 불구하고, 인터넷 서비스로서 이미지 및 동영상의 내용 기반 검색을 지원하기 위해서는 고확장성 지원 및 k-최근접점 검색 성능 향상을 지원하는 새로운 고차원 데이터의 색인 구조가 절실히 요구된다. 이에 우리는 다중 컴퓨팅 노드를 바탕으로 구축되는 분산 색인 구조로 분산 벡터 근사 트리(Distributed Vector Approximation-tree)를 제안한다. 분산 벡터 근사 트리는 대용량의 고차원 데이터로부터 추출한 샘플 데이터를 바탕으로 hybrid spill-tree를 구축하고, hybrid spill-tree외 말단 노드 각각에 분산 컴퓨팅 노드를 매핑하여 VA-file용 구축하는 두 레벨의 분산 색인 구조이다. 우리는 다중 컴퓨팅 노드들 상에 구축된 분산 벡터 근사 트리를 바탕으로 병렬 k-최근접점 검색을 수행함으로써 검씩 성능을 향상시킨다. 본 논문에서는 서로 다른 분포의 데이터 집합을 바탕으로 한 성능 시험 결과를 통하여, 분산 벡터 근사 트리가 기존의 고확장성을 지원하는 색인 구조와 비교하여 검색 정확도에 대한 손실 없이 더 빠른 k-최근접점 검색을 수행함을 보인다.

B+-트리 기반의 이동객체 색인 기법 ([ B+ ]-Tree based Indexing Method for Moving Object)

  • 서동민;유재수;송석일
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.11-23
    • /
    • 2007
  • 이동객체 응용은 빈번하게 변경되는 이동객체의 위치정보를 효과적으로 처리할 수 있는 색인구조를 필요로 한다. 이동객체의 위치를 색인하기 위해 제안된 색인기법들은 대부분 R-트리를 기반으로 하고 있다. R-트리는 변경보다는 검색 연산의 성능에 초점이 맞추어진 색인구조이어서 잦은 변경을 다뤄야 하는 이동객체의 응용에 적합하지 않은 측면이 있다. 일부 연구에서는 R-트리의 변경 연산 성능을 향상시키기 위한 연구를 진행한 바 있다. 하지만, 변경 연산의 성능이 개선되었다 하더라도 R-트리가 기본적으로 내재하고 있는 동시성 제어기법 문제(동시성 제어 기법의 비효율성과 안정성) 때문에 R-트리 기반의 색인기법을 실제 응용에서 쓰는 데는 여전히 문제가 있다. 이 논문에서는 B+-트리와 힐버트 곡선 (Hilbert Curve)를 기반으로 하는 새로운 이동객체 색인 기법을 제안한다. 기존에 제안된 B+-트리 기반의 색인기법과는 다르게 이 논문에서는 힐버트 커브의 해상도(또는 차수, order)를 객체의 분포도와 개수에 따라서 가변적으로 적용하는 방법을 제안한다. 실험을 통해서 제안하는 색인 기법이 응답시간과 처리율 측면에서 기존 색인기법에 비해 우수함을 보인다.

이동체 데이터베이스를 위한 색인 구조의 비용모델 (Cost Model of Index Structures for Moving Objects Databases)

  • 전봉기
    • 한국정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.523-531
    • /
    • 2007
  • 본 논문에서는 이동체들을 관리하기에 적합한 새로운 색인 기법을 개발하고, 이 기법의 비용 모델을 제안한다. 또한 삽입/삭제 비용이 적은 동적 해싱 색인을 제안한다. 동적 해싱 색인 구조는 해쉬와 트리를 결합한 동적 해싱 기술을 공간 색인에 적용한 것이다. 본 논문에서는 이동체의 빈번한 위치 변경에 대한 비용 모델과 동적 색인 구조를 분석하였고, 성능 평가 실험을 통하여 검증하였다. 실험 결과에서 새로이 제안하는 색인 기법(동적 해싱 색인)은 R-tree와 고정 그리드 보다 성능이 우수하였다.

중국의 혁명역사기록물의 목록기술과 검색분류(2) (Bibliographical Description and Classification Indexing For Revolutionary Historical Archives in China(2))

  • 이승휘
    • 기록학연구
    • /
    • 제5호
    • /
    • pp.209-242
    • /
    • 2002
  • Bibliographical Description for Revolutionary Historical Archives is created to describe records at the item level. It defines descriptive elements, punctuations, formats and methods. Descriptive elements are composed of 20 elements, each of which is either mandatory or optional. Mandatory elements are: repositories codes, documents codes, dates, creators, title, classification codes, and subject vocabularies. Abstracts were previously included in card cataloging and are removed in the computerized system. New elements, such as "uncontrolled vocabularies," "name of places," "personal names," "organizational structures" and "meetings," are added to allow keyword search. Considering that subject vocabulary searches are the most important in computerized systems, however, Guidelines for the Subject Indexing for Revolutionary Historical Archives as well as Subject Headings, as a result from the Guidelines, are created. The most extraordinary features in Chinese archival description are said to be the Guidelines for the Classification Indexing for Revolutionary Historical Archives and Materials as well as the Classification Scheme, both of which are created to allow subject search of records content. It is because Chinese practice of records management distinguishes the classification for arrangement from that for retrieval. Chinese archival description is, therefore, composed of bibliographic description rules, subject headings, and the classification scheme for retrieval.

트리기반 색인구조의 분할 방법을 이용한 센서네트워크의 에너지 효율적인 클러스터 생성 방법 (Energy Efficient Clustering Scheme in Sensor Networks using Splitting Algorithm of Tree-based Indexing Structures)

  • 김현덕;유보선;최원익
    • 한국멀티미디어학회논문지
    • /
    • 제13권10호
    • /
    • pp.1534-1546
    • /
    • 2010
  • 센서 네트워크에서는 에너지 소비를 줄이기 위해 다양한 계층적 클러스터링 방법이 제안되었다. 그러나 대부분의 연구에서 나타나는 문제점은 노드의 실제 배치를 생각하지 않고 일방적인 그리드 형태의 구조 또는 무작위 적인 클러스터 구조를 구성하는 것이다. 이렇게 구성된 클러스터는 클러스터의 크기와 포함된 노드의 수가 불균형하기 때문에 큰 에너지 효율을 보이기 힘들다. 그래서 본 논문에서는 실제 노드들이 배치가 된 후 R-Tree의 노드 분할 및 병합 알고리즘에 착안하여 보다 더 효율적인 클러스터를 구성할 수 있는 방법인 CSM(Clustering using Split & Merge algorithm)을 제안한다. 다양한 실험결과 CSM은 기존 방법보다 에너지 효율적인 클러스터링을 생성함으로써 최대 1.6배의 에너지 효율을 보였다.

XML 링크정보를 이용한 정보 검색 색인 기법의 설계 (Design of an Information Retrieval Indexing Method using XML Links)

  • 김은정;배종민
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2020-2027
    • /
    • 2000
  • The hypertext document is used for information exchange in the Web environments. Its structure is considered as having graph structures with links, which makes nonlinear processing of documents possible. This paper proposes an indexing method for information retrieval system using XML links. We define new attributes that control links of a remote document and assign an unique identifier for the attribute of each link. Each identifier has a different weight according to its occurrence position that is local or remote documents. We index a word not only from a local document but a remote document based on the given weight. Experimental results show that the proposed method outperforms conventional retrieval systems that ignore links.

  • PDF

Design and Implementation of a Main Memory Index Structure in a DBMS

  • Bae, Duck-Ho;Kim, Jong-Dae;Park, Se-Mi;Kim, Sang-Wook
    • International Journal of Contents
    • /
    • 제3권3호
    • /
    • pp.1-5
    • /
    • 2007
  • The main memory DBMS (MMDBMS) efficiently supports various database applications that require high performance since it employs main memory rather than disk as a primary storage. An index manager is an essential sub-component of a DBMS used to speed up the retrieval of objects from a large volume of a database in response to a certain search condition. Previous research efforts on indexing proposed various index structures. However, they hardly dealt with the practical issues occurred in implementing an index manager on a target DBMS. In this paper, we touch these issues and present our experiences in developing the index manager. The main issues are (1) compact representation of an index entry, (2) support of variable-length keys. (3) support of multiple-attribute keys, and (4) support of duplicated keys.