• 제목/요약/키워드: tree indexing

검색결과 211건 처리시간 0.026초

대용량 데이터의 내용 기반 검색을 위한 분산 고차원 색인 구조 (A Distributed High Dimensional Indexing Structure for Content-based Retrieval of Large Scale Data)

  • 최현화;이미영;김영창;장재우;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.228-237
    • /
    • 2010
  • 고차원 데이터에 대한 다양한 색인 구조가 제안되어 왔음에도 불구하고, 인터넷 서비스로서 이미지 및 동영상의 내용 기반 검색을 지원하기 위해서는 고확장성 지원 및 k-최근접점 검색 성능 향상을 지원하는 새로운 고차원 데이터의 색인 구조가 절실히 요구된다. 이에 우리는 다중 컴퓨팅 노드를 바탕으로 구축되는 분산 색인 구조로 분산 벡터 근사 트리(Distributed Vector Approximation-tree)를 제안한다. 분산 벡터 근사 트리는 대용량의 고차원 데이터로부터 추출한 샘플 데이터를 바탕으로 hybrid spill-tree를 구축하고, hybrid spill-tree외 말단 노드 각각에 분산 컴퓨팅 노드를 매핑하여 VA-file용 구축하는 두 레벨의 분산 색인 구조이다. 우리는 다중 컴퓨팅 노드들 상에 구축된 분산 벡터 근사 트리를 바탕으로 병렬 k-최근접점 검색을 수행함으로써 검씩 성능을 향상시킨다. 본 논문에서는 서로 다른 분포의 데이터 집합을 바탕으로 한 성능 시험 결과를 통하여, 분산 벡터 근사 트리가 기존의 고확장성을 지원하는 색인 구조와 비교하여 검색 정확도에 대한 손실 없이 더 빠른 k-최근접점 검색을 수행함을 보인다.

임베디드 시스템의 객체 관계형 DBMS에 적합한 공간 인덱스 방법 비교 연구 (Comparison research of the Spatial Indexing Methods for ORDBMS in Embedded Systems)

  • 이민우;박수홍
    • 한국지리정보학회지
    • /
    • 제8권1호
    • /
    • pp.63-74
    • /
    • 2005
  • 차량 및 교통 분야의 대표적인 임베디드 시스템인 텔레매틱스 단말기는 대용량의 공간 데이터를 실시간으로 처리하기 위해서 RTOS(Real Time Operating System) 기반의 공간 DBMS를 요구하고 있다. 이러한 공간 DBMS는 기존의 ORDBMS의 사용자 정의 타입과 사용자 정의 함수라는 표준적인 기능을 이용하여 쉽게 확장 개발할 수 있지만, 공간 인덱스의 경우 SQL3에서 표준적인 개발 방법을 제공하지 않기 때문에, 임베디드 시스템과 같은 환경에서 공간 인덱스를 개발하는 것은 어려운 실정이다. 본 연구에서는 현재 ORDBMS에서 사용자 정의 인덱스를 개발할 수 있는 방법으로 제안되고 있는 Generalized Search Tree 방법과 Relational Indexing 방법을 비교 분석하고 각 방법에 대해 R-트리의 구현 및 영역 질의에 대한 실험을 통해 임베디드 시스템 환경에 적합한 공간 인덱스 방법을 제안하였다.

  • PDF

Xp-tree:Xpath 로케이션 스텝의 효율화를 위한 새로운 공간기반의 인덱싱 기법 (Xp-tree:A new spatial-based indexing method to accelerate Xpath location steps)

  • Trang, Nguyen-Van;Hwang, Jeong-Hee;Ryu, Keun-Ho
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.10-12
    • /
    • 2004
  • Nowadays, with the rapid emergence of XML as a standard for data exchange over the Internet had led to considerable interest In the problem of data management requirements such as the need to store and query XML documents in which the location path languages Xpath is of particular important for XML application since it is a core component of many XML processing standards such as XSLT or XQuery, This parer gives a brief overview about method and design by applying a new spatial-based indexing method namely Xp-free that used for supporting Xpath. Spatial indexing technique has been proved its capacity on searching in large databases. Based on accelerating a node using planar as combined with the numbering schema, we devise efficiently derivative algorithms, which are simple, but useful. Besides that, it also allows to trace all Its relative nodes of context node In a manner supporting queries natural to the types especially Xpath queries with predicates.

  • PDF

지리 정보 데이타베이스에서 대용량의 공간 객체를 위한 저장 관리 시스템에 관한 연구 (A study on Storage Management for Large Spatial Objects in Geographic Database Systems)

  • 황병연;김병욱
    • Spatial Information Research
    • /
    • 제5권1호
    • /
    • pp.1-10
    • /
    • 1997
  • 본 연구에서는 GIS(GIS: geographic information systems)데이타베이스 시스템에서 주로 사용되는 공간 객체를 위한 색인 방법에 대해 과거의 연구를 토대로 해서 7개의 클래스로 분류를 해보고 이로부터 새로이 제안하는 색인 방법인 MAX(Multi-Attribute indexing scheme)에 대해서 상세히 기술한다. 또한 MAX의 여러 연산을 위한 알고리즘을 제시하고, 알고리즘의 우수성을 제시한다. 이미 성능 평가를 통해 어느 정도의 성능을 기대할 수 있으며, 이를 실제 시스템에 구현한다면 상당한 성능을 가진 지리 정보 시스템을 구축할 수 있을 것이다. 특히 MAX는 이 기법이 가지는 B 트리의 확장성으로 쉽게 구현할 수 있는 구조를 가지게 된다.

  • PDF

데이터베이스의 개념구조에 기반한 XML 문서의 색인 및 질의 스키마의 설계 및 구현 (Design and Implementation of XML Indexing and Query Scheme Based on Database Concept Structure)

  • 추교남;우요섭
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.317-324
    • /
    • 2006
  • 본 논문에서는 다양한 질의 처리를 위하여 데이터베이스 색인 스키마의 특징인 반구조적 정보를 구조 정보화할 수 있는 방법과 보다 빠르고 최적화된 질의처리 방법을 제안하고자 한다. XML 트리에 추가된 번호 정보를 비트열로 변형하여 트리의 구조 변경없이 트리 노드간의 구조 정보를 나타낸다. 그리고 이 과정에서 생성되는 기타 구조 정보들을 검색하여 색인 스키마에 추가한다. 또한, 질의 스키마에서는 색인 스키마를 이용하여 절대 경로 질의 표현식 뿐만 아니라 상대 경로 질의 표현식의 경우에도 주어진 노드 정보를 통하여 상위의 노드를 복원한다. 이러한 점은 하나의 질의를 통하여 파생 질의 표현식을 작성할 수 있다는 장점이 있다. 그리고 질의 처리 과정에서는 색인 스키마와 질의 스키마를 이용하여 비트열 사이의 비트 연산을 함으로써 응답시간을 최소화하고 색인 파일의 노드별 레코드의 정보만으로 정확한 결과를 검색할 수 있다.

메인 메모리에서 선반입을 사용한 확장된 R-Tree 색인 기법 (An Extended R-Tree Indexing Method using Prefetching in Main Memory)

  • 강홍구;김동오;홍동숙;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.19-29
    • /
    • 2004
  • 최근 메인 메모리 기반에서 R-Tree의 성능을 개선하기 위해 캐시를 고려한 색인 구조들이 제안되었다. 이들 색인 구조의 일반적인 캐시 성능 개선 방법은 엔트리 크기를 줄여 펜-아웃(fanout)을 증가시키고 하나의 노드에 더 많은 엔트리를 저장함으로써 캐시 실패를 최소화하는 것이다. 그러나 이러한 방법은 갱신시 줄어든 엔트리 정보를 복원하는 추가 연산으로 갱신 성능이 떨어지고, 노드간 이동시 발생하는 캐시 실패는 여전히 성능 저하의 큰 문제가 되고 있다. 본 논문은 이러한 문제점을 개선하기 위해 메인 메모리에서 R-Tree에 선반입을 적용한 확장된 메인 메모리 기반 R-Tree 색인 기법인 PR-Tree를 제안하고 평가하였다. PR-Tree는 R-Tree의 근본적인 변형없이 노드 크기를 선반입에 최적화되도록 확장하고, 노드간 이동시 자식 노드를 선반입하여 캐시 실패를 최소화하였다. PR-Tree는 실험에서 R-Tree보다 검색 연산에서는 최대 38%의 성능 향상을 보였고, 갱신 연산에서는 최대 30%의 성능 향상을 보였고, 또한 노드 분할 연산에서는 최대 67%의 성능 향상을 보였다.

  • PDF

이동체 데이터베이스를 위한 색인 구조의 비용모델 (Cost Model of Index Structures for Moving Objects Databases)

  • 전봉기
    • 한국정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.523-531
    • /
    • 2007
  • 본 논문에서는 이동체들을 관리하기에 적합한 새로운 색인 기법을 개발하고, 이 기법의 비용 모델을 제안한다. 또한 삽입/삭제 비용이 적은 동적 해싱 색인을 제안한다. 동적 해싱 색인 구조는 해쉬와 트리를 결합한 동적 해싱 기술을 공간 색인에 적용한 것이다. 본 논문에서는 이동체의 빈번한 위치 변경에 대한 비용 모델과 동적 색인 구조를 분석하였고, 성능 평가 실험을 통하여 검증하였다. 실험 결과에서 새로이 제안하는 색인 기법(동적 해싱 색인)은 R-tree와 고정 그리드 보다 성능이 우수하였다.

지도 일반화를 지원하는 계층화된 공간 색인 기법 (Leveled Spatial Indexing Technique supporting Map Generalization)

  • 이기정;황보택근;양영규
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권2호
    • /
    • pp.15-22
    • /
    • 2004
  • 핸드폰의 화면 크기 때문에 핸드폰에서의 지도 서비스는 문제점을 가지고 있다. 핸드폰과 같은 작은 화면에서 효율적으로 지도 데이터를 표현하기 위해서는 첫째, 지도 일반화를 이용하여 상세한 지도 데이터를 간략하게 만드는 과정이 필요하며, 둘째, 간략화된 데이터를 계층화하여 사용자의 확대 축소 명령을 빠르게 수행할 수 있어야 한다. 그러나, 기존의 연구들은 일부의 지도 일반화만 지원하거나 실시간으로 처리하지 못하는 문제점들을 가지고 있다. 본 논문에서 제안하는 LMG-tree는 계층화된 하나의 색인 트리를 사용함으로 저장 공간의 효율성을 가지고 있으며, 지도 일반화를 지원하여 실시간 지도 서비스가 가능하도록 하였다.

  • PDF

Speaker Tracking Using Eigendecomposition and an Index Tree of Reference Models

  • Moattar, Mohammad Hossein;Homayounpour, Mohammad Mehdi
    • ETRI Journal
    • /
    • 제33권5호
    • /
    • pp.741-751
    • /
    • 2011
  • This paper focuses on online speaker tracking for telephone conversations and broadcast news. Since the online applicability imposes some limitations on the tracking strategy, such as data insufficiency, a reliable approach should be applied to compensate for this shortage. In this framework, a set of reference speaker models are used as side information to facilitate online tracking. To improve the indexing accuracy, adaptation approaches in eigenvoice decomposition space are proposed in this paper. We believe that the eigenvoice adaptation techniques would help to embed the speaker space in the models and hence enrich the generality of the selected speaker models. Also, an index structure of the reference models is proposed to speed up the search in the model space. The proposed framework is evaluated on 2002 Rich Transcription Broadcast News and Conversational Telephone Speech corpus as well as a synthetic dataset. The indexing errors of the proposed framework on telephone conversations, broadcast news, and synthetic dataset are 8.77%, 9.36%, and 12.4%, respectively. Using the index tree structure approach, the run time of the proposed framework is improved by 22%.

Feature-Based Image Retrieval using SOM-Based R*-Tree

  • Shin, Min-Hwa;Kwon, Chang-Hee;Bae, Sang-Hyun
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.223-230
    • /
    • 2003
  • Feature-based similarity retrieval has become an important research issue in multimedia database systems. The features of multimedia data are useful for discriminating between multimedia objects (e 'g', documents, images, video, music score, etc.). For example, images are represented by their color histograms, texture vectors, and shape descriptors, and are usually high-dimensional data. The performance of conventional multidimensional data structures(e'g', R- Tree family, K-D-B tree, grid file, TV-tree) tends to deteriorate as the number of dimensions of feature vectors increases. The R*-tree is the most successful variant of the R-tree. In this paper, we propose a SOM-based R*-tree as a new indexing method for high-dimensional feature vectors.The SOM-based R*-tree combines SOM and R*-tree to achieve search performance more scalable to high dimensionalities. Self-Organizing Maps (SOMs) provide mapping from high-dimensional feature vectors onto a two dimensional space. The mapping preserves the topology of the feature vectors. The map is called a topological of the feature map, and preserves the mutual relationship (similarity) in the feature spaces of input data, clustering mutually similar feature vectors in neighboring nodes. Each node of the topological feature map holds a codebook vector. A best-matching-image-list. (BMIL) holds similar images that are closest to each codebook vector. In a topological feature map, there are empty nodes in which no image is classified. When we build an R*-tree, we use codebook vectors of topological feature map which eliminates the empty nodes that cause unnecessary disk access and degrade retrieval performance. We experimentally compare the retrieval time cost of a SOM-based R*-tree with that of an SOM and an R*-tree using color feature vectors extracted from 40, 000 images. The result show that the SOM-based R*-tree outperforms both the SOM and R*-tree due to the reduction of the number of nodes required to build R*-tree and retrieval time cost.

  • PDF