• Title/Summary/Keyword: 고차원 색인구조

Search Result 31, Processing Time 0.026 seconds

An Efficient Concurrency Control Algorithm for High-Dimensional Index Structures (고차원 색인구조를 위한 효율적인 동시성 제어 알고리즘)

  • 최길성;이석희;송석일;유재수;조기형
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.54-56
    • /
    • 1998
  • 동시에 다수의 사용자가 빠른 속도로 이미지 검색이 가능하도록 지원해주는 고차원 색인구조에 대한 효율적인 동시성 제어 방법은 매우 중요하지만 이에 대한 연구는 부족한 실정이다. 기존에 제안된 방법인 RLINK-트리는 링크를 적용시켜 다른 기법들에 비해 향상된 효율을 갖고 있지만 고차원 색인구조에 적용할 경우에는 문제가 발생한다. RLINK-트리에서는 고차원 색인구조의 효율적인 구성을 위한 재삽입 연산에 대한 동시성 제어를 고려하지 않고 있으며, 트리의 일관성을 유지하기 위해서 동시성 효율이 낮은 잠금 결합 방법을 사용하기 때문에 고차원 색인구조의 동시성 제어 기법에 그대로 적용하기에는 한계가 있다. 따라서, 본 논문에서는 고차원 색인구조의 효율적인 트리구성을 위해 수행되는 재삽입의 동시성 문제를 해결하면서 동시성 수준을 향상시킨 새로운 동시성 제어 알로리즘을 제안하고, 제안된 알로리즘을 고차원 색인구조에 적용시켜 동시성 제어가 효율적으로 제공될 수 있음을 증명한다.

High Dimensional Index Information Management for Data Availability (데이터의 가용성을 보장하는 고차원 색인 정보 관리)

  • Choi, Hyun-Hwa;Lee, Mi-Young;Lee, Kyu-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.874-877
    • /
    • 2010
  • 웹 서비스 혹은 클라우드 컴퓨팅 서비스로써 대용량의 멀티미디어 데이터에 대한 내용 기반 검색을 지원하기 위하여, 분산 고차원 색인 구조에 대한 연구가 활발하게 이뤄지고 있다. 이러한 고차원 데이터의 색인 구조에 대한 연구와 달리, 고차원 색인 데이터의 저장 및 관리에 대한 연구는 거의 전무한 것이 현실이다. 지금껏 대부분의 색인 데이터는 빠른 접근을 위하여 트랜잭션 관리 및 데이터의 복구를 제공하지 않은 파일 시스템에서 관리되어 왔다. 그러나, 파일 시스템에 저장된 색인 데이터는 이를 서비스하는 노드의 장애 발생 시에 일부 혹은 전체 데이터에 대한 검색이 이뤄지지 않는 문제점이 있다. 서비스의 가용성 여부가 중요한 요소인 웹 서비스와 클라우드 컴퓨팅 서비스를 위하여, 본 논문에서는 고차원 색인 데이터를 데이터베이스를 통해 관리하여, 안정성 및 가용성을 보장하면서, 고차원 데이터의 색인 및 검색의 성능을 보장하는 방법을 제안하고자 한다.

Design and Implementation of a Concurrency Control Algorithm for High-Dimensional Index Structures (고차원 색인 구조를 위한 동시성 제어 기법의 설계 및 구현)

  • Song, Seok-Il;Park, Chun-Seo;Lee, Seok-Hui;Yu, Jae-Su
    • Journal of KIISE:Databases
    • /
    • v.27 no.4
    • /
    • pp.682-694
    • /
    • 2000
  • 이 논문에서는 고차원 색인 구조를 위한 동시성 제어 기법을 설계하고 이를 구현한다. 일반적으로 고차원 색인구조에서는 삽입보다 탐색연산이 빈번하고 탐색연산의 수행은 질의의 특성상 매우 많은 노드를 접근하다. 제안하는 동시성 제어 알고리즘에서는 이런 특성을 고려하여 탐색 연산의 지연이 최소가 되도록 한다. 또한 인덱스의 성능향상을 위해 재삽입 연산을 이용하는 고차원색인 구조를 고려하여 재삽입 연산 수행중에도 정확한 탐색을 보장할 수 있는 방법을 지원한다. 제안하는 동시성 제어 알고리즘을 CIR-Tree에 적용하여 실제 상용 DBMS의 하부 저장 시스템인 MiDAS-III에서 구현한다. 실험을 통하여 제안된 동시성 제어기법이 기종 동시성 제어 기법보다 성능이 우수함을 보인다.

  • PDF

Design and Implementation of High-dimernsional Index Structure supporting Concurrency Control (필터링에 기반한 고차원 색인구조의 동시성 제어 기법의 설계 및 구현)

  • 이용주;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.33-35
    • /
    • 2000
  • 최근 멀티미디어 객체를 위한 효율적인 색인 기술에 대한 많은 연구가 활발히 진행되고 있으나 이러한 색인 구조들은 단일 사용자만을 지원하는데 그치고 있는 실정이며 상용 DBMS에 통합되어 실제 응용되는 사례는 드물다. 이에 본 논문에서는 필터링에 기반한 고차원 색인구조를 위한 효율적인 동시성 제어 기법을 제안하고, 지속성 객체 시스템인 SHORE 하부 저장 구조에 통합한다. 제안하는 동시성 제어 기법은 쓰레드의 개수를 증가시켜 삽입과 검색 측면에서 실험한 결과 약 30%의 응답시간 감소를 보였다.

  • PDF

Design of High-dimensional Index Structures for SAN Environment (SAN 환경에 적합한 고차원 색인 구조 설계)

  • 박춘서;신재룡;송석일;복경수;유재수;신범주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.86-88
    • /
    • 2000
  • SAN(Storage Area Network)이 최근 대용량 데이터를 효율적으로 관리하기 위한 차세대 저장 장치로 각광받고 있다. 이 SAN에는 이미지, 동영상, 지도, 캐드 데이터와 같은 대용량의 고차원 특징을 갖는 데이터들이 저장되어 관리 될 것이다. 따라서 SAN 환경에서 이들을 보다 빠르고 정확하게 검색할 수 있는 효율적인 고차원 색인구조가 필요하다. SAN 환경은 저장 장치를 공유하는 형태의 병렬 환경이라 볼 수 있다. 이 논문에서는 SAN의 병렬성을 충분히 이용해서 고차원 데이터를 색인할 수 있는 방법을 제안한다. 제안하는 고차원 색인 구조는 하나의 노드를 여러 디스크에 분산시켜 팬-아웃을 증가시키고 트리의 높이를 줄임으로서 검색성능을 향상시킨다. 또한 범위 질의와 K-최근접 질의 수행시 병렬성을 최대화하는 방법을 제안한다.

  • PDF

CIR-Tree : An Efficient High-Dimentsional Index Structure (CIR-Tree : 효율적인 고차원 색인기법)

  • Lee, Seok-Hui;Yu, Jae-Su;Jo, Gi-Hyeong;Heo, Dae-Yeong
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.6
    • /
    • pp.724-734
    • /
    • 1999
  • 내용기반 이미지검색을 위한 기존의 색인구조들은 데이터 객체들을 대표하는 특성들이 증가함에 따라 검색시간 또는 공간요구량이 지수 함수적으로 증가하게 되는 문제점이 있다. 본 논문은 내용기반 이미지검색을 위한 기존의 색인구조들을 분석하여 새로운 색인구조가 갖추어야할 요구조건을 제시한 후, 제시된 요구조건들을 만족하는 새로운 색인구조 CIR-트리를 제안한다. 제안된 방법의 우수성을 보이기 위해 실험을 통하여 색인구조들에 관한 성능을 여러 환경에서 비교하고 분석한다. 이를 통해 제안된 CIR-트리가 기존의 색인구조들에 비해 고차원에 적합하면서 검색시간과 저장공간면에서 성능이 우수함을 보인다.

A Distributed High Dimensional Indexing Structure for Content-based Retrieval of Large Scale Data (대용량 데이터의 내용 기반 검색을 위한 분산 고차원 색인 구조)

  • Cho, Hyun-Hwa;Lee, Mi-Young;Kim, Young-Chang;Chang, Jae-Woo;Lee, Kyu-Chul
    • Journal of KIISE:Databases
    • /
    • v.37 no.5
    • /
    • pp.228-237
    • /
    • 2010
  • Although conventional index structures provide various nearest-neighbor search algorithms for high-dimensional data, there are additional requirements to increase search performances as well as to support index scalability for large scale data. To support these requirements, we propose a distributed high-dimensional indexing structure based on cluster systems, called a Distributed Vector Approximation-tree (DVA-tree), which is a two-level structure consisting of a hybrid spill-tree and VA-files. We also describe the algorithms used for constructing the DVA-tree over multiple machines and performing distributed k-nearest neighbors (NN) searches. To evaluate the performance of the DVA-tree, we conduct an experimental study using both real and synthetic datasets. The results show that our proposed method contributes to significant performance advantages over existing index structures on difference kinds of datasets.

Design of an Efficient Bulk Loading Algorithm for CIR-Tree on MiDAS-III (MiDAS-III에서 CIR-Tree를 위한 효율적인 벌크로딩 알고리즘의 설계)

  • Pee, Jun-Il;Song, Seok-Il;Yoo, Jae-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.65-68
    • /
    • 2001
  • 이 논문에서는 고차원 색인 구조인 CIR-트리를 위한 효율적인 벌크로딩 알고리즘을 설계하고 구현한다. 벌크로딩 기법은 대량의 고차원 데이터가 색인 구성 시 함께 주어진는 경우 색인의 구성을 빠르게 하고 구축한 색인의 검색 성능을 향상시킨다. CIR-트리는 변별력 있는 일부 차원만 이용해서 비 단말노드의 엔트리를 구성하기 때문에 엔트리 크기가 일정하지 않다는 특징이 있으며 이는 비단말 노드의 팬아웃을 높이고 탐색 성능을 향상시키는 효과가 있다. 기존에 다차원 및 고차원 색인구조를 위한 벌크로딩 기법이 제안되었지만 이러한 CIR-트리의 특징을 제대로 살릴 수 있는 방법은 없다. 따라서 이 논문에서는 기존의 벌크로딩 알고리즘을 개선하면서 CIR-트리의 특징을 효과적으로 색인 구성에 반영할 수 있는 알고리즘을 제안한다. 또한 이를 BADA-III의 하부 저장 시스템인 MiDAS-III에서 구현하고 다양한 실험을 통해 그 성능을 입증한다.

  • PDF

An Efficient Distributed High-Dimensional Index Structure for Contents-Based Image Retrieval (내용 기반 이미지 검색을 위한 효율적인 분산 고차원 색인 기법)

  • Kim, Minsoo;Kim, Gihoon;Song, Heesub;Han, Jinsu;Yoo, Seunghun;Ahn, Jihwan;Park, Juyoung;Bok, Kyoungsoo;Yoo, Jaesoo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2017.05a
    • /
    • pp.43-44
    • /
    • 2017
  • 다양한 디지털 기기 활용의 증가로 인해 멀티미디어 데이터가 증가됨에 따라 내용 기반으로 검색하는 기술이 연구되고 있다. 내용 기반 검색을 위해 멀티미디어에서 추출된 고차원 특징 벡터가 대용량이 되면서 고차원 데이터를 분산해서 관리하는 색인 기법이 필요하다. 본 논문에서는 대용량 멀티미디어 데이터에서 유사한 이미지를 검출하기 위한 분산 고차원 색인 기법을 제안한다. 제안하는 기법은 마스터/슬레이브 구조로 되어 있다. 마스터 서버의 색인 구조는 그리드 방식을 사용하여 검색 요청 시 탐색하는 노드를 감소시킨다. 슬레이브 서버의 색인 구조는 구 형태로 색인하여 범위 질의와 최근접 질의를 효율적으로 검색한다.

  • PDF

GC-Tree: A Hierarchical Index Structure for Image Databases (GC-트리 : 이미지 데이타베이스를 위한 계층 색인 구조)

  • 차광호
    • Journal of KIISE:Databases
    • /
    • v.31 no.1
    • /
    • pp.13-22
    • /
    • 2004
  • With the proliferation of multimedia data, there is an increasing need to support the indexing and retrieval of high-dimensional image data. Although there have been many efforts, the performance of existing multidimensional indexing methods is not satisfactory in high dimensions. Thus the dimensionality reduction and the approximate solution methods were tried to deal with the so-called dimensionality curse. But these methods are inevitably accompanied by the loss of precision of query results. Therefore, recently, the vector approximation-based methods such as the VA- file and the LPC-file were developed to preserve the precision of query results. However, the performance of the vector approximation-based methods depend largely on the size of the approximation file and they lose the advantages of the multidimensional indexing methods that prune much search space. In this paper, we propose a new index structure called the GC-tree for efficient similarity search in image databases. The GC-tree is based on a special subspace partitioning strategy which is optimized for clustered high-dimensional images. It adaptively partitions the data space based on a density function and dynamically constructs an index structure. The resultant index structure adapts well to the strongly clustered distribution of high-dimensional images.