• 제목/요약/키워드: 고차원 색인구조

검색결과 31건 처리시간 0.029초

고차원 색인구조를 위한 효율적인 동시성 제어 알고리즘 (An Efficient Concurrency Control Algorithm for High-Dimensional Index Structures)

  • 최길성;이석희;송석일;유재수;조기형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.54-56
    • /
    • 1998
  • 동시에 다수의 사용자가 빠른 속도로 이미지 검색이 가능하도록 지원해주는 고차원 색인구조에 대한 효율적인 동시성 제어 방법은 매우 중요하지만 이에 대한 연구는 부족한 실정이다. 기존에 제안된 방법인 RLINK-트리는 링크를 적용시켜 다른 기법들에 비해 향상된 효율을 갖고 있지만 고차원 색인구조에 적용할 경우에는 문제가 발생한다. RLINK-트리에서는 고차원 색인구조의 효율적인 구성을 위한 재삽입 연산에 대한 동시성 제어를 고려하지 않고 있으며, 트리의 일관성을 유지하기 위해서 동시성 효율이 낮은 잠금 결합 방법을 사용하기 때문에 고차원 색인구조의 동시성 제어 기법에 그대로 적용하기에는 한계가 있다. 따라서, 본 논문에서는 고차원 색인구조의 효율적인 트리구성을 위해 수행되는 재삽입의 동시성 문제를 해결하면서 동시성 수준을 향상시킨 새로운 동시성 제어 알로리즘을 제안하고, 제안된 알로리즘을 고차원 색인구조에 적용시켜 동시성 제어가 효율적으로 제공될 수 있음을 증명한다.

데이터의 가용성을 보장하는 고차원 색인 정보 관리 (High Dimensional Index Information Management for Data Availability)

  • 최현화;이미영;이규철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.874-877
    • /
    • 2010
  • 웹 서비스 혹은 클라우드 컴퓨팅 서비스로써 대용량의 멀티미디어 데이터에 대한 내용 기반 검색을 지원하기 위하여, 분산 고차원 색인 구조에 대한 연구가 활발하게 이뤄지고 있다. 이러한 고차원 데이터의 색인 구조에 대한 연구와 달리, 고차원 색인 데이터의 저장 및 관리에 대한 연구는 거의 전무한 것이 현실이다. 지금껏 대부분의 색인 데이터는 빠른 접근을 위하여 트랜잭션 관리 및 데이터의 복구를 제공하지 않은 파일 시스템에서 관리되어 왔다. 그러나, 파일 시스템에 저장된 색인 데이터는 이를 서비스하는 노드의 장애 발생 시에 일부 혹은 전체 데이터에 대한 검색이 이뤄지지 않는 문제점이 있다. 서비스의 가용성 여부가 중요한 요소인 웹 서비스와 클라우드 컴퓨팅 서비스를 위하여, 본 논문에서는 고차원 색인 데이터를 데이터베이스를 통해 관리하여, 안정성 및 가용성을 보장하면서, 고차원 데이터의 색인 및 검색의 성능을 보장하는 방법을 제안하고자 한다.

고차원 색인 구조를 위한 동시성 제어 기법의 설계 및 구현 (Design and Implementation of a Concurrency Control Algorithm for High-Dimensional Index Structures)

  • 송석일;박춘서;이석희;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.682-694
    • /
    • 2000
  • 이 논문에서는 고차원 색인 구조를 위한 동시성 제어 기법을 설계하고 이를 구현한다. 일반적으로 고차원 색인구조에서는 삽입보다 탐색연산이 빈번하고 탐색연산의 수행은 질의의 특성상 매우 많은 노드를 접근하다. 제안하는 동시성 제어 알고리즘에서는 이런 특성을 고려하여 탐색 연산의 지연이 최소가 되도록 한다. 또한 인덱스의 성능향상을 위해 재삽입 연산을 이용하는 고차원색인 구조를 고려하여 재삽입 연산 수행중에도 정확한 탐색을 보장할 수 있는 방법을 지원한다. 제안하는 동시성 제어 알고리즘을 CIR-Tree에 적용하여 실제 상용 DBMS의 하부 저장 시스템인 MiDAS-III에서 구현한다. 실험을 통하여 제안된 동시성 제어기법이 기종 동시성 제어 기법보다 성능이 우수함을 보인다.

  • PDF

필터링에 기반한 고차원 색인구조의 동시성 제어 기법의 설계 및 구현 (Design and Implementation of High-dimernsional Index Structure supporting Concurrency Control)

  • 이용주;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.33-35
    • /
    • 2000
  • 최근 멀티미디어 객체를 위한 효율적인 색인 기술에 대한 많은 연구가 활발히 진행되고 있으나 이러한 색인 구조들은 단일 사용자만을 지원하는데 그치고 있는 실정이며 상용 DBMS에 통합되어 실제 응용되는 사례는 드물다. 이에 본 논문에서는 필터링에 기반한 고차원 색인구조를 위한 효율적인 동시성 제어 기법을 제안하고, 지속성 객체 시스템인 SHORE 하부 저장 구조에 통합한다. 제안하는 동시성 제어 기법은 쓰레드의 개수를 증가시켜 삽입과 검색 측면에서 실험한 결과 약 30%의 응답시간 감소를 보였다.

  • PDF

SAN 환경에 적합한 고차원 색인 구조 설계 (Design of High-dimensional Index Structures for SAN Environment)

  • 박춘서;신재룡;송석일;복경수;유재수;신범주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.86-88
    • /
    • 2000
  • SAN(Storage Area Network)이 최근 대용량 데이터를 효율적으로 관리하기 위한 차세대 저장 장치로 각광받고 있다. 이 SAN에는 이미지, 동영상, 지도, 캐드 데이터와 같은 대용량의 고차원 특징을 갖는 데이터들이 저장되어 관리 될 것이다. 따라서 SAN 환경에서 이들을 보다 빠르고 정확하게 검색할 수 있는 효율적인 고차원 색인구조가 필요하다. SAN 환경은 저장 장치를 공유하는 형태의 병렬 환경이라 볼 수 있다. 이 논문에서는 SAN의 병렬성을 충분히 이용해서 고차원 데이터를 색인할 수 있는 방법을 제안한다. 제안하는 고차원 색인 구조는 하나의 노드를 여러 디스크에 분산시켜 팬-아웃을 증가시키고 트리의 높이를 줄임으로서 검색성능을 향상시킨다. 또한 범위 질의와 K-최근접 질의 수행시 병렬성을 최대화하는 방법을 제안한다.

  • PDF

CIR-Tree : 효율적인 고차원 색인기법 (CIR-Tree : An Efficient High-Dimentsional Index Structure)

  • 이석희;유재수;조기형;허대영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권6호
    • /
    • pp.724-734
    • /
    • 1999
  • 내용기반 이미지검색을 위한 기존의 색인구조들은 데이터 객체들을 대표하는 특성들이 증가함에 따라 검색시간 또는 공간요구량이 지수 함수적으로 증가하게 되는 문제점이 있다. 본 논문은 내용기반 이미지검색을 위한 기존의 색인구조들을 분석하여 새로운 색인구조가 갖추어야할 요구조건을 제시한 후, 제시된 요구조건들을 만족하는 새로운 색인구조 CIR-트리를 제안한다. 제안된 방법의 우수성을 보이기 위해 실험을 통하여 색인구조들에 관한 성능을 여러 환경에서 비교하고 분석한다. 이를 통해 제안된 CIR-트리가 기존의 색인구조들에 비해 고차원에 적합하면서 검색시간과 저장공간면에서 성능이 우수함을 보인다.

대용량 데이터의 내용 기반 검색을 위한 분산 고차원 색인 구조 (A Distributed High Dimensional Indexing Structure for Content-based Retrieval of Large Scale Data)

  • 최현화;이미영;김영창;장재우;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권5호
    • /
    • pp.228-237
    • /
    • 2010
  • 고차원 데이터에 대한 다양한 색인 구조가 제안되어 왔음에도 불구하고, 인터넷 서비스로서 이미지 및 동영상의 내용 기반 검색을 지원하기 위해서는 고확장성 지원 및 k-최근접점 검색 성능 향상을 지원하는 새로운 고차원 데이터의 색인 구조가 절실히 요구된다. 이에 우리는 다중 컴퓨팅 노드를 바탕으로 구축되는 분산 색인 구조로 분산 벡터 근사 트리(Distributed Vector Approximation-tree)를 제안한다. 분산 벡터 근사 트리는 대용량의 고차원 데이터로부터 추출한 샘플 데이터를 바탕으로 hybrid spill-tree를 구축하고, hybrid spill-tree외 말단 노드 각각에 분산 컴퓨팅 노드를 매핑하여 VA-file용 구축하는 두 레벨의 분산 색인 구조이다. 우리는 다중 컴퓨팅 노드들 상에 구축된 분산 벡터 근사 트리를 바탕으로 병렬 k-최근접점 검색을 수행함으로써 검씩 성능을 향상시킨다. 본 논문에서는 서로 다른 분포의 데이터 집합을 바탕으로 한 성능 시험 결과를 통하여, 분산 벡터 근사 트리가 기존의 고확장성을 지원하는 색인 구조와 비교하여 검색 정확도에 대한 손실 없이 더 빠른 k-최근접점 검색을 수행함을 보인다.

MiDAS-III에서 CIR-Tree를 위한 효율적인 벌크로딩 알고리즘의 설계 (Design of an Efficient Bulk Loading Algorithm for CIR-Tree on MiDAS-III)

  • 피준일;송석일;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.65-68
    • /
    • 2001
  • 이 논문에서는 고차원 색인 구조인 CIR-트리를 위한 효율적인 벌크로딩 알고리즘을 설계하고 구현한다. 벌크로딩 기법은 대량의 고차원 데이터가 색인 구성 시 함께 주어진는 경우 색인의 구성을 빠르게 하고 구축한 색인의 검색 성능을 향상시킨다. CIR-트리는 변별력 있는 일부 차원만 이용해서 비 단말노드의 엔트리를 구성하기 때문에 엔트리 크기가 일정하지 않다는 특징이 있으며 이는 비단말 노드의 팬아웃을 높이고 탐색 성능을 향상시키는 효과가 있다. 기존에 다차원 및 고차원 색인구조를 위한 벌크로딩 기법이 제안되었지만 이러한 CIR-트리의 특징을 제대로 살릴 수 있는 방법은 없다. 따라서 이 논문에서는 기존의 벌크로딩 알고리즘을 개선하면서 CIR-트리의 특징을 효과적으로 색인 구성에 반영할 수 있는 알고리즘을 제안한다. 또한 이를 BADA-III의 하부 저장 시스템인 MiDAS-III에서 구현하고 다양한 실험을 통해 그 성능을 입증한다.

  • PDF

내용 기반 이미지 검색을 위한 효율적인 분산 고차원 색인 기법 (An Efficient Distributed High-Dimensional Index Structure for Contents-Based Image Retrieval)

  • 김민수;김기훈;송희섭;한진수;유승훈;안지환;박주영;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.43-44
    • /
    • 2017
  • 다양한 디지털 기기 활용의 증가로 인해 멀티미디어 데이터가 증가됨에 따라 내용 기반으로 검색하는 기술이 연구되고 있다. 내용 기반 검색을 위해 멀티미디어에서 추출된 고차원 특징 벡터가 대용량이 되면서 고차원 데이터를 분산해서 관리하는 색인 기법이 필요하다. 본 논문에서는 대용량 멀티미디어 데이터에서 유사한 이미지를 검출하기 위한 분산 고차원 색인 기법을 제안한다. 제안하는 기법은 마스터/슬레이브 구조로 되어 있다. 마스터 서버의 색인 구조는 그리드 방식을 사용하여 검색 요청 시 탐색하는 노드를 감소시킨다. 슬레이브 서버의 색인 구조는 구 형태로 색인하여 범위 질의와 최근접 질의를 효율적으로 검색한다.

  • PDF

GC-트리 : 이미지 데이타베이스를 위한 계층 색인 구조 (GC-Tree: A Hierarchical Index Structure for Image Databases)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.13-22
    • /
    • 2004
  • 멀티미디어 데이타의 사용이 증가함에 따라 고차원 이미지 데이타에 대한 효율적인 색인과 검색 기법이 크게 요구되고 있다. 그러나 많은 노력에도 불구하고 현재의 다차원 색인 기법들은 고차원 데이타 공간에서 만족할 만한 성능을 보여주지 못하고 있다. 이러한 소위 차원의 저주를 해결하기 위해 최근에 차원을 줄이거나 근사 해를 구하는 둥의 접근법이 시도되고 있지만 이러한 방법들은 근본적으로 정확도의 상실이라는 문제를 갖고 있다. 정확도의 보존을 위해 VA-file, LPC-file둥과 같이 벡터 근사에 기반 한 기법들이 최근에 개발되었다. 그러나 이 기법은 검색 성능이 색인 파일의 크기에 큰 영향을 받으며, 한번에 큰 검색 공간을 줄이는 계층 색인 구조의 장점을 상실한다. 본 논문에서는 이미지 데이터베이스에서 유사성 질의를 위한 새로운 계층 색인 구조인 GC-트리를 제안한다. GC-트리는 밀도 함수에 기초하여 데이타 공간을 적응적으로 분할하고, 색인 구조를 동적으로 생성한다. 이러한 특성을 갖는 GC-트리는 군집화 된 고차원 이미지 데이타 검색에 훌륭한 성능을 나타낸다.