• 제목/요약/키워드: k-최근접 질의

검색결과 73건 처리시간 0.027초

m-유형 공간객체를 위한 $R^m$-tree기반의 mk-최근접질의 처리기법 (mkNN Query Processing Method based on $R^m$-tree for Spatial Objects with m-types)

  • 장동주;안수연;정성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.45-48
    • /
    • 2011
  • 본 논문에서는 다양한 타입의 위치기반 데이터들을 하나의 R-tree로 통합합 $R^m$-tree의 구조와 이 $R^m$-tree를 이용하여 질의 포인트로부터 각 타입에서 k개의 가까운 위치기반 데이터를 찾는 mkNN(multi-type k nearest neighbor) 질의 처리기법을 제안하였다. 특히, 다양한 타입의 위치기반 데이터들을 각 타입별로 독립된 R-tree로 유지하지 않고, 하나의 $R^m$-tree로 통합하여 관리함으로써 mkNN 질의 처리시 같은 레벨의 공간의 반복탐색을 줄일 수 있도록 고안하였다. 그리고 각 타입 t에 대한 위치데이터를 관리하는 부가적인 타입정보 자료구조로서 위치정보를 담은 TMBR, 데이터 개수정보를 담은 $I_t$-entry를 새로이 고안하여 mkNN질의 처리시 효율적인 휠터링(filtering)과 검색과정이 이루어지도록 하였다.

SAN 환경에 적합한 고차원 색인 구조 설계 (Design of High-dimensional Index Structures for SAN Environment)

  • 박춘서;신재룡;송석일;복경수;유재수;신범주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.86-88
    • /
    • 2000
  • SAN(Storage Area Network)이 최근 대용량 데이터를 효율적으로 관리하기 위한 차세대 저장 장치로 각광받고 있다. 이 SAN에는 이미지, 동영상, 지도, 캐드 데이터와 같은 대용량의 고차원 특징을 갖는 데이터들이 저장되어 관리 될 것이다. 따라서 SAN 환경에서 이들을 보다 빠르고 정확하게 검색할 수 있는 효율적인 고차원 색인구조가 필요하다. SAN 환경은 저장 장치를 공유하는 형태의 병렬 환경이라 볼 수 있다. 이 논문에서는 SAN의 병렬성을 충분히 이용해서 고차원 데이터를 색인할 수 있는 방법을 제안한다. 제안하는 고차원 색인 구조는 하나의 노드를 여러 디스크에 분산시켜 팬-아웃을 증가시키고 트리의 높이를 줄임으로서 검색성능을 향상시킨다. 또한 범위 질의와 K-최근접 질의 수행시 병렬성을 최대화하는 방법을 제안한다.

  • PDF

수평 분할 방법을 이용한 병렬 CBF 기법의 성능평가 (Performance Analysis of a Parallel CBF Scheme using Horizontally-Partitioned Method)

  • 박승봉;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.184-186
    • /
    • 2002
  • 기존의 색인 기법들은 차원의 수가 증가할수록 검색 성능이 급격히 저하되는 문제를 지니고 있다. 이문제를 극복하기 위하여 CBF 기법이 제안되었다. 그러나 CBF 기법은 데이터 양이 증가함에 따라 검색 성능이 선형적으로 감소하는 문제가 존재한다. 이를 해결하기 위해 다수의 디스크를 수평 분할 방법을 이용하여 디클러스터링(declustering)을 하는 병렬 CBF 기법이 제안되었다. 본 논문에서는 수평 분할 방법을 이용한 병렬 CBF (Parallel CBF) 기법을 삽입시간, 범위 질의 검색시간, k-최근접 질의 검색시간, 데이터의 편중도 측면에서 성능 평가를 수행한다. 아울러, 병렬 CBF 기법을 기존 CBF 기법과 성능 비교를 수행하며, 이를 통해 병렬 CBF 기법이 기존 CBF 기법보다 우수한 검색 성능을 나타냄을 보인다.

  • PDF

클러스터 시스템 환경 하에서의 병렬 CBF 기법의 구현 및 성능 평가 (Implementation and Performance Analysis of a Parallel CBF Scheme under Cluster System Environment)

  • 박승봉;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.250-252
    • /
    • 2002
  • 기존의 색인 기법들은 차원의 수가 증가할수록 검색 성능이 급격히 저하되는 문제를 지니고 있으며. 이를 극복하기 위하여 CBF 기법이 제안되었다. 그러나 CBF 기법은 데이터 양이 증가함에 따라 검색성능이 선형적으로 감소하는 문제가 존재한다. 이를 해결하기 위해 다수의 디스크를 수령 분할 방법을 이용하여 디클러스터링(declustering)을 하는 병렬 CBF 기법이 제안되었다. 본 논문에서는 병렬 CBF기법을 여러 대의 리눅스 컴퓨터를 이용한 클러스터 시스템 환경 하에서 구현하고, 삽입시간, 범위 질의 검색시간, k-최근접 질의 검색시간 측면에서 성능 평가를 수행한다. 아울러, 클러스터 시스템 환경 하에서의 병렬 CBF 기법을 기존 CBF 기법과 성능 비교를 수행하며, 이를 통해 병렬 CBF 기법이 기존 CBF 기법보다 우수한 검색 성능을 나타냄을 보인다.

  • PDF

병렬 Shifted Sort 알고리즘의 Warp 단위 CUDA 구현 최적화 (Optimization of Warp-wide CUDA Implementation for Parallel Shifted Sort Algorithm)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.739-745
    • /
    • 2017
  • 본 논문에서는 GPU 병렬 처리 하드웨어 아키텍처 내 최소 물리적 스레드 실행 단위(warp) 내에서 shifted sort 기반 k개 최근접 이웃 검색 기법을 구현하는 방법을 논의하고 일반적으로 동일한 목적으로 널리 사용되는 GPU 기반 kd-tree 및 CPU 기반 ANN 라이브러리와 비교한 결과를 제시한다. 또한 많은 애플리케이션에서 k가 비교적 작은 값이 필요한 경우가 많다는 사실을 고려해서 k가 warp 내부에서 직접 처리 가능한 2, 4, 8, 16개일 때 최적화에 집중한다. 구현 세부에서는 사용한 CUB 공개 라이브러리의 루프 내 메모리 관리 방법, GPU 하드웨어 직접 명령 적용 방법 등의 최적화 방법을 논의한다. 실험 결과, 제안하는 방법은 기존의 GPU 기반 유사 방법에 비해 데이터 지점과 질의 지점의 개수가 각각 $2^{23}$개 일 때 16배 이상의 빠른 처리 속도를 보였으며 이러한 경향은 처리해야 할 데이터의 크기가 커지면 더욱 더 커지는 것으로 판단된다.

도로 망 데이터베이스를 위한 보로노이 기반의 탐색 방안 (Voronoi-Based Search Scheme for Road Network Databases)

  • 김대훈;황인준
    • 전기전자학회논문지
    • /
    • 제11권4호
    • /
    • pp.348-357
    • /
    • 2007
  • 개인용 이동형 단말기의 개선된 성능과 비용, 그리고 무선 통신 기술의 비약적인 발전으로 인하여, 이를 이용하는 사용자들의 수가 빠른 속도로 늘고 있다. 그에 따라 사용자들에게 다양한 서비스를 제공할 수 있는 기술이 요구하고 있는 시점이다. 현재까지의 연구를 통해 사용자가 필요로 하는 최단 경로 찾기 등의 기술은 많은 연구가 이루어져 있다. 하지만 사용자의 현재 위치에 따라 여러 가지 추천 서비스를 제공할 수 있게 하는 기술은 우리가 필요로 하는 도로 망에서가 아닌 Euclidean spaces에 집중되어 있다. 따라서 우리는 기존의 연구를 확장시켜, 도로 망에서 이러한 요구를 충족시킬 수 있는 방법을 제안한다. 우리가 제안하는 시스템은 질의에 대한 응답을 하기 위해 전처리 단계를 필요로 한다. 이 단계에서는 먼저 전체 도로 망을 몇 개의 Voronoi 다각형으로 나누고, 나누어진 각각의 Voronoi 다각형들에 대한 정보를 계산한다. 이러한 과정에서 도로 망의 규모에 맞춰 자동으로 Voronoi 다각형의 개수를 결정하게 한다. 이를 통해 전체 도로 망의 크기가 변경되더라도, 전처리 단계 정보를 저장하는 공간이 예측 가능하도록 선형적으로 증가되게 하였다. 실제 질의 응답과정에서는 미리 계산된 정보를 이용하여 사용자들에게 빠른 속도의 서비스를 제공 할 수 있게 한다. 실험을 통하여 제안된 시스템이 도로 망에서 최근접 질의와 영역 질의를 효과적으로 처리 하여 탐색 시간과 방문 노드 수에서 많은 이점이 있음을 보인다.

  • PDF

공간 네트워크상의 이동객체를 위한 궤적기반 색인구조의 설계 및 구현 (Design and Implementation of a Trajectory-based Index Structure for Moving Objects on a Spatial Network)

  • 엄정호;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권2호
    • /
    • pp.169-181
    • /
    • 2008
  • 대부분의 이동객체들은 공간 네트워크상을 움직이기 때문에, 그들의 궤적을 효과적으로 색인 검색할 수 있는 궤적 기반 색인 구조가 필요하다. 하지만 도로와 같은 공간 네트워크상의 궤적 기반 색인 구조에 대한 연구는 FNR-트리나 MON-트리와 같은 연구가 진행되었을 뿐 연구가 많이 진행되어 있지 않다. 하지만, FNR-트리나 MON-트리 또한 이동객체의 세그먼트만을 저장할 뿐 전체 궤적을 유지하지 못하여, 궤적 질의에 대해 비효율적이다. 따라서 본 논문에서는 공간 네트워크상의 이동객체를 위한 궤적기반 색인 구조인 TMN -Tree(Trajectory of Moving objects on Network-Tree)를 제안한다. 이를 위해, 이동객체를 공간과 시간 특성으로 분류하고, 궤적을 유지함으로써 영역질의와 궤적질의를 동시에 처리할 수 있는 색인 구조를 설계한다. 아울러, 사용자 질의를 시공간영역 내 궤적 질의, 시간영역 내 유사궤적 질의, k-최근접 질의로 분류하고, 이들을 처리하기 위한 질의 처리 알고리즘을 제안한다. 마지막으로 본 논문에서 제안한 궤적 기반 색인 구조가 기존의 색인구조인 FNR-Tree, MON-Tree보다 성능이 향상되었음을 보여준다.

내용 기반 이미지 검색을 위한 효율적인 분산 고차원 색인 기법 (An Efficient Distributed High-Dimensional Index Structure for Contents-Based Image Retrieval)

  • 김민수;김기훈;송희섭;한진수;유승훈;안지환;박주영;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.43-44
    • /
    • 2017
  • 다양한 디지털 기기 활용의 증가로 인해 멀티미디어 데이터가 증가됨에 따라 내용 기반으로 검색하는 기술이 연구되고 있다. 내용 기반 검색을 위해 멀티미디어에서 추출된 고차원 특징 벡터가 대용량이 되면서 고차원 데이터를 분산해서 관리하는 색인 기법이 필요하다. 본 논문에서는 대용량 멀티미디어 데이터에서 유사한 이미지를 검출하기 위한 분산 고차원 색인 기법을 제안한다. 제안하는 기법은 마스터/슬레이브 구조로 되어 있다. 마스터 서버의 색인 구조는 그리드 방식을 사용하여 검색 요청 시 탐색하는 노드를 감소시킨다. 슬레이브 서버의 색인 구조는 구 형태로 색인하여 범위 질의와 최근접 질의를 효율적으로 검색한다.

  • PDF

Efficient Processing of k-Farthest Neighbor Queries for Road Networks

  • Kim, Taelee;Cho, Hyung-Ju;Hong, Hee Ju;Nam, Hyogeun;Cho, Hyejun;Do, Gyung Yoon;Jeon, Pilkyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.79-89
    • /
    • 2019
  • 본 연구에서는 도로 네트워크에서 k-최원접 이웃 검색을 위한 효율적인 FANS(k-FArthest Neighbor Search) 알고리즘을 제안한다. 양의 정수 k, 질의 객체 q, 일련의 데이터 객체 집합 P가 주어지면, k-최원접 이웃 질의는 질의 객체 q에서 가장 멀리 있는 k개의 데이터 객체를 찾는다. 데이터베이스 분야에서 대부분의 연구는 k-최근접 이웃 질의에 중점을 두고 있어서, k-최원접 이웃 질의라는 중요한 근접 질의유형은 별다른 관심을 받지 못했다. 이 논문에서는 도로 네트워크에서 가장 멀리 있는 이웃을 찾는 문제를 다룬다. 도로 네트워크에서 k-최원접 이웃 질의를 처리하는 연구는 거의 없었다. 도로 네트워크에서 k-최원접 이웃 질의를 처리해야 하는 문제는 최단 경로 거리를 계산하는 횟수를 줄이는 것인데, 이는 도로 네트워크와 유클리드 공간의 질의 처리에서 가장 중요한 차이다. 질의 객체와 데이터 객체 사이의 최단 경로 거리에 대한 중복 계산을 줄이기 위하여 공유 계산 전략을 사용한다. 질의 객체에서 데이터 세그먼트까지 최대 거리를 기반으로 효과적으로 후보군을 제거하는 방법은 제시한다. 마지막으로 실제 도로 지도를 사용한 광범위한 실험을 통해 제시된 방법의 효율성과 확장성을 보여준다.

데이터 보강을 위한 데이터 통합기법에 관한 연구 (A Study on the Data Fusion for Data Enrichment)

  • 정성석;김순영;김현진
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.605-617
    • /
    • 2004
  • 데이터마이닝에서 가장 중요한 요소 중 하나는 마이닝에 사용될 데이터의 질이다. 질 높은 데이터를 바탕으로 마이닝이 수행될 때, 데이터마이닝의 잠재적 가치는 증대될 것이다. 본 논문에서는 지식발견 과정 중 데이터의 질을 향상시키기 위한 한 단계인 데이터 보강을 위해 데이터 통합 기법을 제안하고, 모의실험을 통해 제안된 알고리즘의 효율성을 비교하였다. 실험결과 제안된 알고리즘이 데이터 통합의 성능을 향상시킴을 알 수 있었다.