• 제목/요약/키워드: kNN query

검색결과 63건 처리시간 0.025초

밀도 기반의 k-최근접 질의 처리 (A Density-based k-Nearest Neighbors Query Method)

  • 장인성;한은영;조대수
    • 한국지리정보학회지
    • /
    • 제6권4호
    • /
    • pp.59-70
    • /
    • 2003
  • 공간 데이터베이스 관리시스템에서 제공하는 공간 질의는 많은 디스크 참조와 CPU 처리시간을 필요로 한다. 이 중에서 k-최근접 질의는 많은 디스크 참조를 요구하는 질의로써 지금까지 많은 연구가 이루어져 왔다. 트리 구조의 색인을 사용하는 k-최근접 질의 처리방법은 조건을 만족하지 않는 노드를 가지치기 기법을 사용하여 노드 방문횟수를 줄인다. 그러나 이 방법은 가지치기 과정에서 불필요한 디스크 참고가 발생하여 성능을 저하시키는 단점을 가지고 있다. 본 논문에서는 가지치기 기법 대신 주어진 k개의 최근접 객체가 존재할 영역을 미리 예측함으로써 디스크 참조횟수를 줄이는 방법을 제시한다. 이 영역을 예측하기 위해서 본 연구에서는 데이터 분포에 대한 밀도를 이용하였다. 실험에 의하면 이러한 방법은 기존의 가지치기 기법을 이용한 방법에 비해서 최고 22%,평균 7% 정도의 디스크 참조횟수의 감소 효과가 있음을 알 수 있다.

  • PDF

도로 네트워크 환경에서 암호화된 공간데이터를 위한 K-최근접점 질의 처리 알고리즘 (A K-Nearest Neighbour Query Processing Algorithm for Encrypted Spatial Data in Road Network)

  • 장미영;장재우
    • Spatial Information Research
    • /
    • 제20권3호
    • /
    • pp.67-81
    • /
    • 2012
  • 최근 클라우드 컴퓨팅의 발전에 따라, 데이터베이스 아웃소싱(Outsourcing)에 대한 연구가 활발히 진행되고 있다. 또한 무선 통신 기술 및 모바일 기기의 발전으로 인해 위치 기반 서비스를 이용하는 사용자의 수가 증가하였다. 따라서 개인 또는 소규모의 사업자는 데이터 저장 및 관리 비용을 줄이기 위해 그들의 공간 데이터를 위치 기반 서비스 제공자에게 아웃소싱 한다. 그러나 사용자의 위치 정보는 시간대별 방문 장소 및 개인 정보를 지니고 있기 때문에, 이에 대한 허용되지 않은 접근 시 개인 정보 유출 문제가 발생한다. 따라서 위치 정보 아웃소싱을 위한 개인 정보 보호 연구가 필요하다. 이러한 문제를 해결하기 위해, 본 논문에서는 아웃소싱 환경에서 도로네트워크를 고려한 암호화된 공간 데이터베이스 기반 k-최근접점 질의 처리 알고리즘을 제안하였다. 제안하는 기법은 데이터베이스 아웃소싱을 위해 위치 데이터를 네트워크 거리 정보로 변환 및 암호화한 가공데이터를 생성하여 이를 서비스 제공자에게 전송한다. 또한, 전처리 과정을 통해 네트워크 노드와 POI 거리를 미리 저장하여 네트워크 탐색을 빠르게 수행하며, 질의 수행 시 최근접 대표 POI 및 암호화된 거리 정보를 이용하여 질의 결과 후보 집합을 탐색한다. 마지막으로, 질의 영역 재설정 과정을 통해 불필요한 후보 탐색을 줄임으로써 효율적으로 POI를 탐색한다. 마지막으로, 성능평가를 통해 제안하는 기법이 기존 방법에 비해 우수함을 보인다.

단일방송채널환경에서 k-최근접질의 처리를 위한 힐버트 곡선과 최소영역 사각형 기반의 분산 공간 인덱싱 기법 (A Distributed Spatial Indexing Technique based on Hilbert Curve and MBR for k-NN Query Processing in a Single Broadcast Channel Environment)

  • 이정형;정성원
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권4호
    • /
    • pp.203-208
    • /
    • 2010
  • 본 논문은 단일무선방송채널환경에서 힐버트곡선과 최소영역사각형을 이용하여 공간데이터를 방송하고 이를 가지고 k-최근접질의 처리를 효과적으로 처리하는 기법에 관한 논문이다. 기존 방식은 k-최근접질의 처리시 백트랙킹문제가 발생하여 질의처리에 오랜 시간이 걸리거나 검색범위를 빠르게 줄이지 못하여 많은 정보를 수신해야 하는 단점이 존재하였다. 제안하는 방법은 공간데이터를 힐버트 곡선 순서대로 방송하되 방송중인 공간데이터를 제외한 나머지 공간데이터를 최소영역사각형으로 그룹화하고 이를 인덱스 테이블로 구성하는 방법이다. 그리고 이를 이용하여 클라이언트가 알려지지 않은 데이터의 위치를 예측하여 빠르게 검색범위를 줄여나가 불필요한 정보를 제거하여 적은 튜닝시간과 접근지연시간을 갖도록 하는 것이다.

분산 그리드 기법을 위한 연속 k-최근접 질의처리 알고리즘 (Countinuous k-Nearest Neighbor Query Processing Algorithm for Distributed Grid Scheme)

  • 김영창;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.9-18
    • /
    • 2009
  • 최근 GPS 및 무선 이동 컴퓨팅 기술의 발달로 인해, 텔레매틱스(telematics) 및 위치기반 서비스(LBS) 응용이 활발하게 연구되고 있다. 이러한 위치 기반 서비스 응용에서는 이동객체의 위치 정보가 시간의 흐름에 따라 계속적으로 변하기 때문에, 이를 위한 빈번한 업데이트 연산은 시스템에 많은 부하를 가중시키며 이로 인해 검색 성능의 저하를 초래한다. 이를 해결하기 위해 공간 네트워크에서 대용량 이동객체의 위치정보를 분산 처리하기 위한 DS-GRID(distributed S-GRID) 및 이를 위한 k-최근접 질의처리 알 고리즘이 제안되었다[1]. 그러나 k-최근접 질의처리 기법은 질의점 및 이동객체의 위치가 변경되면 그 결과 가 유효하지 않기 때문에, 연속 k-최근접(CKNN:continuous k-nearest neighbor) 질의처리 알고리즘의 연구가 필요하다. 본 연구에서는 DS-GRID를 위한 MCE-CKNN 알고리즘 및 MBP-CKNN 알고리즘을 제안한다. MCE-CKNN 알고리즘은 주어진 경로를 셀 단위로 분할하여 각 셀에서 질의 처리를 병렬적으로 수행하여 검색 성능을 향상시킨다. 아울러 MBP-CKNN 알고리즘은 그리드 셀의 각 경계점에서 가까운 POI를 미리 저장하여 인접셀 탐색 횟수를 줄임으로써 검색 성능을 향상시킨다. 마지막으로, 제안하는 알고리즘의 성능 분석을 통해, 기존 알고리즘보다 15-53% 검색 성능이 우수함을 나타내었다.

  • PDF

아웃소싱 데이터베이스에서 집계 질의를 위한 효율적인 인증 기법 (Efficient Authentication of Aggregation Queries for Outsourced Databases)

  • 신종민;심규석
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.703-709
    • /
    • 2017
  • 아웃소싱 데이터베이스란 데이터 관리 및 질의 처리 등의 계산량이 많은 작업을 제 3자 서버에 위탁하는 것이다. 이를 통해 데이터 소유자는 비싼 인프라를 구축하지 않고 빅데이터를 관리할 수 있으며 여러 사용자로부터 받는 질의들을 빠르게 처리할 수 있다. 하지만 보안 위협이 항상 존재하는 네트워크의 특성상 제 3자 서버를 완전히 신뢰하기 어렵고, 그 서버가 처리한 결과도 신뢰하기 어렵다. 이처럼 신뢰할 수 없는 서버가 처리한 질의 결과가 정확한지 확인하는 것을 질의 인증이라고 하며 구간 질의, kNN 질의, 함수 질의 등 다양한 질의에 대한 인증 기법들이 연구되었다. 하지만 빅데이터 분석에 있어 활용도가 높은 집계 질의에 대한 깊이 있는 질의 인증 연구는 이루어지지 않았으며 기존 연구는 고차원이거나 서로 다른 값이 많은 데이터에 대해 비효율적이다. 본 연구에서는 집계 질의 인증을 위한 자료구조를 제안하고 이를 활용한 효율적인 증거 생성 방법과 증명 방법을 제안한다. 그리고 데이터의 상이 값 수, 레코드 개수, 차원 크기 등을 변경하며 진행한 실험 결과를 통해 제안한 기법의 성능이 우수함을 보였다.

무순위 연속 k 최근접 객체 탐색을 위한 효율적인 분할점 추출기법 (A Efficient Method of Extracting Split Points for Continuous k Nearest Neighbor Search Without Order)

  • 김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.927-930
    • /
    • 2010
  • 최근 이동 중인 경로 상에 존재하는 모든 지점에 대해 k개의 최근접 객체를 탐색하는 연속 k 최근접 객체 탐색 질의가 위치기반 서비스와 지능형 교통 시스템의 응용 분야에 폭넓게 사용되고 있다. 이러한 질의는 위와 같은 응용에 빠른 응답을 요구하고, 공간 네트워크 데이터베이스에 적용가능 해야 한다. 이 논문에서는 공간네트워크 상에서 움직이는 질의 객체를 위한 최근접 객체를 효율적으로 탐색하는 새로운 기법을 제안하고자 한다. 제안하는 기법은 다수의 분할점과 그에 상응하는 k개의 최근접 객체 집합들을 결과로 추출하며, POI들 간에는 순서가 없다. 분석을 통해 제안한 기법에 기존기법에 비해 우수함을 보인다.

  • PDF

m-유형 공간객체를 위한 $R^m$-tree기반의 mk-최근접질의 처리기법 (mkNN Query Processing Method based on $R^m$-tree for Spatial Objects with m-types)

  • 장동주;안수연;정성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.45-48
    • /
    • 2011
  • 본 논문에서는 다양한 타입의 위치기반 데이터들을 하나의 R-tree로 통합합 $R^m$-tree의 구조와 이 $R^m$-tree를 이용하여 질의 포인트로부터 각 타입에서 k개의 가까운 위치기반 데이터를 찾는 mkNN(multi-type k nearest neighbor) 질의 처리기법을 제안하였다. 특히, 다양한 타입의 위치기반 데이터들을 각 타입별로 독립된 R-tree로 유지하지 않고, 하나의 $R^m$-tree로 통합하여 관리함으로써 mkNN 질의 처리시 같은 레벨의 공간의 반복탐색을 줄일 수 있도록 고안하였다. 그리고 각 타입 t에 대한 위치데이터를 관리하는 부가적인 타입정보 자료구조로서 위치정보를 담은 TMBR, 데이터 개수정보를 담은 $I_t$-entry를 새로이 고안하여 mkNN질의 처리시 효율적인 휠터링(filtering)과 검색과정이 이루어지도록 하였다.

맵리듀스를 이용한 효율적인 k-NN 조인 질의처리 알고리즘 (Efficient k-Nearest Neighbor Join Query Processing Algorithm using MapReduce)

  • 윤들녁;장미영;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.767-770
    • /
    • 2014
  • 대용량 데이터를 분석하기 위한 맵리듀스 기반 k-NN 조인 질의처리 알고리즘은 최근 데이터 마이닝 및 분석을 기반으로 하는 응용 분야에서 매우 중요하게 활용되고 있다. 그러나, 대표적인 연구인 보로노이 기반 k-NN 조인 질의처리 알고리즘은 보로노이 인덱스 구축 비용이 매우 크기 때문에 대용량 데이터에 적합하지 못하다. 아울러 보로노이 셀 정보를 저장하기 위해 사용하는 R-트리는 맵리듀스 환경의 분산 병렬 처리에 적합하지 않다. 따라서 본 논문에서는 새로운 그리드 인덱스 기반의 k-NN 조인 질의 처리 알고리즘을 제안한다. 첫째, 높은 인덱스 구축 비용 문제를 해결하기 위해, 데이터 분포를 고려한 동적 그리드 인덱스 생성 기법을 제안한다. 둘째, 맵리듀스 환경에서 효율적으로 k-NN 조인 질의를 수행하기 위해, 인접셀 정보를 시그니처로 활용하는 후보영역 탐색 및 필터링 알고리즘을 제안한다. 마지막으로 성능 평가를 통해 제안하는 기법이 질의 처리 시간 측면에서 기존 기법에 비해 최대 3배 높은 질의 처리 성능을 나타냄을 보인다.

대용량 이동객체의 위치정보 관리를 위한 S-GRID를 이용한 분산 그리드 기법 (Distributed Grid Scheme using S-GRID for Location Information Management of a Large Number of Moving Objects)

  • 김영창;김영진;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권4호
    • /
    • pp.11-19
    • /
    • 2008
  • 최근 모바일 기기 및 무선 통신의 발달로 인하여 다양한 위치 기반 서비스에 대한 연구가 증대되고 있으며, 이러한 위치 기반 서비스의 대표적 질의인 k-최근접 질의를 효율적으로 처리하기 위한 연구가 활발히 수행되어 왔다. 기존 연구들은 질의 처리 성능의 향상을 위해, 공간 네트워크 상의 POI와 노드 사이의 거리를 미리 계산하는 pre-computation 기법을 사용한다. 그러나 이러한 pre-computation 기법들은 검색 대상이 되는 POI의 변경을 효과적으로 처리하지 못하는 단점을 갖는다. 본 논문에서는 기존 pre-computation 기법들의 단점을 극복하고, 대용량 이동객체의 위치정보를 효율적으로 관리하기 위하여 S-GRID를 이용한 분산 그리드 기법을 제안한다. 아울러 제안하는 분산 그리드 기법을 위한 k-최근접 질의 처리 알고리즘을 제시한다. 마지막으로, S-GRID 및 분산 그리드 기법의 k-최근접 질의처리 알고리즘의 성능 평가를 통해, 제안하는 기법의 우수성을 입증한다.

  • PDF

도로망에서 움직이는 k-최원접 이웃 질의를 위한 일괄 처리 알고리즘 (Batch Processing Algorithm for Moving k-Farthest Neighbor Queries in Road Networks)

  • 조형주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.223-224
    • /
    • 2021
  • Recently, k-farthest neighbor (kFN) queries have not as much attention as k-nearest neighbor (kNN) queries. Therefore, this study considers moving k-farthest neighbor (MkFN) queries for spatial network databases. Given a positive integer k, a moving query point q, and a set of data points P, MkFN queries can constantly retrieve k data points that are farthest from the query point q. The challenge with processing MkFN queries in spatial networks is to avoid unnecessary or superfluous distance calculations between the query and associated data points. This study proposes a batch processing algorithm, called MOFA, to enable efficient processing of MkFN queries in spatial networks. MOFA aims to avoid dispensable distance computations based on the clustering of both query and data points. Moreover, a time complexity analysis is presented to clarify the effect of the clustering method on the query processing time. Extensive experiments using real-world roadmaps demonstrated the efficiency and scalability of the MOFA when compared with a conventional solution.

  • PDF