EPR : 지리 정보 시스템을 위한 향상된 병렬 R-tree 색인 기법

EPR : Enhanced Parallel R-tree Indexing Method for Geographic Information System

  • 이춘근 (부산대학교 대학원 전자계산학과) ;
  • 김정원 (부산대학교 대학원 전자계산학과) ;
  • 김영주 (부산대학교 전자계산학과) ;
  • 정기동 (부산대학교 전자계산학과)
  • Lee, Chun-Geun (Dept.of Computer Science, Graduate School of Busan National University) ;
  • Kim, Jeong-Won (Dept.of Computer Science, Graduate School of Busan National University) ;
  • Kim, Yeong-Ju (Dept.of Computer Science, Busan National University) ;
  • Jeong, Gi-Dong (Dept.of Computer Science, Busan National University)
  • 발행 : 1999.09.01

초록

본 논문은 병렬 입출력과 효율적인 디스크 접근을 이용하여 입출력 성능을 높임으로써 지리 정보 시스템의 질의 처리 성능을 향상시키는 것을 목적으로 한다. 동시에 접근할 가능성이 높은 인접한 공간 데이터를 디스크의 논리적 블록 단위로 패킹하여 하나 또는 연속적인 논리적 블록으로 클러스터링 하면 한번의 디스크 접근으로 많은 공간 데이터를 읽을 수 있어 질의 처리에 따른 디스크 접근 횟수와 디스크 접근 오버 헤드를 줄임으로써 입출력 시간을 줄일 수 있다. 본 논문에서는 기존 Parallel R-tree 기법의 병렬 입출력 기법과 패킹 기반 클러스터링 기법을 결합하여 효율적인 입출력을 지원하는 EPR(Enhanced Parallel R-tree) 색인 기법을 제안한다. EPR 기법의 주요 특징은 다음과 같다. 첫째, 공간 데이터를 Hilbert space filling curve를 이용하여 인접도에 따라 정렬하여 패킹함으로써 상향식으로 R-tree를 생성한다. 둘째, 정렬된 공간 데이터를 패킹하여 하나 또는 연속적인 논리적 블록에 저장하는 패킹 기반 클러스터링을 통해 공간 데이터 클러스터를 구성한다. 셋째, 색인 기법 및 공간 데이터 클러스터를 round-robin 스트라이핑 방식을 통해 다중 디스크에 분산 배치한다. EPR 기법과 기존 PR 기법의 성능을 비교한 결과, 공간 질의 처리 속도가 30% 이상 향상되었으며, 특히 논리적 블록의 크기가 클수록, 공간 데이터의 크기가 작을수록 질의 처리 성능이 향상되는 결과를 보였다.

Our research purpose in this paper is to improve the performance of query processing in GIS(Geographic Information System) by enhancing the I/O performance exploiting parallel I/O and efficient disk access. By packing adjacent spatial data, which are very likely to be referenced concurrently, into one block or continuous disk blocks, the number of disk accesses and the disk access overhead for query processing can be decreased, and this eventually leads to the I/O time decrease. So, in this paper, we proposes EPR(Enhanced Parallel R-tree) indexing method which integrates the parallel I/O method of the previous Parallel R-tree method and a packing-based clustering method. The major characteristics of EPR method are as follows. First, EPR method arranges spatial data in the increasing order of proximity by using Hilbert space filling curve, and builds a packed R-tree by bottom-up manner. Second, with packing-based clustering in which arranged spatial data are clustered into continuous disk blocks, EPR method generates spatial data clusters. Third, EPR method distributes EPR index nodes and spatial data clusters on multiple disks through round-robin striping. Experimental results show that EPR method achieves up to 30% or more gains over PR method in query processing speed. In particular, the larger the size of disk blocks is and the smaller the size of spatial data objects is, the better the performance of query processing by EPR method is.

키워드