Parallel Processing of Multiple Queries in a Declustered Spatial Database

디클러스터된 공간 데이터베이스에서 다중 질의의 병렬 처리

  • 서영덕 (부산대학교 컴퓨터공학과) ;
  • 박영민 (엔텔시스템 연구원) ;
  • 전봉기 (부산대학교 컴퓨터공학과) ;
  • 홍봉희 (부산대학교 컴퓨터공학과)
  • Published : 2002.02.01


Multiple spatial queries are defined as two or more spatial range queries to be executed at the same time. The primary processing of internet-based map services is to simultaneously execute multiple spatial queries. To improve the throughput of multiple queries, the time of disk I/O in processing spatial queries significantly should be reduced. The declustering scheme of a spatial dataset of the MIMD architecture cannot decrease the disk I/O time because of random seeks for processing multiple queries. This thesis presents query scheduling strategies to ease the problem of inter-query random seeks. Query scheduling is achieved by dynamically re-ordering the priority of the queued spatial queries. The re-ordering of multiple queries is based on the inter-query spatial relationship and the latency of query processing. The performance test shows that the time of multiple query processing with query scheduling can be significantly reduced by easing inter-query random seeks as a consequence of enhanced hit ratio of disk cache.

다중 공간 질의는 동시에 2개 이상 수행되는 영역 질의로 정의되며 인터넷 기반 지도 보기 응용의 주요 연산이 되므로, 질의 처리 속도의 개선을 위해서 병렬로 처리되어야 하고 질의 처리 비용 중 큰 비중을 차지하는 디스크 입출력 시간을 최대한 줄일 필요가 있다. 그런데 다중 CPU/다중 디스크 구조상에서 디클러스터링을 수행하더라고, 다중 공간 질의를 처리하는 도중 질의 간 임의 탐색이 발생하여 디스크 입출력 시간이 증가하는 문제점이 있다. 이 논문에서는 디클러스터된 공간 데이터베이스에서 다중 공간 질의를 처리할 때 발생하는 문제점인 질의 간 임의 탐색을 분석하고, 해결 방안으로 질의 스케줄링 기법을 제시하였다. 질의 스케줄링 기법은 질의 간 관련성을 이용해서 질의 우선 순위를 조정해서 질의 간 임의 탐색을 해결하는 방법으로써, 질의간의 공간 및 시간 관련성 부여를 위해 질의 간 위치 관련성과 질의 대기 시간을 이용하였다. 실험 결과, 질의 스케줄링을 수행하면 디스크 캐쉬의 적중률이 최대 34% 향상되어 디스크 입출력 비용을 최대 6%까지 줄일 수 있어 다중 공간 질의 처리 시의 성능을 개선할 수 있는 것으로 나타났다.



  1. I. Karnel, C. Faloutsos, Parallel R-Trees, Proc. of ACM SIGMOD Conf., pp.195-204, 1992
  2. N. Koudas, C. Faloutsos, I. Kamel, Declustering Spatial Databases on a Multi-Computer Architecture, Intl. Conf. on Extending Database Technology(EDBT), pp.592-614, 1996
  3. J. Li, J. Srivastava, D. Rotem, CMD: A Multidimensional Dcclustering Method for Parallel Database Systems, Proc. of 18th VLDB Conf., pp.3-14, 1992
  4. H. V. Jagadish, Linear Clustering of Objects with Multiple Attributes, Proc. of ACM SIGMOD Conf., pp.332-342, 1990
  5. C. Faloutsos, P. Bhagwat, Declustering using Fractals, 2nd Intl. Conf. on Parallel and Distributed Information System(PDIS), pp.18-25, 1993
  6. M.H. Kim, S. Pramanik, Optimal File Distribution for Partial Match Retrieval, Proc. of ACM SIGMOID Conf., pp.173-182, 1988
  7. B. Moon, A. Acharya, J. Saltz, Study of Scalable Declustering Algorithms for Parallel Grid Files, Proc. 10th Intl. Parallel Processing Symp., pp.434-440, 1996
  8. B. Moon, J. H. Saltz, Scalability Analysis of Declustering Methods for Multidimensional Range Queries, IEEE Trans, on Knowledge and Data Engieering(TKDE), Vol. 10, No. 2, pp.310-327, 1998
  9. M. Coyle, S. Shekhar, Y. Zhou, Evaluation of Disk Allocation Methods for Parallelizing Spatial Queries on Grid Files, Intl. Conf. on Data Engieering(ICDE), pp.243-252, 1994
  10. S. Shekhar, S. Ravada, V. Kumar, D. Chubb, G. Turner, Declustering and Load-Balancing Methods for Parallelizing Geographic Information Systems, IEEE Trans. on Knowledge and Data Engineering (TKDE), Vol. 10, pp.632-655, 1998
  11. T. Brinkhoff, II. P. Kriegel, The Impact of Global Clustering on Spatial Database Systems, Proc. of 20th VLDB Conf., pp.168-179, 1994
  12. A. Silberschatz, H. F. Korth, S. Sudarshan, Database System Concepts, 3rd Edition, pp.543-585, McGraw Hill, 1997
  13. M. Stonebraker, J. Frew, K. Gardels, J. Meredith, The Sequoia 2000 Benchmark, Proc. of ACM SIGMOD Conf., pp.2-11, 1993
  14. 박영민, 서영덕, 전봉기, 홍봉희, 다중 공간 질의 처리를 위한 병렬 공간 객체 파일 서버의 설계, 한국정보과학회 '99 봄 학술발표논문집, 제26권 1호, pp.134-136, 1999
  15. 박영민, 전봉기, 서영덕, 홍봉희, 디클러스터링된 공간 데이티베이스에서의 다중 공간 질의 처리, 한국정보과학회 '99 가을 학술발표논문집, 제26권 2호, pp. 314-316, 1999