VP Filtering for Efficient Query Processing in R-tree Variants Index Structures

R-tree 계열의 인덱싱 구조에서의 효율적 질의 처리를 위한 VP 필터링

  • 김병곤 (부천대학 사무자동화과) ;
  • 이재호 (인천교육대학 컴퓨터교육과) ;
  • 임해철 (홍익대학교 컴퓨터공학과)
  • Published : 2002.12.01

Abstract

With the prevalence of multi-dimensional data such as images, content-based retrieval of data is becoming increasingly important. To handle multi-dimensional data, multi-dimensional index structures such as the R-tree, Rr-tree, TV-tree, and MVP-tree have been proposed. Numerous research results on how to effectively manipulate these structures have been presented during the last decade. Query processing strategies, which is important for reducing the processing time, is one such area of research. In this paper, we propose query processing algorithms for R-tree based structures. The novel aspect of these algorithms is that they make use of the notion of VP filtering, a concept borrowed from the MVP-tree. The filtering notion allows for delaying of computational overhead until absolutely necessary. By so doing, we attain considerable performance benefits while paying insignificant overhead during the construction of the index structure. We implemented our algorithms and carried out experiments to demonstrate the capability and usefulness of our method. Both for range query and incremental query, for all dimensional index trees, the response time using VP filtering was always shorter than without VP filtering. We quantitatively showed that VP filtering is closely related with the response time of the query.

정보사회가 인터넷의 보급과 더불어 복잡해짐에 따라 데이타베이스의 흐름은 문자나 숫자와 같은 일차원적인 데이타가 아닌 지리정보, 멀티미디어 데이타와 같은 다차원의 데이타를 저장하고 이에 대한 질의를 처리할 수 있는 시스템을 요구하고 있다 따라서, 다차원적인 특성을 지니는 데이타에 대한 효율적 검색을 위한 다차원 인덱싱 구조에 대한 연구가 활발히 진행되어 왔으며, 그와 동시에 이러한 인덱싱 구조하에서 효율적인 질의 처리를 위한 연구도 병행되고 있다. 다차원 데이타는 그 다양한 응용분야에 따라 요구되는 질의의 형태가 각각 다르므로 이에 대응할 수 있는 알고리즘의 연구가 필요하다. 현재, 많은 다차원 데이타 처리 시스템이 R-트리계열의 인덱싱구조를 근간으로 구성되었으나, 현재까지의 질의처리 기법은 질의처리시에 필터링 특성을 지니지 않으므로, 객체들간의 다차원 거리계산으로 인하여 많은 질의처리 시간을 소요한다. 본 논문에서는 다차원 데이타를 처리하기 위한 R-트리 계열의 다차원 인덱싱 구조에서의 효율적인 질의처리를 위하여 질의처리 대상 객체를 줄이기 위한 필터링 기법을 소개하였다. 필터링을 수행하기 위하여 VP-트리와 MVP-트리에서 사용되었던 VP(Vantage Point)를 이용한다. 먼저, VP 필터링의 개념을 소개하고, VP 필터링을 영역질의와 포인트 질의의 일종인 추가객체요구질의에 각각 적용한 알고리즘을 제시하였다. VP 필터링을 적용하기 위하여 요구되는 삽입 객체와 VP간의 거리계산 시간은 객체의 삽입시 수행되며, 질의 처리를 수행할 때에는 다시 계산되지 않는다. 논문에서는 제안된 알고리즘의 효율성을 실험을 통하여 증명하였다.

Keywords

References

  1. Antonin Guttman, 'R-Trees: A Dynamic Index Structure for Spatial Searching,' Proceedings of the ACM SIGMOD Conference, pages 47-57, 1984 https://doi.org/10.1145/602259.602266
  2. Norbert Beckmann, Hans-Peter Kriegel, Ralf Schneider, and Bernhard Seeger, 'The R*-Tree: An Efficient and Robust Access Method for Points and Rectangles,' Proceedings of the ACM SIGMOD Conference, pages 322-331, 1990 https://doi.org/10.1145/93597.98741
  3. Stefan Berchtold, Daniel A. Keim, and Hans Peter Kriegel, 'The X-Tree: An Index Structure for High-Dimensional Data,' Proceedings of the VLDB Conference, pages 28-39, 1996
  4. King-Ip Lin, H. V. Jagadish, and Christos Faloutsos, 'The TV-tree - An Index Structure for High-Dimensional Data,' VLDB Journal, Vol. 3(4), pages 517-542, 1994 https://doi.org/10.1007/BF01231606
  5. Tolga Bozkaya and Meral Ozsoyoglu, 'Distance-Based Indexing for High-Dimensional Metric Spaces,' Proceedings of the ACM SIGMOD Conference, pages 357-368, 1997 https://doi.org/10.1145/253260.253345
  6. Jeffrey K. Uhlmann, 'Satisfying General Proximity/ Similarity Queries with Metric Trees,' Information Processing Letters, Vol. 40, pages 175-179, 1991 https://doi.org/10.1016/0020-0190(91)90074-R
  7. Thomas Seidl and Hans-Peter Kriegel, 'Optimal Multi-Step k-Nearest Neighbor Search,' Proceedings of the ACM SIGMOD Conference, pages 154-165, 1998 https://doi.org/10.1145/276304.276319
  8. Gisli R. Hjaltason and Hanat Samet, 'Ranking in Spatial Databases,' Proceedings of the 4th International Symposium on Large Spatial Databases, Lecture Notes in Computer Science 951, Springer-Verlag, pages 83-95, 1995
  9. Peter N. Yianilos, 'Data Structures and Algorithms for Nearest Neighbor Search in General Metric Spaces,' ACM-SIAM Symposium on Discrete Algorithms, pages 311-321, 1993
  10. Nick Roussopoulos, Stephen Kelley, and Frederick Vincent, 'Nearest Neighbor Queries,' Proceedings of the ACM SIGMOD Conference, pages 71-79, 1995 https://doi.org/10.1145/223784.223794
  11. Byung-Gon Kim, Jung-Woon Han, Jaeho Lee, and Hae-Chull Lim, 'Feature Extraction and Query Processing Technique in Image Database Applications : Design and Evaluation,' Proceedings of the ICACT2000, 2000
  12. C. Faloutsos, R. Barber, M. Flickener, J. Hafner, et al., 'Efficient and effective Querying by Image content,' Journal of Intelligent Information Systems, Vol3, pages 231-262, 1994 https://doi.org/10.1007/BF00962238