적응형 행 기준 순서: 변환공간 뷰 조인의 성능 최적화 방법

Adaptive Row Major Order: a Performance Optimization Method of the Transform-space View Join

  • 이민재 (한국과학기술원 전산학과) ;
  • 한욱신 (경북대학교 컴퓨터공학과) ;
  • 황규영 (한국과학기술원 전자전산학과)
  • 발행 : 2005.08.01

초록

변환공간 색인이란 원공간 상의 공간 객체들을 변환공간 상의 크기가 없는 점들로 변환하여 색인한 후에 이들을 다루는 구조로, 이를 활용하는 조인 알고리즘은 크기가 없는 점들을 다루기 때문에 최적화가 상대적으로 단순하다는 장점을 가진다. 하지만, R 트리와 같은 원공간 색인에는 적용될 수 없는 단점을 가진다. 이러한 단점을 해결하는 방법으로 저자들 은 변환공간 뷰라는 개념을 사용하여 두 원공간 색인들을 변환공간에서 조인하는 변환공간 뷰 조인 알고리즘(transform-space view) join algorithm)을 제안한 바 있다. 여기서 변환공간 뷰(transform-space view)란 원공간 색인에 대한 가상의 변환공간 색인으로서 이미 구축된 원공간 색인을 구조적으로 변경하지 않고서도 가상의 변환공간 색인으로 해석하여 원공간 색인이 변환공간에서 조인될 수 있게 한다. 변환공간 뷰 조인 알고리즘에서 디스크 페이지 액세스 순서는 공간 채움 곡선에 의해 결정되는데, 이는 조인 성능에 큰 영향을 미친다. 본 논문에서는 변환공간 뷰 조인 알고리즘을 최적화 하는 방법으로 새로운 공간 채움 곡선인 적응형 행 기준 순서(adoptive row major order: ARM order)를 제안한다. 적응형 행 기준 순서는 주어진 버퍼 크기에 따라 디스크 페이지 액세스 순서를 적응적으로 조정하여 원패스 버퍼 크기(한 페이지 당 한번의 디스크 액세스를 보장하는 최소 버퍼 크기)와 디스크 액세스 횟수를 크게 줄인다. 정형적인 분석과 실험을 통하여 적응형 행 기준 순서를 사용하는 변환공간 뷰 조인 알고리즘의 우수성을 보인다. 실험 결과, 다른 공간 채움 곡선을 사용하는 변환공간 뷰 조인 알고리즘과 비교하여 적응형 행 기준 순서는 원패스 버퍼 크기를 최대 21.3배 줄이고, 디스크 액세스 횟수를 최대 $74.6\%$ 줄인다. 또한, R 트리를 원공간에서 조인하는 알고리즘들과 비교하여 원패스 버퍼 크기를 최대 15.7배 줄이고, 디스크 액세스 횟수를 최대 $65.3\%$ 줄인다.

A transform-space index indexes objects represented as points in the transform space An advantage of a transform-space index is that optimization of join algorithms using these indexes becomes relatively simple. However, the disadvantage is that these algorithms cannot be applied to original-space indexes such as the R-tree. As a way of overcoming this disadvantages, the authors earlier proposed the transform-space view join algorithm that joins two original- space indexes in the transform space through the notion of the transform-space view. A transform-space view is a virtual transform-space index that allows us to perform join in the transform space using original-space indexes. In a transform-space view join algorithm, the order of accessing disk pages -for which various space filling curves could be used -makes a significant impact on the performance of joins. In this paper, we Propose a new space filling curve called the adaptive row major order (ARM order). The ARM order adaptively controls the order of accessing pages and significantly reduces the one-pass buffer size (the minimum buffer size required for guaranteeing one disk access per page) and the number of disk accesses for a given buffer size. Through analysis and experiments, we verify the excellence of the ARM order when used with the transform-space view join. The transform-space view join with the ARM order always outperforms existing ones in terms of both measures used: the one-pass buffer size and the number of disk accesses for a given buffer size. Compared to other conventional space filling curves used with the transform-space view join, it reduces the one-pass buffer size by up to 21.3 times and the number of disk accesses by up to $74.6\%$. In addition, compared to existing spatial join algorithms that use R-trees in the original space, it reduces the one-pass buffer size by up to 15.7 times and the number of disk accesses by up to $65.3\%$.

키워드

참고문헌

  1. T. Brinkhoff, H.-P. Kriegel, and B. Seeger, 'Efficient Processing of Spatial Joins Using R-Trees,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, pp. 237-246, May 1993 https://doi.org/10.1145/170036.170075
  2. Y.-W. Huang and N. Jing, 'Spatial Joins Using R-trees: Breadth-First Traversal with Global Optimizations,' In Proc. the 23rd Int'l Conf. on Very Large Data Bases, pp. 396-405, 1997
  3. N. Beckmann, H.-P. Kriegel, and R. Schneider, 'The R*-tree: An Efficient and Robust Access Method for Points and Rectangles,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, pp. 322-331, 1990
  4. A. Guttman, 'R-trees: a Dynamic Index Structure for Spatial Searching,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, pp. 47-57, 1984
  5. T. Sellis, N. Roussopolus, and C. Faloutsos, 'The R+-tree: A Dynamic Index for Multidimensional Objects,' In Proc. the Thirteenth Int'l Conf. on Very Large Data Bases, pp. 507-518, 1987
  6. J. Song, K. Whang, Y. Lee, M. Lee, and S. Kim, 'Spatial Join Processing Using Corner Transformation,' IEEE Trans. on Knowledge and Data Engineering, Vol. 11, No. 4, pp. 688-695, 1999 https://doi.org/10.1109/69.790844
  7. J. Lee, Y. Lee, K. Whang, and I. Song, 'A Region Splitting Strategy for Physical Database Design of Multidimensional File Organizations,' In Proc. the 23rd Int'l Conf. on Very Large Data Bases, pp. 416-425, 1997
  8. K. Whang and R. Krishnamurthy, Multilevel Grid Files, IBM Research Report RC 11516, 1985
  9. 이민재, 한욱신, 황규영, '변환공간 뷰를 기반으로한 공간 조인', 한국정보과학회 논문지(데이타베이스), Vol. 30, No. 5, pp. 438-450, 2003년 10월
  10. D. Hilbert, 'Uber die stetige Abbildung einer Linie auf Flachenstuck,' Math Ann, Vol. 38, pp. 459-460, 1891 https://doi.org/10.1007/BF01199431
  11. J. K. Lawder and P. J. H. King, 'Querying Multi-Dimensional Data Indexed Using the Hilbert Space-filling Curve,' SIGMOD Record, Vol. 30, No. 1, pp. 19-24, 2001 https://doi.org/10.1145/373626.373678
  12. J. Orenstein, 'Spatial Query Processing. in an Object-Oriented Database System,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, pp. 326-336, May 1986 https://doi.org/10.1145/16894.16886