Selectivity Estimation for Spatio-Temporal a Overlap Join

시공간 겹침 조인 연산을 위한 선택도 추정 기법

  • 이명술 (충북대학교 컴퓨터교육과) ;
  • 이종연 (충북대학교 컴퓨터교육과)
  • Published : 2008.02.15

Abstract

A spatio-temporal join is an expensive operation that is commonly used in spatio-temporal database systems. In order to generate an efficient query plan for the queries involving spatio-temporal join operations, it is crucial to estimate accurate selectivity for the join operations. Given two dataset $S_1,\;S_2$ of discrete data and a timestamp $t_q$, a spatio-temporal join retrieves all pairs of objects that are intersected each other at $t_q$. The selectivity of the join operation equals the number of retrieved pairs divided by the cardinality of the Cartesian product $S_1{\times}S_2$. In this paper, we propose aspatio-temporal histogram to estimate selectivity of spatio-temporal join by extending existing geometric histogram. By using a wide spectrum of both uniform dataset and skewed dataset, it is shown that our proposed method, called Spatio-Temporal Histogram, can accurately estimate the selectivity of spatio-temporal join. Our contributions can be summarized as follows: First, the selectivity estimation of spatio-temporal join for discrete data has been first attempted. Second, we propose an efficient maintenance method that reconstructs histograms using compression of spatial statistical information during the lifespan of discrete data.

시공간 데이타베이스에서 조인 연산은 매우 많은 비용이 소요되며, 시공간 조인 연산의 효율적인 질의 실행 계획을 세우기 위해 조인 연산에 대한 정확한 선택도 추정은 질의처리 성능에 결정적이다. 주어진 두 이산 데이타집합 $S_1,\;S_2$의 타임스탬프 $t_q$에서 시공간 조인 연산은 타임스탬프 $t_q$에서 서로 교차하는 모든 객체 쌍을 검색하는 것이다. 시공간 조인 연산의 선택도 추정치는 검색된 객체 쌍의 수를 $|S_1{\times}S_2|$로 나눈 값이다. 이 논문은 공간 조인 연산의 선택도 추정 기법인 기하 히스토그램 기법을 확장하여 시공간 조인 선택도 추정을 위한 시공간 히스토그램을 제안한다. 균일 데이타 집합과 편중 데이타 집합 모두를 사용하여 제안된 히스토그램 기법으로 시공간 조인 연산의 선택도를 정확하게 추정할 수 있다는 것을 증명하였다. 본 논문의 기여도는 먼저 이산 데이타 집합에 대한 시공간 조인 선택도 추정 연구의 첫 시도를 하였으며 다음으로 이산 객체의 유효시간 동안의 공간 통계정보를 압축하여 히스토그램을 재구축하는 효율적인 유지기법을 제안하였다.

Keywords

References

  1. Hadjieleftheriou, M., Kollios, G., Tsotras, V., "Performance Evaluation of Spatio-Temporal Selectivity Estimation Techniques," In Proc. of SSDBM, 2003
  2. Sun, J., Papadias, D., Tao, Y., Liu, B., "Querying about the Past, the Present, and the Future in Spatio-Temporal Databases," In Proc. of ICDE, 2004
  3. Tao, Y., Sun, J. Papadias, D., "Selectivity Estimation for Predictive Spatio-Temporal Queries," In proc. of ICDE, 2003
  4. Lee, J. and B. Shin, "Histogram-based Selectivity Estimation in Spatio-Temporal Databases," In Proc. Journal of Korea Information Processing Society, Vol.12-D, No.1, 2005
  5. An, N., Z.Yang, and A. Sivasubramaniam, "Selectivity Estimation for Spatial Joins," In Proc of IEEE ICDE 2001, pages 368-375, Heidelberg, 2001
  6. Belussi, A. and C. Faloutsos, "Estimating the Selectivity of Spatial Queries using Correlation Fractal Dimensions," In Proc. of VLDB '95, pages 299- 310, Zurich, 1995
  7. Faloutsos, C., B. Seeger, A. Traina, and C. Traina, "Spatial Join Selectivity using Power Laws," In Proc. of ACM SIGMOD 2000, Dallas, 2000
  8. Theodoridis, Y. and T. Sellis, "A Model for the Prediction of R-Tree Performance," In Proc of ACM PODS '96, pages 161-171, Montreal, Canada, 1996
  9. Theodoridis, Y., E. Stefanakis, and T. Sellis, "Cost Models for Join Queries in Spatial Databases," In Proc. of IEEE ICDE '98, pages 476-485, Orlando, USA, 1998
  10. Mamoulis, N. and D. Papadias, "Selectivity Estimation of Complex Spatial Queries," In Proc. of SSTD 2001, pages 155-174, Redondo Beach, CA, USA, 2001
  11. Sun, C., D. Agrawal, and A. E. Abbadi, "Selectivity Estimation for Spatial Joins with Geometric Selections," In Proc. of 8th International Conference on Extending Database Technology, EDBT 2002, pages 609-626, Prague, 2002
  12. Belussi, A., E. Bertino, and A. Nucita, "Grid Based Methods for Estimating Spatial Join Selectivity," In Proc. of GIS'04, pages 92-100, Washington, DC, USA, 2004
  13. Sun, J., Y. Tao, D. Papadias, and G. Kollios, "Spatio-Temporal Join Selectivity," In Proc. of Information Systems, pages 1-21, 2005
  14. Aref, W. and H. Samet, "A Cost Model for Query Optimization Using R-Trees," In Proc. of ACM GIS, pages 60-67, Gaithersburg, MaryLand, 1994
  15. Kam, I. and C. Faloutsos, "On Packing R-trees," In Proc. of CIKM, pages 490-499, Washington D. C., 1993
  16. Beigel, R. and Egemen Tanin, "The geometry of browsing," In Proc. of the Latin American Symposium on Theoretical Informatics, pages 331-340, Brazil, 1998
  17. Acharya, S., V. Poosala, S. Ramaswamy, "Selectivity Estimation in Spatial Databases," In Proc. of ACM SIGMOD, pages 13-24, USA, 1999
  18. Theodoridis, Y., J. R. O. Silva, M. A. Nascimento, "On the Generation of Spatio-Temporal Datasets," In Proc. of the 6th Int'l Symposium on Spatial Databases, 1999