Spatial Selectivity Estimation using Cumulative Wavelet Histograms

누적밀도 웨이블릿 히스토그램을 이용한 공간 선택율 추정

  • 지정희 (충북대학교 전자계산학과) ;
  • 정재혁 (한국에너지기술연구원) ;
  • 류근호 (충북대학교 전자계산학과)
  • Published : 2005.10.01

Abstract

The purpose of selectivity estimation is to maintain the summary data in a very small memory space and to minimize the error of estimated value and query result. In case of estimating selectivity for large spatial data, the existing works need summary information which reflect spatial data distribution well to get the exact result for query. In order to get such summary information, they require a much memory space. Therefore In this paper, we propose a new technique cumulative density wavelet Histogram, called CDW Histogram, which gets a high accurate selectivity in small memory space. The proposed method is to utilize the sub-histograms created by CD histogram. The each sub-histograms are used to generate the wavelet summary information by applying the wavelet transform. This fact gives us good selectivity even if the memory sire is very small. The experimental results show that the proposed method simultaneously takes full advantage of their strong points - gets a good selectivity using the previous histogram in ($25\%\~50\%$) memory space and is superior to the existing selectivity estimation techniques. The proposed technique can be used to accurately quantify the selectivity of the spatial range query in databases which have very restrictive memory.

선택율 추정 기법들의 공통적인 목표는 데이타의 요약 정보를 적은 저장 공간에 유지하고, 추정된 값과 질의 결과에 대한 오차를 최소화하는 것이다. 방대한 양의 공간 데이타에 대한 선택율 추정의 경우, 정확한 결과를 얻기 위해서는 공간 데이타의 분포를 반영하는 요약 정보를 필요로 하며, 그러한 요약 정보를 생성하기 위해서는 많은 저장 공간을 필요로 한다. 따라서, 이 논문에서는 적은 저장 공간을 사용하면서, 정확성 높은 선택율을 추정하는 누적밀도 웨이블릿 히스토그램을 제안한다. 이 히스토그램은 기존의 누적밀도 히스토그램에 유지되는 각 서브 히스토그램에 대해 웨이블릿 변환을 적용함으로써, 보다 적은 저장 공간에서 높은 정확도의 선택율을 얻을 수 있다. 우리는 실험결과를 통하여 기존 히스토그램의 저장 공간에 $25\%\~50\%$만을 사용하여 높은 정확도의 선택율 추정 결과를 보임으로써, 기존의 다른 선택율 추정기법들이 갖는 저장공간에 대한 제약사항을 해결함과 동시에 적은 저장공간을 사용하여 높은 정확도의 선택율 추정이 가능함을 확인 하였다. 이 논문에서 제안된 기법은 공간 데이타베이스에서의 공간 범위 질의에 대한 정확성 높은 선택율을 추정하기 위해 사용될 수 있다.

Keywords

References

  1. V. Poosala, Y. E. Ioannidis, p. J Haas, E. J. Shekita, 'Improved Histograms for Selectivity Estimation of Range Predicates,' ACM SIGMOD Corference, pp.294-305, 1996 https://doi.org/10.1145/233269.233342
  2. Swarup Acharya, Viswanath Poosala, Sridhar Ramaswamy, 'Selectivity estimation in spatial databases,' In Proc. ACM SIGMOD Int. Conf. on Management of Data, pp.13-24, 1999 https://doi.org/10.1145/304182.304184
  3. Jin, N. An, A. Sivasubramaniam, 'Analyzing Range Queries on Spatial Data,' In Proceedings of the IEEE International Conference on Data Engineering (ICDE), pp.525-534, 2000 https://doi.org/10.1109/ICDE.2000.839451
  4. C. Sun, D. Agrawal, A. El Abbadi, 'Selectivity for spatial joins with geometric selections,' Proc. of EDBT, pp.609-626, 2002
  5. 김홍연, 배해영, '다차원 히스토그램을 이용한 공간 위상 술어의 선택도 추정 기법', 한국 정보처리학회 논문지 제6권 제4호, pp.841-850, 1999.4
  6. Vitter, Wang, 'Approximate Computation of Multidimensional Aggregates of Sparse Data using Wavelets,' In Proc. ACM SIGMOD Int. Conf. on Management of Data, pp.193-204, 1999 https://doi.org/10.1145/304182.304199
  7. Yossi Matias, Jeffrey Scott Vitter, Min Wang, 'Dynamic Maintenance of Wavelet-Based Histograms,' The VLDB Journal, pp.101-110, 2000
  8. Min Wang, Jeffrey Scott Vitter, Lipyeow Lim, Sriram Padmanabhan, 'Wavelet-based cost Estimation for Spatial Queries,' In Proc. Int. Symp. on Spatial and Temporal Databases, pp.175-196, 2001
  9. 지정희, 이진열, 김상호, 류근호, '압축된 공간 히스토그램을 이용한 선택율 추정 기법', 한국정보처리학회논문지 D 제11권 제2호, pp.281-292, 2004 https://doi.org/10.3745/KIPSTD.2004.11D.2.281
  10. Jeong Hee Chi, Jin Yul Lee, Keun Ho Ryu, 'Selectivity Estimation for Spatial Databases,' Asian Conference on Remote Sensing & International Symposium on Remote Sensing (ISRS), November 2003
  11. 지정희, 김상호, 류근호, '일반화된 누적밀도 히스토그램을 이용한 공간 선택율 추정', 한국정보처리학호논문지 D 제11권 제4호 pp.963-990, 2004
  12. Jeong Hee Chi, Sang Ho Kim, Keun Ho Ryu, 'Spatial Selectivity Estimation using Compressed Histogram Information,' LNCS 3399, 489-494, 2005.3 https://doi.org/10.1007/b106936
  13. Stollnitz, E., DeRose, T., and Salesin, D., 'Wavelet for Computer Graphics Theory and Applications,' Morgan Kaufmann, 1996