Abstract
Various techniques including histograms, sampling and parametric techniques have been proposed to estimate query result sizes for the query optimization. Histogram-based techniques are the most widely used form for the selectivity estimation in relational database systems. However, in the spatio-temporal databases for the moving objects, the continual changes of the data distribution suffer the direct utilization of the state of the art histogram techniques. Specifically for the future queries, we need another methodology that considers the updated information and keeps the accuracy of the result. In this paper we propose a novel approach based upon the duality and the marginal distribution to construct a histogram with very little time since the spatio-temporal histogram requires the data distribution defined by query predicates. We use data synopsis method in the dual space to construct spatio-temporal histograms. Our method is robust to changing data distributions during a certain period of time while the objects keep the linear movements. An additional feature of our approach supports the dynamic update incrementally and maintains the accuracy of the estimated result.
질의 최적화에 사용하기 위한 선택도 추정 방법은 히스토그램, 샘플링 그리고 패러미터에 의한 요약 방법 등이 제시되고 있다. 히스토그램을 이용한 선택도 추정은 상용 데이타베이스 시스템에서 가장 보편적으로 사용되는 방법이지만, 이동 객체를 위한 시공간 데이타베이스에서는 데이타 분포가 지속적으로 변화함으로써 기존의 히스토그램 방법을 이용하는 것은 제한이 많게 된다. 특히 미래 질의를 위해서는 데이타 갱신을 반영하는 동적 관리가 가능하며, 정화도를 유지할 수 있는 다른 접근 방법이 필요하다. 따라서 시공간 객체를 위한 선택도 추정 방법은 질의 술어가 요구하는 데이타 분포에 대한 히스토그램이 필요하며, 본 논문에서는 미래의 시공간 영역 질의 술어에 대하여 신속히 히스토그램을 생성할 수 있도록 쌍대성과 한계 분포 방법을 이용한 히스토그램을 제안한다. 쌍대 공간에서 이동 객체에 대한 데이타 시놉시스를 이용하여 구성된 시공간 히스토그램은 이동 궤적의 선형성이 유지하는 시간 동안 정확성을 보장하면서 빠른 시간에 생성이 가능하다. 또한 동적 갱신을 점증적으로 지원함으로써 효율적으로 갱신된 정보를 반영할 수 있고 추정 결과의 정확성을 향상시킬 수 있다.