• 제목/요약/키워드: selectivity estimation

검색결과 64건 처리시간 0.04초

Spatial Selectivity Estimation for Intersection region Information Using Cumulative Density Histogram

  • Kim byung Cheol;Moon Kyung Do;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.721-725
    • /
    • 2004
  • Multiple-count problem is occurred when rectangle objects span across several buckets. The Cumulative Density (CD) histogram is a technique which solves multiple-count problem by keeping four sub-histograms corresponding to the four points of rectangle. Although it provides exact results with constant response time, there is still a considerable issue. Since it is based on a query window which aligns with a given grid, a number of errors may be occurred when it is applied to real applications. In this paper, we proposed selectivity estimation techniques using the generalized cumulative density histogram based on two probabilistic models: (1) probabilistic model which considers the query window area ratio, (2) probabilistic model which considers intersection area between a given grid and objects. In order to evaluate the proposed methods, we experimented with real dataset and experimental results showed that the proposed technique was superior to the existing selectivity estimation techniques. The proposed techniques can be used to accurately quantify the selectivity of the spatial range query on rectangle objects.

  • PDF

시공간 데이타베이스에서 다차원 시퀀스 데이타의 선택도추정 (Selectivity Estimation for Multidimensional Sequence Data in Spatio-Temporal Databases)

  • 신병철;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.84-97
    • /
    • 2007
  • 선택도 추정 기법은 질의 최적화를 위해 현재 상용 데이터 베이스에서 많이 사용되고 있고 히스토그램은 가장 많이 사용되는 선택도 추정 기법중의 하나이다. 최근에 시공간 데이터 베이스 관련 연구들에서 이러한 선택도 추정 기법이 기존의 시간 공간 데이타베이스 선택도 추정 기법을 확장하여 활발하게 연구되었다. 하지만 기존의 시공간 데이타베이스 선택도 추정 연구는 주로 이동 객체와 같은 시계열 데이타만 고려하였다. 또한 기존의 연구는 과거시점부터 현재 시점까지 시간적 범위 질의에 대한 선택도 추정은 불가능하였다. 따라서 본 논문에서는 시공간 데이타베이스에서 과거 시점에서 현재시점까지 시퀀스 데이타의 시간적 범위 질의를 위한 히스토그램을 구축하고 이를 이용한 효과적인 선택도 추정 기법을 제안한다. 제안한 히스토그램을 이용하면 과거부터 현재까지 시퀀스 데이타의 선택도 추정이 가능하고, 범위시간 선택도 추정 기법이 가능하며 효과적인 히스토그램 유지 기법의 적용이 가능하다.

이동객체를 위한 현재 질의 선택율 추정 기법 (A Selectivity Estimation Technique for Current Query of Moving Objects)

  • 지정희;류근호;정두영
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.87-96
    • /
    • 2006
  • 선택을 추정은 질의 최적화를 위한 기법중의 하나이다. 이동객체에 대한 기존 선택율 추정 기법은 시간에 따른 이동객체의 위치 변화를 요약 정보에 반영하지 못하며. 또한 기존 공간 요약 정보를 확장하여 이용함으로써 선택율 추정시 많은 에러를 발생시키고 있다. 기존 기법들이 이동객체의 위치 정보 변화를 요약 정보에 반영하기 위해서는 요약 정보를 자주 재생성해야 하며, 그러므로 전체 데이터베이스를 자주 스캔해야 하는 문제점을 갖고 있다. 따라서 이 논문에서는 이동객체의 현재 질의에 대한 선택을 추정 기법을 개발하기 위하여 쿼드 트리 기반의 히스토그램 기법을 제안하였다. 또한 제안된 기법의 구현과 평가를 통해 제안된 기법의 성능을 분석하였다. 이 논문에서 제안된 기법은 차량 추적 시스템, 위치 기반 서비스, 응급 구조 서비스, 그리고 텔레매틱스 서비스 등과 같은 연속적으로 위치를 변경하는 이동객체의 정보를 실시간으로 관리하고 검색하는 응용분야에 활용 가능할 것이다.

  • PDF

시공간 데이터베이스를 위한 히스토그램 기반 선택도 추정 기법 (Histogram-based Selectivity Estimation Method in Spatio-Temporal Databases)

  • 이종연;신병철
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.43-50
    • /
    • 2005
  • 시공간 데이터베이스의 영역에는 그게 이동객체를 다루는 시계열 데이터베이스 영역과 이력객체를 다루는 서열 데이터베이스 영역으로 나뉜다. 최근에는 시공간 데이터베이스의 질의 최적화를 위한 선택도 추정 연구가 활발히 진행되었으나, 기존 연구는 주로 시계열 데이터베이스의 선택도 추정에 의한 질의 최적화에 중점을 두었고 서열 데이터베이스에 대한 질의 최적화 연구는 전무하였다. 따라서 본 논문에서는 시공간 데이터베이스의 질의 최적화를 위한 T-Minskew 히스토그램을 구축하고 이를 이용한 선택도 추정 기법을 제안한다. 또한 임계치 기법을 이용한 효과적인 히스토그램 유지 기법을 제안한다.

Spatial Selectivity Estimation Using Wavelet

  • Lee, Jin-Yul;Chi, Jeong-Hee;Ryu, Keun-Ho
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.459-462
    • /
    • 2003
  • Selectivity estimation of queries not only provides useful information to the query processing optimization but also may give users with a preview of processing results. In this paper, we investigate the problem of selectivity estimation in the context of a spatial dataset. Although several techniques have been proposed in the literature to estimate spatial query result sizes, most of those techniques still have some drawback in the case that a large amount of memory is required to retain accurate selectivity. To eliminate the drawback of estimation techniques in previous works, we propose a new method called MW Histogram. Our method is based on two techniques: (a) MinSkew partitioning algorithm that processes skewed spatial datasets efficiently (b) Wavelet transformation which compression effect is proven. We evaluate our method via real datasets. With the experimental result, we prove that the MW Histogram has the ability of providing estimates with low relative error and retaining the similar estimates even if memory space is small.

  • PDF

시점 질의를 위한 선택율 추정 (Selectivity Estimation for Timestamp Queries)

  • 신병철;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.214-223
    • /
    • 2006
  • 최근 시간에 따른 대량의 공간 객체들의 효과적인 저장과 처리의 필요성이 요구되면서 시공간 데이타베이스에 대한 필요성이 증가하였다. 이러한 시공간 데이타베이스에서 효과적인 질의 처리를 위하여 여러 가지 질의 최적화 기법이 연구되었고 그중 질의의 근사적인 결과를 계산하는 선택도 추정 기법이 활발하게 연구되었다. 선택도 추정 기법에는 샘플링 기반 기법, 히스토그램 기반 기법, 웨이블릿 기반 기법 등이 있고 그중 히스토그램 기법은 현재 상용 데이타베이스에서 널리 사용되고 있다. 하지만 지금까지의 시공간 질의 최적화 연구는 이동 객체의 미래 위치에 대한 선택도 추정에 치중되어 왔다. 본 논문에서는 과거의 시공간 데이타의 질의 최적화를 위하여 새로운 히스토그램인 T-Minskew의 구축 방법을 제안한다. 또한 T-Minskew를 이용한 효과적인 선택도 추정 기법을 제안하고 임계치 기법을 이용한 히스토그램의 효과적인 유지 기법을 통해 잦은 히스토그램 재구축을 방지하고 작은 추정 오류율을 유지하는 방법을 제안한다.

Selectivity Estimation for Spatial Databases

  • Chi, Jeong-Hee;Lee, Jin-Yul;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.766-768
    • /
    • 2003
  • Selectivity estimation for spatial query is curial in Spatial Database Management Systems(SDBMS). Many works have been performed to estimate accurate selectivity. Although they deal with some problems such as false-count, multi-count arising from properties of spatial dataset, they can not get such effects in little memory space.* Therefore, we need to compress spatial dataset into little memory. In this paper, we propose a new technique called MW Histogram which is able to compress summary data and get reasonable results. Our method is based on two techniques:(a)MinSkew partitioning algorithm which deal with skewed spatial datasets. efficiently (b) Wavelet transformation which compression effect is proven. We evaluate our method via real datasets. The experimental result shows that the MW Histogram has the ability of providing estimates with low relative error and retaining the similar estimates even if memory space is small.

  • PDF

공간 선택률 추정을 위한 압축 히스토그램 기법 (A Compressed Histogram Technique for Spatial Selectivity Estimation)

  • 정재두;지정희;류근호
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2004년도 국내 LBS 기술개발 및 표준화 동향세미나
    • /
    • pp.69-74
    • /
    • 2004
  • Selectivity estimation for spatial query is very important process in finding the most efficient execution plan. Many works have been performed to estimate accurately selectivity. Although they deal with some problems such as false-count, multi-count, they require a large amount of memory to retain accurate selectivity, so they can not get good results in little memory environments such as mobile-based small database. In order to solve this problem, we propose a new technique called MW histogram which is able to compress summary data and get reasonable results. It also has a flexible structure to react dynamic update. The experimental results showed that the MW histogram has lower relative error than MinSkew histogram and gets a good selectivity in little memory.

  • PDF

누적밀도 웨이블릿 히스토그램을 이용한 공간 선택율 추정 (Spatial Selectivity Estimation using Cumulative Wavelet Histograms)

  • 지정희;정재혁;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.547-557
    • /
    • 2005
  • 선택율 추정 기법들의 공통적인 목표는 데이타의 요약 정보를 적은 저장 공간에 유지하고, 추정된 값과 질의 결과에 대한 오차를 최소화하는 것이다. 방대한 양의 공간 데이타에 대한 선택율 추정의 경우, 정확한 결과를 얻기 위해서는 공간 데이타의 분포를 반영하는 요약 정보를 필요로 하며, 그러한 요약 정보를 생성하기 위해서는 많은 저장 공간을 필요로 한다. 따라서, 이 논문에서는 적은 저장 공간을 사용하면서, 정확성 높은 선택율을 추정하는 누적밀도 웨이블릿 히스토그램을 제안한다. 이 히스토그램은 기존의 누적밀도 히스토그램에 유지되는 각 서브 히스토그램에 대해 웨이블릿 변환을 적용함으로써, 보다 적은 저장 공간에서 높은 정확도의 선택율을 얻을 수 있다. 우리는 실험결과를 통하여 기존 히스토그램의 저장 공간에 $25\%\~50\%$만을 사용하여 높은 정확도의 선택율 추정 결과를 보임으로써, 기존의 다른 선택율 추정기법들이 갖는 저장공간에 대한 제약사항을 해결함과 동시에 적은 저장공간을 사용하여 높은 정확도의 선택율 추정이 가능함을 확인 하였다. 이 논문에서 제안된 기법은 공간 데이타베이스에서의 공간 범위 질의에 대한 정확성 높은 선택율을 추정하기 위해 사용될 수 있다.

일반화된 누적밀도 히스토그램을 이용한 공간 선택율 추정 (Selectivity Estimation using the Generalized Cumulative Density Histogram)

  • 지정희;김상호;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.983-990
    • /
    • 2004
  • 누적밀도 히스토그램은 사각형 객체의 네 점에 대응하는 4개의 서브 히스토그램을 유지함으로써 사각형 객체가 여러 버켓에 걸쳐질 경우 발생하는 다중 계산 문제를 해결하고 있다. 이 기법은 빠른 추정시간과 정확한 결과를 제공하고 있지만, 질의 윈도우가 그리드 셀의 경계와 일치해야 한다는 제약사항을 기반으로 수행하므로, 실제 응용에 적용시 많은 에러를 초래하게 된다. 따라서, 이 논문에서는 기존 누적밀도 히스토그램에서 질의 윈도우의 제약사항에 관한 영향을 줄이기 위해, 두가지 확률모델을 기반으로 일반화된 누적밀도 히스토그램을 사용한 선택율 추정 기법을 제안하였다. 제안된 두가지 확률 모델은 \circled1질의 영역 비율을 고려한 확률모델과, \circled2교차 영역 정보를 고려한 확률모델이다. 우리는 실제 데이터 셋을 사용하여 제안된 기법을 실험하였다 실험 결과는 이 논문에서 제안된 기법이 기존의 다른 선택율 추정 기법보다 성능이 뛰어남을 보여주고 있다 더구나, 교차 영역 정보를 기반으로 하는 확률모델의 경우 20% 질의 윈도우에서 5% 미만의 낮은 에러율을 보였다. 이 논문에서 제안된 기법은 사각형 객체의 공간 범위 질의의 선택율을 정확하게 추정하는데 사용될 수 있다.