A High-dimensional Indexing Scheme using Cell-based Filtering Technique

셀 기반 필터링 방법을 이용한 고차원 색인 기법

  • Jang, Jae-U (Dept.of Computer Engineering, Chonbuk National University) ;
  • Han, Seong-Geun (Dept.of Computer Engineering, Chonbuk National University) ;
  • Kim, Hyeon-Jin (Electronics and Telecommunications Research Institute)
  • Published : 2001.06.01

Abstract

최근 이미지 특징 벡터와 같은 고차원 벡터 데이터에 관한 색인 기법들이 많이 연구되고 있다. 하지만, 기존의 색인 기법들은 저차원의 데이터에 대해서는 검색 성능이 우수하지만, 차원이 증가함에 따라 검색 성능이 급격히 저하되는 'dimensional curse' 문제를 안고 있다. 따라서, 본 논문에서는 이러한 문제점을 최소화하기 위해 필터링을 이용한 새로운 색인 기법을 제안한다. 제안하는 셀 기반 필터링 기법은 셀 중심에서 객체까지의 거리값을 저장하여 필터링 효과를 증대시킨다. 또한 고차원 공간을 셀 단위로 분할하며, 각각의 셀을 시그니쳐로 표현한다. 검색을 수행하기 위해, 셀 기반 필터링 기법은 데이터 파일을 직접 접근하기 전에 전체 시그니쳐들을 탐색하여 필터링을 수행함으로써 후보 셀들을 얻는다. 성능 실험을 통해 제안하는 기법이 VA-파일보다 검색 시간에 있어서 약 20%의 성능 향상을 보인다.

Keywords

References

  1. Arya S., Mount D.M., Narayan O., 'Accounting for Boundary Effects in Nearest Neighbor Searching,' Proc. 11th Annaual Symp. on Computational Geometry, Vancouver, Canada, pp. 336-344, 1995 https://doi.org/10.1145/220279.220315
  2. Berchtold S., Bohm C., Keim D., Kriegel H. -P., 'A Cost Model for Nearest Neighbor Search in High-Dimensional Data Space,' ACM PODS Symposium on Principles of Databases Systems, Tucson, Arizona, 1997 https://doi.org/10.1145/263661.263671
  3. Bentley J. L., 'Multidimensional Search Trees Used for Associative Searching,' Comm. of the ACM, Vol. 18, No. 9, pp. 509-517, 1975 https://doi.org/10.1145/361002.361007
  4. Guttman A., 'R-trees: A Dynamic Index Structure for Spatial Searching,' Proc. ACM SIGMOD Int. Conf. on Management of Data, Boston, MA, pp. 45-57, 1984 https://doi.org/10.1145/602259.602266
  5. N. Beckmann, H.P. Kriegel, R. Schneider and B. Seeger, 'The R*-tree : An Efficient and Robust Access Method for Points and Rectangles,' ACM SIGMOD, pp. 322-331, May 1990 https://doi.org/10.1145/93597.98741
  6. Robinson J. T., 'The K-D-B-tree : A Search Structure for Large Multidimensional Dynamic Indexes,' Proc. ACM SIGMOD Int. Conf. on Management of Data, pp. 10-18, 1981 https://doi.org/10.1145/582318.582321
  7. Henrich, A., 'The LSDh-tree : An Access Structure for Feature Vectors,' Proc. 14th Int. Conf. on Data Engineering, Orlando, 1998 https://doi.org/10.1109/ICDE.1998.655799
  8. D. A. White and R. Jain, 'Similarity Indexing : Algorithms and Performance,' In Proc. Of the SPIE : Storage and Retrieval for Image and Video Databases IV, Vol. 2670, pp. 62-75, 1996 https://doi.org/10.1117/12.234810
  9. D. A. White and R. Jain, 'Similarity Indexing with the SS-tree,' In Proc. 12th Intl. Conf. on Data Engineering, New Orleans, pp. 516-523, 1996 https://doi.org/10.1109/ICDE.1996.492202
  10. Katayama N., Satoh S., 'The SR-tree: An Index Structure for High-Dimensional Nearest Neighbor Queries,' Proc. ACM SIGMOD Int. Conf. on Management of Data, pp. 369-380, 1997 https://doi.org/10.1145/253260.253347
  11. Berchtold S., Bohm C., Kriegel H.-P., 'The Pyramid-Tree : Indexing Beyond the Curse of Dimensionality,' Proc. ACM SIGMODE Int. Conf. on Management of Data, Seattle, 1998
  12. S. Berchtold, D. A. Keim, H-P. Kriegel, The X-tree : An Index Structure for High-Dimensional Data, Proceedings of the 22nd VLDB Conference, pp. 28-39, 1996
  13. Roger Weber, Hans-Jorg Schek, Stephen Blott: A Quantitative Analysis and Performance Study for Similarity-Search Methods in High-Dimensional Spaces. VLDB 1998: 194-205
  14. Roger Weber, Stephen Blott, 'An Approximattion-Based Data Structure for Similarity Search,' Technical report Nr. 24, ESPRIT project HERMES (no. 9141), October 1997
  15. Roussopoulos N., Kelley S., Vincent F., 'Nearest Neighbor Queries,' Proc. ACM SIGMOD Int. Conf. on Management of Data, pp. 71-79, 1995 https://doi.org/10.1145/223784.223794
  16. H.I. Lin, H. Jagadish, and C. Faloutsos, 'The TV-tree : An Index Structure for High Dimensional Data,' VLDB Journal, Vol. 3, pp. 517-542, 1995 https://doi.org/10.1007/BF01231606