Nearest Neighbor Query Processing using the Spherical Pyramid Technique

구형 피라미드 기법을 이용한 최근접 질의 처리 기법

  • Published : 2001.03.01

Abstract

구형 피라미드 기법[1,2]은 d-차원의 공간을 2d개의 구형 피라미드들로 분할하는 특별한 공간 분할 방식을 이용하여 고차원 데이터를 효율적으로 색인할 수 있는 새로운 색인 방법으로 제안되었다. 구형 피라미드 기법은 구형태의 영역질의를 처리하는 알고리즘을 제안하였으나 유사 검색에 많이 사용되는 또 다른 종류의 질의인 최근접 질의를 처리하는 알고리즘을 제안하지 못했다. 본 논문에서는 점진적 최근접 질의 처리 알고리즘을 확장하여 구형피라미드 기법 상에서 효율적으로 최근접 질의를 처리하는 알고리즘을 제안한다. 마지막으로, R*-tree와 X-tree 상에서 구현된 점진적 k-최근접 질의 처리 방법과 다양한 비교 실험을 통하여 구형 피라미드 기법을 이용한 k-최근접 질의 처리 방법이 더 효율적임을 보인다.

Keywords

References

  1. 이동호, 정진완, 김형주, '구형 피라미드 기법 고차원 데이타의 유사성 검색을 위한 효율적인 색인 기법', 한국정보과학회 논문지(B), 25(11), 1999
  2. Dong-Ho Lee, Hyoung-Joo Kim. 'SPY-TEC : An Efficient Indexing Method for Similarity Search in High-Dimensional Data Spaces'. Data & Knowledge Engineering, 34(1), 2000 https://doi.org/10.1016/S0169-023X(00)00009-4
  3. S. Berchtold, D. A. Keim, and H.-P. Kriegel. 'The X-tree: An Indexing Structure for High-Dimensional Data'. Proc. 22nd Int. Conf. on Very Large Database, pages 28-39, September 1996
  4. S. Berchtold, D. Keim, H.-P. Kriegel, and T. Seidl. 'Fast Nearest Neighbor Search in High-Dimensional Spaces'. Proc. 14th Int. Conf on Data Engineering, Orlando, 1998 https://doi.org/10.1109/ICDE.1998.655779
  5. D. A. White, and R. Jain. 'Similarity Indexing with the SS-tree'. Proc. 12th Int. Conf on Data Engineering, pages 516-523, 1996 https://doi.org/10.1109/ICDE.1996.492202
  6. S. Berchtold, C. Bohm, H.-P. Kriegel. 'The Pyramid-Technique: Towards Breaking the Curse of Dimensionality'. Proc. ACM SIGMOD Int. Conf. on Management of Data, 1998 https://doi.org/10.1145/276304.276318
  7. S. Berchtold, C. Bohm, D. A. Keim, and H.-P. Kriegel. 'A Cost Model For Nearest Neighbor Search in High-Dimensional Data Space'. ACM PODS Symposium on Principles of Database Systems, Tucson, Arizona, 1997 https://doi.org/10.1145/263661.263671
  8. C. Faloutsos.'Fast Searching by Content in Multimedia Databases'. Data Engineering Bulletin, 18(4), 1995
  9. J. T. Robinson.'The K-D-B-tree: a Search Structure for Large Multidimensional Dynamic Indexes'. Proc. ACM SIGMOD, Ann Arbor, USA, pages 10-18, April 1981 https://doi.org/10.1145/582318.582321
  10. H. Samet. 'The Design and Analysis of Spatial Data Structures'. Addison-Wesley, 1989
  11. A. Guttman. 'R-trees: a dynamic index structure for spatial searching'. Proc. ACM SIGMOD Int. Conf. on Management of Data, pages 47-57, June 1984 https://doi.org/10.1145/602259.602266
  12. N. Roussopoulos, S. Kelley, F. Vincent. 'Nearest Neighbor Queries'. Proc. ACM SIGMOD, San Jose, CA, pages 71-79, 1995 https://doi.org/10.1145/223784.223794
  13. Gisli R. Hjaltason, Hanan Samet. 'Distance Browsing in Spatial Databases'. ACM Transaction on Database Systems, 24(2):265-318, 1999 https://doi.org/10.1145/320248.320255