Hybrid Estimation Method for Selecting Heterogeneous Image Databases on the Web

웹상의 이질적 이미지 데이터베이스를 선택하기 위한 복합 추정 방법

  • 김덕환 (동양공업전문대학 인터넷정보과) ;
  • 이석룡 (한국외국어대학교 산업정보시스템공학부) ;
  • 정진완 (한국과학기술원 전자전신학과)
  • Published : 2003.10.01

Abstract

few sample objects and compressed histogram information of image databases. The histogram information is used to estimate the selectivity of spherical range queries and a small number of sample objects is used to compensate the selectivity error due to the difference of the similarity measures between meta server and local image databases. An extensive experiment on a large number of image data demonstrates that our proposed method performs well in the distributed heterogeneous environment.

웹상의 이미지 데이타베이스들은 자치성과 이질성이라는 두 가지 다른 특성을 갖고 있다. 즉 독립적으로 만들어지고 유지되며 질의 처리 방법이 서로 다르다. 분산된 이미지 데이타베이스들에 대한 내용기반 검색에서, 메타 서버의 유사성 측정함수에 대하여 서로 다른 지역 유사성 측정 함수를 갖는 데이터베이스들로부터 주어진 질의 객체와 유사한 객체들을 찾는 능력을 갖는 것은 중요하다. 현재까지, 동일한 유사성 측정 함수들을 사용하는 이미지 데이타베이스들을 선택하는 방법에 대하여 많은 연구가 진행되었으나 이미지 데이타베이스들이 다른 유사성 측정함수를 사용하는 경우에 대한 연구는 없었다. 본 논문에서는 웹상의 많은 이질적인 이미지 데이타베이스들 중 질의에 유사한 객체들을 보다 많이 가지고 있는 데이타베이스들을 찾는 문제를 다룬다. 데이타베이스들의 순위는 이미지 데이타베이스들의 압축된 히스토그램 정보와 적은 수의 표본 객체들을 사용하는 복합 추정에 기반을 두고 있다. 구형 영역 질의에 대한 선택률을 추정하기 위하여 히스토그램 정보를 사용하며, 유사성 측정 함수의 차이로 인한 선택률 오차를 보정하기 위하여 표본 객체들을 이용한다. 많은 수의 이미지 데이타에 대한 상세한 실험은 제안된 방법이 이질적인 분산 환경에서 효율적임을 보여준다.

Keywords

References

  1. R. Crane. Simplified approach to Image Processing, Prentice Hall, 1997
  2. Y. Kanai. Image Segmentation using Intensity and Color Information. Proceedings of the Visual Communications and Image Processing'98, Part 2, pages 709-720, January 1998 https://doi.org/10.1117/12.298383
  3. J. Callan, Z. Lu, and W. Croft. Searching Distributed Collection with Inference Networks. Proceedings of the Eighteenth Annual Int'l ACM/SIGIR Conference, pages 21-28, 1995
  4. L. Gravano, H. Garcia-Molina, Generalizing GIOSS to Vector-Space Databases and Broker Hierarchies. Proceedings of Int'l Conference on Very Large Data Bases, August 1995
  5. W. Meng, K. L. Liu, C. Yu, X. Wang, Y. Chang, N. Rishe. Determining Text Databases to Search in the Internet. Proceedings of Int'l Conference on Very Large Data Bases, pages 14-25, August 1998
  6. W. Meng, K. L. Liu, C. Yu, W. Wu, N. Rishe. Estimating the Usefulness of Search Engines. Proceedings of Int'l Conference on Data Engineering, pages 146-153, March 1999 https://doi.org/10.1109/ICDE.1999.754917
  7. J. Xu, Y. Cao, E.-P. Lim, W.-K. Ng. Database Selection Techniques for Routing Bibliographic Queries. Proceedings of ACM Digital Libraries Int'l Conference, pages 264-273, 1998 https://doi.org/10.1145/276675.276707
  8. B. Yuwono, D.L. Lee. Server Ranking for Distributed Text Retrieval Systems on the Internet. Proceedings of Int'l Conference on DB Systems for Advanced Applications, pages 391-400, 1997
  9. M. Flickner et al., 'Query by image and video content: The QBIC system,' IEEE computer, vol. 28, no. 9, pp. 23-32, 1995 https://doi.org/10.1109/2.410146
  10. J.R. Bach, C. Fuller, A. Gupta, A. Hampapur, B. Horowitz, R. Humphrey, R.C. Jain, and C. Shu, 'The Virage Image Search Engine: An Open Framework for Image Management,' In Proc. SPIE Vol. 2670: Storage and Retrieval for Images and Video Databases IV, pp. 76-86, 1996 https://doi.org/10.1117/12.234785
  11. J.R. Smith, S.F. Chang. Visually Searching the Web for Content. IEEE Multimedia, pages 12-20, Summer 1997 https://doi.org/10.1109/93.621578
  12. J.R. Smith and S.-E. Chang, 'VisualSEEK: A Fully Automated Content-Based Image Query System,' in Proc. ACM Multimedia, pp.87-98, 1996 https://doi.org/10.1145/244130.244151
  13. W. Chang, G. Sheikholeslami, J. Wang, A. Zhang. Data Resource Selection in Distributed Visual Information Systems. IEEE Transactions on Knowledge and Data Engineering, Vol.10, No.6, pages 926-946, November 1998 https://doi.org/10.1109/69.738358
  14. A.B. Benitez, M. Beigi, S.-F. Chang. A Content-Based Image Meta-Search Engine using Relevance Feedback. IEEE Internet Computing, 2 (4), pages 56-69, 1998 https://doi.org/10.1109/4236.707692
  15. J. Callan, M. Connell, A. Du. Automatic Discovery of Language Models for Text Databases. Proceedings of ACM SIGMOD Int'l Conference on Management of Data, pages 479-490, 1999 https://doi.org/10.1145/304182.304224
  16. F. Provost, D. Jensen, T. Oates. Efficient Progressive Sampling. Proceedings of ACM SIGKDD Int'l Conference on Knowledge Discovery and Data Mining, pages 23-32, 1999 https://doi.org/10.1145/312129.312188
  17. D.H. Kim, J,H. Lee, S.L. Lee, C.W. Chung. Heterogeneous Multimedia Database Selection on the Web. Technical Reports, CS/TR-2000-147, Korea Advanced Institute of Science and Technology. Available: http://cs.kaist.ac.kr/library/tr
  18. J. H. Lee, D. H. Kim, C. W. Chung. Multidimensional Selectivity Estimation Using Compressed Histogram Information. Proceedings of ACM SIGMOD Int'l Conference on Management of Data, pages 205-214, June 1999 https://doi.org/10.1145/304182.304200
  19. S. Berchtold, C. Bohm, D.A. Keim, H.-P. Kriegel. A Cost Model for Nearest Neighbor Search in High-Dimensional Data Space. Proceedings of the ACM Symposium on Principles of Database Systems, pages 78-86, June 1997 https://doi.org/10.1145/263661.263671
  20. M.H. Kalos, P.A. WhitRock. Monte Carlo Methods. Wiley, New York
  21. A. Natev, R. Rastogi, K. Shim. WALRUS: A Similarity Retrieval Algorithm for Image Databases. Proceedings of ACM SIGMOD Int'l Conference on Management of Data, pages 395-406, June 1999 https://doi.org/10.1109/TKDE.2003.1262183