DOI QR코드

DOI QR Code

공간 웹 객체의 효율적인 검색 기법

An Efficient Retrieval Technique for Spatial Web Objects

  • 양평우 (군산대학교 컴퓨터정보공학과) ;
  • 남광우 (군산대학교 컴퓨터정보공학과)
  • 투고 : 2014.10.10
  • 심사 : 2014.12.24
  • 발행 : 2015.03.15

초록

공간 웹 객체는 웹 문서에 지리정보를 포함하고 있는 문서들을 말한다. 최근 스마트폰과 같은 장치의 발달로 인하여 공간 웹 객체를 생성하는 서비스가 많이 늘어났다. 트위터나 페이스북 같은 서비스에서는 사용자가 게시한 간단한 글이 게시한 위치정보와 함께 저장된다. 이러한 공간 웹 객체의 검색을 위해서는 공간 정보와 문자 정보를 동시에 이용하는 검색이 필요하다. 기존의 공간 웹 객체 검색 방식은 R트리와 역색인 파일(inverted file) 방법을 많이 사용했다. 하지만 이 방법은 인덱스를 구축하는데 많은 공간을 필요로 한다는 단점이 있다. 또한 검색하는 키워드가 많을 때는 효율적이지만, 검색하는 키워드가 적을 때는 비효율적이다. 본 논문에서는 쿼드 트리(quad-tree)와 패트리샤 트라이(patricia trie)를 이용하는 공간 웹 객체 검색 방식을 제안한다. 제안하는 기법은 검색하는 키워드가 적을 때 기존의 기법보다 좋다는 것을 보여준다. 또한 인덱스를 저장하는 공간이 기존의 기법보다 훨씬 적게 사용된다는 것을 실험을 통하여 증명하였다.

Spatial web objects refer to web documents that contain geographic information. Recently, services that create spatial web objects have increased greatly because of the advancements in devices such as smartphones. For services such as Twitter or Facebook, simple texts posted by users is stored along with information about the post's location. To search for such spatial web objects, a method that uses spatial information and text information simultaneously is required. Conventional spatial web object search methods mostly use R-tree and inverted file methods. However, these methods have a disadvantage of requiring a large volume of space when building indices. Furthermore, such methods are efficient for searching with many keywords but are inefficient for searching with a few keywords.. In this paper, we propose a spatial web object search method that uses a quad-tree and a patricia-trie. We show that the proposed technique is more effective than existing ones in searching with a small number of keywords. Furthermore, we show through an experiment that the space required by the proposed technique is much smaller than that required by existing ones.

키워드

과제정보

연구 과제 주관 기관 : 한국연구재단

참고문헌

  1. Y. Zhou, X. Xie, C. Wang, Y. Gong, and W.-Y. Ma, "Hybrid index structures for location-based web search," CIKM, pp. 155-162, 2005.
  2. R. Hariharan, B. Hore, C. Li, and S. Mehrotra, "Processing Spatial-Keyword (SK) Queries in Geographic Information Retrieval (GIR) systems," SSDBM, pp. 16-25, 2007.
  3. Dingming Wu, Gao Cong, Christian S. Jensen, "A framework for efficient spatial web object retrieval," The VLDB Journal - The International Journal on Very Large Data Bases, Vol. 21, No. 6, pp. 797-822, 2012. https://doi.org/10.1007/s00778-012-0271-0
  4. A. Cary, O. Wolfson, and N. Rishe, "Efficient and scalable method for processing top-k spatial boolean queries," SSDBM, pp. 87-95, Aug. 2010.
  5. Christoforaki, M., He, J., Dimopoulos, C., Markowetz, A., Suel, T., "Text vs. space: efficient geo-search query processing," CIKM, pp. 423-432, 2011.
  6. Y. j. Kim, Jignesh M. Patel, "Performance Comparison of the R*-tree and the Quadtree for kNN and Distance Join Queries," Knowledge and Data Engineering, IEEE Transaction on, Vol. 22, issue. 7, pp. 1014-1027, 2010. https://doi.org/10.1109/TKDE.2009.141
  7. Ravi Kanth V Kothuri, Siva Ravada, Daniel Abugov, "Quadtree and R-tree Indexes in Oracle Spatial: A Comparison using GIS Data," Proc. of the 2002 ACM SIGMOD international conference on Management of data, pp. 545-557, 2002.
  8. I.D. Felipe, V. Hristidis, and N. Rishe, "Keyword Search on Spatial Databases," Proc. IEEE 24th Int'l Conf. Data Eng. (ICDE '08), pp. 656-665, 2008.
  9. G. Cong, C. S.Jensen, and D. Wu, "Efficient retrieval of the top-k most relevant spatial web objects," PVLDB, pp. 337-348, 2009.
  10. Mohamed Y. Eltabakh, Ramy Eltarras, Walid G. Aref, "Space-partitioning Tree in PostgreSQL: Realization and Performance," Proc. of the 22nd Intenational Conference on Data Engineering, pp. 100-111, 2006.
  11. R A Finkel and J L Bentley, "Quad Trees - A Data Structure for Retrieval on Composite keys," Acta informatica, Vol. 4, issue 1, pp. 1-9, 1974. https://doi.org/10.1007/BF00288933
  12. Donald R. Morrison, "PATRICIA-Practical Algorithm To Retrieve Information Coded in Alphanumeric," Journal of the ACM (JACM), Vol. 15, No. 4, pp. 514-534, 1968. https://doi.org/10.1145/321479.321481
  13. Lisi Chen, Gao Cong, Christian S. Jensen, Dingming Wu, "Spatial keyword query processing: an experimental evaluation," Proc. of the VLDB Endowment, Vol. 6, No. 3, pp. 217-218, 2013.
  14. C. Purdy. (2009, June 4). OUP Dictionary Team monitors Twitterer's tweets, [Online]. Available: http://blog.oup.com/2009/06/oxford-twitter