DOI QR코드

DOI QR Code

Techniques for Location Mapping and Querying of Geo-Texts in Web Documents

웹 문서상의 공간 텍스트 위치 맵핑과 질의 기법

  • Received : 2022.01.25
  • Accepted : 2022.04.20
  • Published : 2022.06.30

Abstract

With the development of web technology, large amounts of web documents are being produced. This web document contains various spatial texts, and by converting these texts into spatial information, it is the basis for searching for text documents with spatial query. These spatial texts consist of a wide range of areas, including postal codes and local phone numbers, as well as administrative place names and POI names. This paper presents algorithms that can map locations based on spatial text information existing within web documents. Through these algorithms, web documents can be searched for documents describing the region on a map rather than a general web search. In this paper, we demonstrated the presented algorithms are useful by implementing a web geo-text query system.

웹 기술의 발전과 함께 대량의 웹 문서들이 생산되고 있다. 이 웹 문서에는 다양한 공간적 텍스트들을 포함하고 있으며, 이 텍스트들을 공간정보로 변환함으로서 공간질의로 텍스트 문서를 검색할 수 있는 기반이 된다. 이러한 공간 텍스트들에는 행정지명이나 관심 지역(POI)이름 뿐만이 아니라 우편번호나 지역 전화번호 등까지 폭넓은 영역으로 구성되어 있다. 이 논문은 웹 문서내 내에 존재하는 공간 텍스트 정보를 기반으로 위치를 맵핑 할 수 있는 알고리즘들을 제시하고 있다. 이 알고리즘들을 통해 웹 문서들을 일반 웹 단어 기반 문서 검색 뿐만 아니라, 지도상에서 공간 영역과 텍스트의 복합형태로 해당 지역을 설명하는 문서들을 검색할 수 있게 된다. 마지막으로 이 논문에서는 제안된 알고리즘들을 이용하여 웹 공간 텍스트 질의 시스템을 구현함으로써 유용함을 보였다.

Keywords

Acknowledgement

이 연구는 2020년도 정부(교육부)의 재원으로 한국연구재단의 기초연구사업(No.2020R1F1A1048432)과 2021년 한국국토정보공사 공간정보연구원의 산학협력 R&D 지원사업 자유과제 지원에 의하여 수행된 연구임

References

  1. Borges, K.A.V. (2006). Use of an ontology of urban places for recognition and extraction of geospatial evidences on the web(in Portuguese). PhD Thesis, Federal University of Minas Gerais: Belo Horizonte(MG), Brazil.
  2. Borges, K. A. V., Laender, A. H. F. , Medeiros, C. Bauzer , Davis, C. A. (2007). Discovering geographic locations in web pages using urban addresses. GIR. 31-36.
  3. Borges, K. A. V., Davis, C. A., Laender, A. H. F., and Medeiros, C. B. (2011). Ontology-driven discovery of geospatial evidence in web pages. GeoInformatica, 15(4) 609-631.
  4. Cong, G., Jensen, C. S., Wu, D. (2009). Efficient retrieval of the top-k most relevant spatial web objects. PVLDB, 2(1), 337-348.
  5. Chen, Y., Suel, T., Markowetz, A. (2006). Efficient query processing in geographic web search engines. SIGMOD, 277-288.
  6. Cui, N., Li, J., Yang, X., Wang, B., Reynolds, M., and Xiang, Y. (2019). When geo-text meets security: Privacy-preserving boolean spatial keyword queries. Proceedings - International Conference on Data Engineering 2019-April 1046-1057.
  7. Dongjoo, L., Yeon, J., Hwang, I., and Lee, S. (2010). KKMA : A tool for utilizing Sejong corpus based on relational database. Journal of KIISE: Computing Practices and Letters 16(11) 1046-1050.
  8. Embley, D. W., Campbell, D. M., Jiang, Y. S., Liddle, S. W., Lonsdale, D. W., Ng, Y. K., and Smith, R. D. (1999). Conceptual-model based data extraction from multiple-record Web pages. Data and Knowledge Engineering 31(3) 227-251. https://doi.org/10.1016/S0169-023X(99)00027-0
  9. Ha, T. S. (2010). Location mapping techniques for textual spatial information based on spatial web ontology(Masters dissertation). Kunsan National University, Gunsan, Korea.
  10. Hu, Y. (2018). Geo-text data and data-driven geospatial semantics. Geography Compass 12(11).
  11. Laender, A. H. F., Ribeiro-Neto, B. A., Da Silva, A. S., and Teixeira, J. S. (2002). A brief survey of web data extraction tools. SIGMOD Record, 31(2), 84-93. https://doi.org/10.1145/565117.565137
  12. Lee, J. H. (2018). Building an SNS crawling system using Python. Journal of the Korea Industrial Information Systems, 23(5), 61-76.
  13. Lee, T. (2020). A study on analysis of topic modeling using customer reviews based on sharing economy: focusing on sharing parking. Journal of the Korea Industrial Information Systems, 25(3), 39-51.
  14. Ma, C., Zhao, Y., AL-Dohuki, S., Yang, J., Ye, X., Kamw, F., and Amiruzzaman, M. (2020). GTMapLens: Interactive lens for geo-text data browsing on map. Computer Graphics Forum, 39(3), 469-481. https://doi.org/10.1111/cgf.13995
  15. McCurley, K. S. (2001). Geospatial mapping and navigation on the web. In Proc. of the Tenth Int'l World Wide Web Conference. 221-229.
  16. Moon, C. B., Lee, J. Y., and Kim, B. M. (2019). Multimedia contents recommendation method using mood vector in social networks. Journal of the Korea Industrial Information System, 23(5), 11-24.
  17. Rahimi, A., Cohn, T., and Baldwin, T. (2015). Twitter user geolocation using a unified text and network prediction model. ACL-IJCNLP, 630-636.
  18. Yang, D. H, and Kim, Y. S. (2009). Evoluation of IS: geospatial web & u-GIS, Journal of Internet Computing and Services, 9(1), 44-55.