DOI QR코드

DOI QR Code

A Technique for Extracting GeoSemantic Knowledge from Micro-blog

마이크로 블로그기반의 공간 지식 추출 기법연구

  • 하수욱 (충북대학교 데이터베이스연구실, 한국전자통신연구원) ;
  • 남광우 (군산대학교 컴퓨터정보공학과) ;
  • 류근호 (충북대학교 소프트웨어학과)
  • Received : 2012.03.06
  • Accepted : 2012.04.20
  • Published : 2012.04.30

Abstract

Recently international organizations such as ISO/TC211, OGC, INSPIRE (Infrastructure for Spatial Information in Europe) make an effort to share geospatial data using semantic web technologies. In addition, smart phone and social networking services enable community-based opportunities for participants to share issues of a social phenomenon based on geographic area, and many researchers try to find a method of extracting issues from that. However, serviceable spatial ontologies are still insufficient at application level, and studies of spatial information extraction from SNS were focused on user's location finding or geocoding by text mining. Therefore, a study of extracting spatial phenomenon from social media information and converting it into geosemantic knowledge is very usable. In this paper, we propose a framework for extracting keywords from micro-blog, one of the social media services, finding their relationships using data mining technique, and converting it into spatiotemopral knowledge. The result of this study could be used for implementing a related system as a procedure and ontology model for constructing geoseem antic issue. And from this, it is expected to improve the effectiveness of finding, publishing and analysing spatial issues.

최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

Keywords

References

  1. Abel F., Gao Q., Houben G. J. and Tao K., 2011, Semantic Enrichment of Twitter Posts for User Profile Construction on the Social Web, In Proceedings of Extended Semantic Web Conference 2011.
  2. Abrol S., Khan L., 2010, TweetHood: Agglomerative Clustering on Fuzzy k-Closest Friends with Variable Depth for Location Mining, In Proceedings of the IEEE International Conference on Social Computing / IEEE International Conference on Privacy, Security, Risk and Trust, pp.153-160.
  3. Abrol S., Khan L., 2010, TWinner: Understanding News Queries with Geo-content using Twitter, In Proceedings of the 6th Workshop on Geographic Information Retrieval, February 18-19, 2010, Zurich, Switzerland.
  4. Celik I., Abel F. and Houben G. J., 2011, Learning Semantic Relationships between Entities in Twitter, In Proceedings of the 11th International Conference on Web Engineering.
  5. Cheng Z., Caverlee J. and Lee K., 2010, You Are Where You Tweet: A Content-Based Approach to Geo-locating Twitter Users, In Proceedings of the 19th ACM international conference on Information and knowledge management, October 26-30, 2010, Toronto, ON, Canada, pp. 759-768.
  6. Giannella C., Han I., Pei J., Yan X. and Yu P. S., 2003, Mining frequent patterns in data streams at multiple time granularities, In Kargupta H., Joshi A., Sivakumar K. and Yesha Y. (eds.), Next Generation Data Mining, AAAI/MIT.
  7. Hong T. P., Lin C. W. and Wu Y. L., 2008, Incrementally fast updated frequent pattern trees, Expert Systems with Application, Vol. 34, issue 4, pp. 2424-2435. https://doi.org/10.1016/j.eswa.2007.04.009
  8. http://code.google.com/p/opensocial-resources/
  9. http://thenextweb.com/.
  10. http://twitaholic.com/.
  11. http://www.w3.org/TR/owl-time/
  12. https://dev.twitter.com/.
  13. Kreibich C., Crowcroft J., 2004, Honeycomb: creating intrusion detection signatures using honeypots. SIGCOMM Comput. Commun. Rev., 34(1), pp. 51-56. https://doi.org/10.1145/972374.972384
  14. Lee C. H., Wu C. H., Chien T. F., 2011, BursT: A Dynamic Term Weighting Scheme for Mining Microblogging Messages, ISNN 2011, Part III, LNCS 6677, pp. 548-557.
  15. Lee K., Caverlee J. and Webb S., 2010, Uncovering Social Spammers: Social Honypots + Machine Learning, SIGIR 2010, Special Interest Group on Information Retrieval, July 19-23, 2010, Geneva, Switzerland, pp. 435-422.
  16. Mathioudakis M., Koudas N., 2010, TwitterMonitor: Trend Detection over the Twitter Stream, In Proceedings of the 2010 international conference on Management of data, June 06-10, 2010, Indianapolis, Indiana, USA.
  17. Perry M., Herring J., 2010, Draft of Geo-SPARQL - A geographic query language for RDF data, Open GIS Consortium.
  18. Prince M. B., Dahl B. M., Holloway L., Keller A. M. and Langheinrich E., 2005, Understanding how spammers steal your e-mail address: An analysis of the first six months of data from project honey pot. In Proceedings of the Conference on Email and Anti-Spam.
  19. Spitzner L., 2003, The honeynet project: Trapping the hackers. IEEE Security and Privacy, 1(2), pp. 15-23. https://doi.org/10.1109/MSECP.2003.1193207
  20. 안성렬, 2009, FP-tree를 이용한 점진적 연관규칙 추출 기법, 숭실대학교 대학원, 컴퓨터학과 석사학위 논문.
  21. 이헌규, 나동길, 최용훈, 2011, 시간 및 공간마이닝 기술을 이용한 GIS 기반의 홍보우편 시스템 개발, 한국공간정보학회지, 제19권, 제2호 pp. 65-70.
  22. 하수욱, 남광우, 2011, 비구조적 공간정보를 지원하는 개념적 지오시맨틱 웹 서비스 프레임워크의 설계, 한국공간정보학회지, 제19권, 제6호, pp. 91-97.

Cited by

  1. 토픽 모델링을 이용한 트위터 데이터의 공간 분포 패턴 분석 vol.23, pp.2, 2017, https://doi.org/10.26863/jkarg.2017.05.23.2.376