DOI QR코드

DOI QR Code

Unspecified Event Detection System Based on Contextual Location Name on Twitter

트위터에서 문맥상 지역명을 기반으로 한 불특정 이벤트 탐지 시스템

  • 오평화 (가톨릭대학교 컴퓨터공학과) ;
  • 임준엽 (가톨릭대학교 컴퓨터공학과) ;
  • 윤진영 (가톨릭대학교 컴퓨터공학과) ;
  • 황병연 (가톨릭대학교 컴퓨터정보공학부)
  • Received : 2014.03.10
  • Accepted : 2014.07.14
  • Published : 2014.09.30

Abstract

The advance in web accessibility with dissemination of smart phones gives rise to rapid increment of users on social network platforms. Many research projects are in progress to detect events using Twitter because it has a powerful influence on the dissemination of information with its open networks, and it is the representative service which generates more than 500 million Tweets a day in average; however, existing studies to detect events has been used TFIDF algorithm without any consideration of the various conditions of tweets. In addition, some of them detected predefined events. In this paper, we propose the RTFIDF VT algorithm which is a modified algorithm of TFIDF by reflecting features of Twitter. We also verified the optimal section of TF and DF for detecting events through the experiment. Finally, we suggest a system that extracts result-sets of places and related keywords at the given specific time using the RTFIDF VT algorithm and validated section of TF and DF.

스마트폰의 확산으로 인한 웹 접근성의 발달은 소셜 네트워크를 기반으로 하는 플랫폼 서비스 이용자의 급격한 증가를 이끌어냈다. 그중에서도 개방적인 네트워크를 기반으로 빠른 확산과 강력한 영향력을 보이는 트위터(Twitter)는 하루 평균 5억 건이 넘는 트윗(Tweet)이 생산되는 대표적인 서비스이다. 따라서 트위터를 이용하여 이벤트를 탐지하려는 다양한 연구들이 진행되고 있다. 그러나 기존의 연구들은 이벤트 탐지를 위해 트윗을 구성하는 다양한 조건에 대한 고려 없이 일반 문서와 동일하게 일반적인 TFIDF 알고리즘을 적용하였다. 또한 TF와 DF에 대한 언급이 생략된 채, 사전에 지정한 키워드와 관련된 이벤트를 대상으로 탐지하였다. 이에 본 논문에서는 트위터의 특징을 반영한 TFIDF 변형 알고리즘인 RTFIDF VT를 제안하고, 실험을 통해 이벤트 탐지에 최적인 것으로 검증된 TF와 DF 구간을 밝힌다. 최종 검증된 TF와 DF의 구간과 RTFIDF VT를 적용하여 특정시점을 입력받아 이벤트로 예상되는 지역명들과 이벤트 관련 키워드의 결과 집합을 추출하는 시스템을 제안한다.

Keywords

References

  1. S. Cho, Halla Ilbo [Online]. Available : http://www.ihalla.com/read.php3?aid=1386687600449233044, Dec., 11, 2013.
  2. Y. Lee, Digital Daily [Online]. Available : http://www.ddaily.co.kr/news/article.html?no=112017, Dec., 12, 2013.
  3. B. Jung, Bloter [Online]. Availble : http://www.bloter.net/archives/166065, Oct., 4, 2013.
  4. J. Yoon, S. Kim, B. Lee, and B.-Y. Hwang, "A Correlation Analysis between the Social Signals of Cold Symptoms Extracted from Twitter and the Influence Factors," Journal of Korea Multimedia Society, Vol.16, No.2, pp.667-677, 2013. https://doi.org/10.9717/kmms.2013.16.6.667
  5. T. Sakaki, M. Okzaki, and Y. Matsuo, "Earthquake Shakes Twitter Users : Real Time Event Detection by Social Sensors," Proc. of the 19th Conference on World Wide Web, pp.851-860, 2010.
  6. H. Choi, The Kyunghyang Shinmun [Online]. Available : http://news.khan.co.kr/kh_news/khan_art_view.html?artid=201303122154175&code=930401, Mar., 12, 2013
  7. R. Li, K. H. Lei, R. Khadiwala, and K. C.-C. Chang, "TEDAS : A Twitter-based Event Detection and Analysis System," Proc. of the IEEE 28th International Conference on Data Engineering, pp.1273-1276, 2012.
  8. M. Nagarajan, K. Gomadam, A. P. Sheth, A. Ranabahu, R. Mutharaju, and A. Jadhav, "Spatio Temporal Thematic Analysis of Citizen Sensor Data : Challenges and Experiences," Proc. of the 10th International Conference on Web Information Systems Engineering, pp.539-553, 2009.
  9. J. Yim, S. Kim, J. Yoon, P. Oh, B. Lee, and B.-Y. Hwang, "Detecting Local Events Using Twitter", Proc. of the 40th Korea Computer Congress, pp.248-250, 2013.
  10. Twitter, The Streaming APIsTwitter Developers [Online]. Available : https://dev.twitter.com/docs/streaming-apis, Sep., 24, 2012.
  11. Apache Lucene Korean Analyzer and dictionary, Source Forge [Online] Available : http://sourceforge.net/projects/lucenekorean, Oct., 26, 2013.
  12. S. Lee, H. Kim, "Keyword Extraction from News Corpus using Modified TF-IDF," Journal of Society for e-Business Studies, Vol.14, No.4, pp.59-73, 2009.
  13. http://developer.naver.com/wiki/pages/News
  14. H. Kwak, C. Lee, H. Park, and S. Moon, "What is Twitter, a Social Network or a New Media?," Proc. of the 19th international conference on World Wide Web, pp.591-600, 2010.

Cited by

  1. TRED : Twitter based Realtime Event-location Detector vol.4, pp.8, 2015, https://doi.org/10.3745/KTSDE.2015.4.8.301