DOI QR코드

DOI QR Code

RTFIDF·VT: a New TF-IDF Algorithm considered Variety of Tweets

RTFIDF·VT: 트윗의 다양성을 고려한 새로운 TF-IDF 알고리즘

  • Oh, Pyeonghwa (Dept of Computer Science and Engineering, The Catholic University of Korea) ;
  • Kim, Seokjung (Dept of Computer Science and Engineering, The Catholic University of Korea) ;
  • Yoon, Jinyoung (Dept of Computer Science and Engineering, The Catholic University of Korea) ;
  • Yim, Junyeob (Dept of Computer Science and Engineering, The Catholic University of Korea) ;
  • Hwang, Byung-Yeon (Dept of Computer Science and Engineering, The Catholic University of Korea)
  • 오평화 (가톨릭대학교 컴퓨터공학과) ;
  • 김석중 (가톨릭대학교 컴퓨터공학과) ;
  • 윤진영 (가톨릭대학교 컴퓨터공학과) ;
  • 임준엽 (가톨릭대학교 컴퓨터공학과) ;
  • 황병연 (가톨릭대학교 컴퓨터공학과)
  • Published : 2013.11.08

Abstract

스마트 폰의 보급으로 웹 접근성이 향상되면서 모바일을 기반으로 성장한 소셜 네트워크 서비스들은 폭발적인 사용자 증가를 이루었다. 그중에서도 트위터는 개방적인 사용자간 네트워크 연결 방식과 강력한 전파능력으로 사용자 개개인이 정보를 생산하고 소비하는 소셜 저널리즘의 형태를 띠며 영향력을 더해가고 있다. 이에 트위터를 이용해 이벤트를 탐지하고자 하는 연구들이 활발히 진행되고 있다. 그러나 이벤트를 탐지할 때 기존의 TF-IDF 알고리즘을 적용할 경우 트위터의 특징을 적절히 반영하지 못하는 문제점이 있다. 본 논문에서는 기존의 TF-IDF 알고리즘에 트위터의 특징을 반영하도록 가중치를 변형하고 여기에 다시 보정계수를 적용하여 새로운 TF-IDF 알고리즘을 제안하였으며 두 번의 이벤트에 적용한 실험을 통해 새로운 알고리즘의 성능향상을 보였다.

Keywords