DOI QR코드

DOI QR Code

의견 어구의 구문 관계를 고려한 트위터 의견 검색

Opinion Retrieval in Twitter Considering Syntactic Relations of Sentiment Phrase

  • 김윤성 (고려대학교 컴퓨터전파통신공학과) ;
  • 양민철 (고려대학교 컴퓨터전파통신공학과) ;
  • 이승욱 (삼성전자) ;
  • 임해창 (고려대학교 컴퓨터전파통신공학과)
  • 투고 : 2014.05.07
  • 심사 : 2014.06.19
  • 발행 : 2014.09.15

초록

본 연구에서는 대중적인 소셜 네트워크 서비스 중 하나이며 많은 사람들이 다양한 의견을 공유하는 트위터를 대상으로 질의어(또는 주제어)에 적합한 의견을 지닌 트윗을 검색하는 방법론을 제안한다. 기존의 의견 검색 시스템은 의견을 지닌 구절이 주어진 질의어나 화자와 관련이 없음에도 불구하고 그런 구절의 유무를 중요한 요소로 여겼다. 이와 같은 문제를 해결하기 위하여 본 연구에서는 1) 의견 어구-질의어 관계, 2) 의견 어구-화자 관계, 그리고 3) 의견 어구의 의존 구문 역할 등의 구문 요소를 반영하는 방법을 고안하였다. 또한, 의견을 가진 트윗을 검색하기 위하여 질의어와의 적절성, 텍스트 정보, 사용자 정보, 트위터 특화 자질에 기반한 랭킹 학습 방법을 이용하였다. 실제 데이터를 이용한 실험 결과, 본 시스템은 기존 연구들보다 더 좋은 성능을 보이고 있다.

In this paper, we propose a method of retrieving opinioned tweets in Twitter, which is the one of the popular Social Network Services and shares diverse opinions among various users. In typical opinion retrieval systems, they may consider the presence of sentiment phrases (subjectivity) as the important factor even if the subjective phrases are not related to a given query or speaker. To alleviate these problems, we utilized the syntactic structure of a sentence to identify the relationships between 1) subjectivity-query and 2) subjectivity-speaker and 3) the syntactic role of subjectivity. Besides, our learning-to-rank approach is trained to retrieve opinioned tweets based on query-relevance, textual features, user information, and Twitter-specific features. Experimental results on real world data show that our proposed method can achieve better performance than several baseline methods in terms of precision and nDCG.

키워드

과제정보

연구 과제 주관 기관 : 한국연구재단

참고문헌

  1. G. H. Lee, K. J. Lee, "Twitter Sentiment Analysis for the Recent Trend Extracted from the Newspaper Article," KIPS Transactions on Software and Data Engineering, Vol. 2, No. 10, pp. 731-738, 2013. https://doi.org/10.3745/KTSDE.2013.2.10.731
  2. W. Zhang, C. Yu, and W. Meng, "Opinion Retrieval from Blogs," Conference on Information and Knowledge Management (CIKM), pp. 831-840, 2007.
  3. M. Zhang, and X. Ye, "A Generation Model to Unify Topic Relevance and Lexicon-based Sentiment for Opinion Retrieval," SIGIR, pp. 411-418, 2008.
  4. X. Huang and W. B. Croft, "A unified relevance model for opinion retrieval," Conference on Information and Knowledge Management (CIKM), pp. 947-956, 2009.
  5. S. W. Lee, Y. I. Song, J. T. Lee, Kyoung-Soo Han, and Hae-Chang Rim, "A new generative opinion retrieval model integrating multiple ranking factor," Journal of Intelligent Information System, pp. 487-505, 2012.
  6. S. Gerani, M. J. Carmen, and F. Crestani, "Proximity-Based Opinion Retrieval," SIGIR, pp. 403-410, 2010.
  7. Z. Luo, M. Osborne, and T. Wang, "Opinion Retrieval in Twitter," Proceedings of the Sixth International AAAI Conference on Weblogs and Social Media, pp. 507-510, 2012.
  8. W. Zhang, and C. Yu, "UIC at TREC 2006 Blog Track," In TREC 2006: Proceedings of the Fifteenth Text TRtrieval Conference, Gaithersburg, Maryland, USA.
  9. T. Joachim, "Generating Typed Dependency Parses from Phrase Structure Parses," Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 133-142, 2002.
  10. T. Wilson, J. Wiebe, and P. Hoffmann, "Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis," Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing, pp. 347-354, 2005.
  11. M. Marneffe, B. MacCartney and C. D. Manning, "Generating Typed Dependency Parses from Phrase Structure Parses," LREC, 2006.
  12. L. Jiang, M. Yu, M. Zhou, X. Liu, and T. Zhao, "Target-dependent Twitter Sentiment Classification," Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, pp. 151-160, 2011.
  13. X. Meng, F. Wei, X. Liu, M. Zhou, S. Li, and H. Wang, "Entity-Centric Topic-Oriented Opinion Summarization in Twitter," Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 379-387, 2012.