• Title/Summary/Keyword: 트윗 분류

Search Result 41, Processing Time 0.026 seconds

Personalized Tweet Recommendation based on Ego-Network (이고-네트워크에 기반한 개인화된 트윗 추천 시스템)

  • Song, Sang-Chul;Hong, Jiwon;Kim, Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.577-579
    • /
    • 2016
  • 트위터 이용자 수 증가로 인해, 유저의 타임라인에 하루 새롭게 기재되는 트윗 수가 급증하는 정보과다 현상이 중요한 이슈로 자리 잡은 지 오래다. 이에 본 논문은 이고-네트워크 정보를 바탕으로 학습 된 분류 시스템을 이용해 각각의 이고 유저마다 트윗 추천에 유리한 추천 방식을 예측하고, 이를 기반으로 선호할만한 트윗을 우선적으로 선별해주는 그래프 기반 트윗 추천 시스템을 제안한다. 실험을 통하여 단일한 추천 방식보다, 최고 11.5% 추천 정확도 성능이 향상함을 확인하였다.

Combining Deep Learning Models for Crisis-Related Tweet Classification (재난관련 트윗 분류를 위한 딥 러닝 결합 모델)

  • Choi, Won-Gyu;Lee, Kyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.649-651
    • /
    • 2018
  • 본 논문에서는 CNN에서 클래스 활성화 맵과 원샷 러닝을 결합하여 트위터 분류를 위한 딥 러닝 모델을 제안한다. 클래스 활성화 맵은 트윗 분류에 대한 분류 주제와 연관된 핵심 어휘를 추출하고 강조 표시하도록 사용되었다. 특히 작은 학습 데이터 셋을 사용하여 다중 클래스 분류의 성능을 향상시키기 위해 원샷 러닝 방법을 적용한다. 제안하는 방법을 검증하기위해 TREC 2018 태스크의 사건 스트림(TREC-IS) 학습데이터를 사용하여 비교실험을 했다. 실험 결과에서 CNN 기본 모델의 정확도는 58.1%이고 제안 방법의 정확도는 69.6%로 성능이 향상됨을 보였다.

  • PDF

Tweet Acquisition System by Considering Location Information and Tendency of Twitter User (트위터 사용자의 위치정보와 성향을 고려한 트윗 수집 시스템)

  • Choi, Woosung;Yim, Junyeob;Hwang, Byung-Yeon
    • Spatial Information Research
    • /
    • v.22 no.3
    • /
    • pp.1-8
    • /
    • 2014
  • While SNS services such as Twitter or Facebook are rapidly growing, research for the SNS analysis has been concerned. Especially, twitter reacts to social issues in real-time so that it is used to get useful experimental data for researchers of social science or information retrieval. However, it is still lack of research on the methodology to collect data. Therefore, this paper suggests the tweet acquisition system by considering tendency of twitter user oriented location-based event and political social event. First the system acquires tweets including information of location and keyword about event and secure IDs for acquisition of political social event. Then we plan ID-analyzer to classify the tendency of users. In addition for measuring reliability of ID-analyzer, it acquires and analyzes the tweet by using high-ranked ID. In analyses result, top-ranked ID shows 88.8% reliability, 2nd-ranked ID shows 76.05% and ID-analyzer shows 77.5%, it shortens collection time by using minority ID.

Sentiment Classification for Korean Tweets via Semi-Supervised Learning (준지도 학습을 이용한 트윗 감정 분류)

  • Seo, Hyeong-Won;Noh, Kyung-Mok;Cheon, Min-A;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.123-125
    • /
    • 2012
  • 본 논문은 기계 학습을 이용한 감정 분류에 필요한 학습 말뭉치를 효율적으로 확장하는 방법에 대하여 기술한다. 학습 말뭉치는 일반적으로 그에 알맞은 레이블을 정해야 하는데, 그 양이 어마어마하기 때문에 이 과정을 일일이 사람이 할 수는 없다. 그에 대한 해결책으로써 이미 많은 준지도학습 방법이 연구되었고, 그것을 트윗이라는 짧은 문서를 감정 분류하는 것에 적용해도 감정 문서 분류기의 성능이 좋다는 결과를 확인하였다.

  • PDF

Analyzing ages, gender, location on Twitter using LDA (LDA를 이용한 트윗 유저의 연령대, 성별, 지역 분석)

  • Lee, Ho-Kyung;Chun, Ju-Ryong;Song, Nam-Hoon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.116-119
    • /
    • 2013
  • 요즘 많은 사람들은 트위터를 통해 짧은 문장의 트윗을 작성하여 자신의 의견이나 생각을 표현한다. 사람들이 작성한 트윗은 사용자의 연령, 성별, 지역에 따라 다른 특성이 담겨있다. 이러한 정보를 이용하여, 기업에서는 연령대, 성별, 지역에 따라 각기 다른 마케팅 전략을 세울 수 있을 것이다. 본 논문에서는 트위터 사용자들의 트윗을 분석하여 연령대, 성별, 지역을 예측하려 한다. 네이버 오픈사전의 자질, 한국전자통신연구원(ETRI)의 개체명 사전을 이용한 자질 및 한국어 형태소 분석, 음절 단위의 bigram을 클래스별 의미 있는 자질로 선택하고 LDA를 이용하여 예측된 확률분포를 활용하여 분류한 결과, 연령 72%, 성별 75%, 지역 43%의 납득할만한 예측 정확도 결과를 얻게 되었다.

  • PDF

Characteristics of Interactions between Fan and Celebrities on Twitter (유명인과의 트위터 매개 상호작용 특성 탐색)

  • Hwang, Yoosun
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.8
    • /
    • pp.72-82
    • /
    • 2013
  • The present study explored types of Twitter-mediated communication and emotional responses of Twitter users toward celebrities. Three perspectives of para-social interactions, information hub, and fandom were proposed as communication types on Twitter. Celebrities were classified by entertainer, politician, specialist, and blogger. Communication patterns according to each category of celebrities were analyzed. The patterns of emotional responses, which represents the use of emoticons and emotional expressions were also analyzed. The results show that the type of para-social interactions was frequently accepted for the interactions with politicians and specialists, while fandom style was salient for the entertainers. For the power bloggers, the users tend to adopt the type of information hub interaction. The use of emotions and emotional expressions were most frequent in case of fandom style communication and the messages to the entertainers. Implications were further discussed.

Real-time Category Trend Extraction Scheme based on Twitter Analysis (트위터 분석을 이용한 카테고리별 실시간 트렌드 추출 기법)

  • Na, ByeongJin;Kim, YongSung;Hwang, EenJun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1581-1584
    • /
    • 2015
  • 최근 소셜 네트워크 서비스상의 데이터를 실시간으로 분석하여 의미있는 정보를 찾아내기 위한 연구가 활발하게 진행되고 있다. 특히, 스마트폰과 같은 스마트 디바이스를 이용하는 많은 사용자들이 실시간으로 발생하는 이벤트를 소셜 네트워크상에 게재하고 서로 공유하면서, 대중들이 관심을 가지는 토픽의 경우 굉장히 빠르게 확산되는 경향을 보이고 있다. 본 논문에서는 이러한 SNS의 특성을 토대로 트위터상의 트윗을 분석하여 여러 분야의 토픽들을 카테고리별로 분류하고, 카테고리별 트렌드를 추출하여 실시간으로 시각화하는 기법을 제안한다. 이를 위해, 트위터를 기반으로 SVM 분류 알고리즘과 Twitter-LDA를 통하여 트윗을 분야별로 분류하고, 각각의 트렌드를 이루는 대표적인 키워드를 선출하여 이를 기반으로 실시간 트렌드를 추출한다. 제안하는 기법의 성능을 평가하기 위해, 분류 특징 선택의 신뢰도를 측정한다.

Improved Tweet Bot Detection Using Geo-Location and Device Information (지리적 공간과 장치 정보를 사용한 개선된 트윗 봇 검출)

  • Lee, Al-Chan;Seo, Go-Eun;Shin, Won-Yong;Kim, Donggeon;Cho, Jaehee
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.19 no.12
    • /
    • pp.2878-2884
    • /
    • 2015
  • Twitter, one of online social network services, is one of the most popular micro-blogs, which generates a large number of automated programs, known as tweet bots because of the open structure of Twitter. While these tweet bots are categorized to legitimate bots and malicious bots, it is important to detect tweet bots since malicious bots spread spam and malicious contents to human users. In the conventional work, temporal information was utilized for the classficiation of human and bot. In this paper, by utilizing geo-tagged tweets that provide high-precision location information of users, we first identify both Twitter users' exact location. Then, we propose a new tweet bot detection algorithm by using both an entropy based on geographic variable of each user and device information of each user. As a main result, the proposed algorithm shows superior bot detection and false alarm probabilities over the conventional result which only uses temporal information.

A Method for Twitter Spam Detection Using N-Gram Dictionary Under Limited Labeling (트레이닝 데이터가 제한된 환경에서 N-Gram 사전을 이용한 트위터 스팸 탐지 방법)

  • Choi, Hyeok-Jun;Park, Cheong Hee
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.6 no.9
    • /
    • pp.445-456
    • /
    • 2017
  • In this paper, we propose a method to detect spam tweets containing unhealthy information by using an n-gram dictionary under limited labeling. Spam tweets that contain unhealthy information have a tendency to use similar words and sentences. Based on this characteristic, we show that spam tweets can be effectively detected by applying a Naive Bayesian classifier using n-gram dictionaries which are constructed from spam tweets and normal tweets. On the other hand, constructing an initial training set requires very high cost because a large amount of data flows in real time in a twitter. Therefore, there is a need for a spam detection method that can be applied in an environment where the initial training set is very small or non exist. To solve the problem, we propose a method to generate pseudo-labels by utilizing twitter's retweet function and use them for the configuration of the initial training set and the n-gram dictionary update. The results from various experiments using 1.3 million korean tweets collected from December 1, 2016 to December 7, 2016 prove that the proposed method has superior performance than the compared spam detection methods.

Real-time Spatial Recommendation System based on Sentiment Analysis of Twitter (트위터의 감정 분석을 통한 실시간 장소 추천 시스템)

  • Oh, Pyeonghwa;Hwang, Byung-Yeon
    • The Journal of Society for e-Business Studies
    • /
    • v.21 no.3
    • /
    • pp.15-28
    • /
    • 2016
  • This paper proposes a system recommending spatial information what user wants with collecting and analyzing tweets around the user's location by using the GPS information acquired in mobile. This system has built an emotion dictionary and then derive the recommendation score of morphological analyzed tweets to provide not just simple information but recommendation through the emotion analysis information. The system also calculates distance between the recommended tweets and user's latitude-longitude coordinates and the results showed the close order. This paper evaluates the result of the emotion analysis in a total of 10 areas with two keyword 'Restaurants' and 'Performance.' In the result, the number of tweets containing the words positive or negative are 122 of the total 210. In addition, 65 tweets classified as positive or negative by analyzing emotions after a morphological analysis and only 46 tweets contained the meaning of the positive or negative actually. This result shows the system detected tweets containing the emotional element with recall of 38% and performed emotion analysis with precision of 71%.