• 제목/요약/키워드: tweet analysis

검색결과 76건 처리시간 0.21초

Fake News Detector using Machine Learning Algorithms

  • Diaa Salama;yomna Ibrahim;Radwa Mostafa;Abdelrahman Tolba;Mariam Khaled;John Gerges;Diaa Salama
    • International Journal of Computer Science & Network Security
    • /
    • 제24권7호
    • /
    • pp.195-201
    • /
    • 2024
  • With the Covid-19(Corona Virus) spread all around the world, people are using this propaganda and the desperate need of the citizens to know the news about this mysterious virus by spreading fake news. Some Countries arrested people who spread fake news about this, and others made them pay a fine. And since Social Media has become a significant source of news, .there is a profound need to detect these fake news. The main aim of this research is to develop a web-based model using a combination of machine learning algorithms to detect fake news. The proposed model includes an advanced framework to identify tweets with fake news using Context Analysis; We assumed that Natural Language Processing(NLP) wouldn't be enough alone to make context analysis as Tweets are usually short and do not follow even the most straightforward syntactic rules, so we used Tweets Features as several retweets, several likes and tweet-length we also added statistical credibility analysis for Twitter users. The proposed algorithms are tested on four different benchmark datasets. And Finally, to get the best accuracy, we combined two of the best algorithms used SVM ( which is widely accepted as baseline classifier, especially with binary classification problems ) and Naive Base.

트위터에서 형성된 정치적 의견 분석을 통한 분화된 공중 연구: 10.26 서울시장 재보궐 선거를 중심으로 (The Study on the Public Typology based on Twitter's Political Opinion Analysis: Focusing on 10.26 by-election of Mayor of Seoul)

  • 홍주현;이창현
    • 한국언론정보학보
    • /
    • 제59권
    • /
    • pp.138-161
    • /
    • 2012
  • 이 연구는 선거 기간 중 캠페인 플랫폼으로서 트위터의 역할을 알아보기 위해 트위터의 정치적 의견을 형식적 내용적 측면에서 분석하고 트위터에서 형성된 공중을 유형화하였다. 서울시장 재보궐 선거 기간 중 TV 토론 직후 개진된 트윗에 대해 내용분석을 실시한 결과 네티즌들은 후보에 대한 감정적인 의견을 확산시키면서 선거 과정에 영향을 미치는 것으로 나타났다. 형식적 측면에서는 '리트윗'이 가장 많았고, 내용적 측면에서는 후보자와 관련된 정보가 제시되지 않는 '단순 반응'이 많았다. 대상에 대한 태도와 대응 방식을 기준으로 공중 을 분류한 결과 지지 후보에 따라 서로 다른 성격의 공중이 형성되었다. 박원순 후보에 호의적인 네티즌의 경우 정권 심판을 위한 '분노의 프레임'을 갖고 있었으며, 이로 인해 박 후보에 대해서는 '열성적 지지공중'의 성격을, 상대 후보에 대해서는 '감성적 비판공중'의 성격을 나타냈다. 반면, 나경원 후보에 호의적인 네티즌의 경우 이명박 정권에 대한 비판을 빗겨가기 위한 '정책적 프레임'을 설정하고 있었으며, 이로 인해 나 후보에 대해서는 '정책지지 공중'의 성격을, 상대 후보에 대해 대해서는 '정책 비판공중'의 성격을 띠었다. TV 토론은 정책 중심으로 진행되었지만 트위터에서 후보자의 정책보다는 토론 태도나 외모 같은 주변적 요소가 쟁점화 되는 등 감성적 반응이 주로 표출되었다. 이미지 중심 매체인 TV와 실시간 상호작용이 가능한 트위터가 결합할 경우 정책보다는 이미지 같은 감성적 측면이 확대 재생산되는 것으로 해석된다. 이 연구는 트위터의 정치적 의견 분석을 통해 캠페인 플랫폼으로서 트위터의 역할을 실증적으로 파악할 수 있는 이론적 틀을 제안했으며, 선거 기간 중 다양한 성격의 공중이 형성된다는 것을 밝히고 있다.

  • PDF

Anatomy of Sentiment Analysis of Tweets Using Machine Learning Approach

  • Misbah Iram;Saif Ur Rehman;Shafaq Shahid;Sayeda Ambreen Mehmood
    • International Journal of Computer Science & Network Security
    • /
    • 제23권10호
    • /
    • pp.97-106
    • /
    • 2023
  • Sentiment analysis using social network platforms such as Twitter has achieved tremendous results. Twitter is an online social networking site that contains a rich amount of data. The platform is known as an information channel corresponding to different sites and categories. Tweets are most often publicly accessible with very few limitations and security options available. Twitter also has powerful tools to enhance the utility of Twitter and a powerful search system to make publicly accessible the recently posted tweets by keyword. As popular social media, Twitter has the potential for interconnectivity of information, reviews, updates, and all of which is important to engage the targeted population. In this work, numerous methods that perform a classification of tweet sentiment in Twitter is discussed. There has been a lot of work in the field of sentiment analysis of Twitter data. This study provides a comprehensive analysis of the most standard and widely applicable techniques for opinion mining that are based on machine learning and lexicon-based along with their metrics. The proposed work is helpful to analyze the information in the tweets where opinions are highly unstructured, heterogeneous, and polarized positive, negative or neutral. In order to validate the performance of the proposed framework, an extensive series of experiments has been performed on the real world twitter dataset that alter to show the effectiveness of the proposed framework. This research effort also highlighted the recent challenges in the field of sentiment analysis along with the future scope of the proposed work.

Who are Tweeting Research Articles and Why?

  • Htoo, Tint Hla Hla;Na, Jin-Cheon
    • Journal of Information Science Theory and Practice
    • /
    • 제5권3호
    • /
    • pp.48-60
    • /
    • 2017
  • The purpose of this paper is to understand the profiles of users and their motivations in sharing research articles on Twitter. The goal is to contribute to the understanding of Twitter as a new altmetric measure for assessing impact of research articles. In this paper, we extended the previous study of tweet motivations by finding out the profiles of twitter users. In particular, we examined six characteristics of users: gender, geographic distribution, academic, non-academic, individual, and organization. Out of several, we would like to highlight here three key findings. First, a great majority of users (86%) were from North America and Europe indicating the possibility that, if in general, tweets for research articles are mainly in English, Twitter as an alternative metric has a Western bias. Second, several previous altmetrics studies suggested that tweets, and altmetrics in general, do not indicate scholarly impact due to their low correlation with citation counts. This study provides further details in this aspect by revealing that most tweets (77%) were by individual users, 67% of whom were nonacademic. Therefore, tweets mostly reflect impact of research articles on the general public, rather than on academia. Finally, analysis from profiles and motivations showed that the majority of tweets (from 42% to 57%) in all user types highlighted the summary or findings of the article indicating that tweets are a new way of communicating research findings.

감성 분석 및 감성 정보 부착 시스템 구현 (Developing a Sentiment Analysing and Tagging System)

  • 이현규;이성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권8호
    • /
    • pp.377-384
    • /
    • 2016
  • 본 연구의 목적은 트위터에서 수집된 트윗들의 감성을 분석하고 각 문장의 감성 정보를 반자동으로 부착하여 감성 말뭉치를 구축할 수 있는 시스템의 구현이다. 트위터 API를 이용해 트윗을 수집한 후 각 트윗이 어떤 감성을 갖는지 감성사전을 이용해 분석한다. 사용자는 감성 분석 결과를 확인하고 누락된 감성 정보를 추가하거나 의존구조 사이에 존재하는 감성 정보를 추가할 수 있다. 감성 정보는 JSON 구조로 부착함으로써 감성 말뭉치 구축 및 활용에 용이하게 하였다. 제안 시스템은 긍정, 부정, 중립 문장에 대한 감성 분석 결과 약 76%의 성능을 보였다.

Identifying Influential People Based on Interaction Strength

  • Zia, Muhammad Azam;Zhang, Zhongbao;Chen, Liutong;Ahmad, Haseeb;Su, Sen
    • Journal of Information Processing Systems
    • /
    • 제13권4호
    • /
    • pp.987-999
    • /
    • 2017
  • Extraction of influential people from their respective domains has attained the attention of scholastic community during current epoch. This study introduces an innovative interaction strength metric for retrieval of the most influential users in the online social network. The interactive strength is measured by three factors, namely re-tweet strength, commencing intensity and mentioning density. In this article, we design a novel algorithm called IPRank that considers the communications from perspectives of followers and followees in order to mine and rank the most influential people based on proposed interaction strength metric. We conducted extensive experiments to evaluate the strength and rank of each user in the micro-blog network. The comparative analysis validates that IPRank discovered high ranked people in terms of interaction strength. While the prior algorithm placed some low influenced people at high rank. The proposed model uncovers influential people due to inclusion of a novel interaction strength metric that improves results significantly in contrast with prior algorithm.

토픽 기반의 트윗 분류를 위한 해시태그 분석 기법 (Hashtag Analysis Scheme for Topic based Tweet Categorization)

  • 김용성;전상훈;유제혁;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.737-740
    • /
    • 2014
  • 최근 SNS 사용자가 급증하면서 매우 다양하고 방대한 양의 글이 여러 종류의 SNS를 통해 생성되고 있다. 그중 트위터는 정보의 전달 및 확산에 상당히 유용한 도구로 사용되고 있다. 이러한 트위터의 사용자 트윗은 뉴스, 음악, 사진, 여행 등 다양한 형태로 등장한다. 또한 트위터는 해시태그라는 사용자 정의 태그를 사용하는데 이는 트윗의 키워드 및 핵심을 쉽게 표현할 수 있도록 해주는 효과적인 수단이다. 최근 상당히 많은 양의 트윗의 생성에도 불구하고 이를 다양한 카테고리별로 분류할 수 있는 연구가 많이 진행되지 않았다. 따라서 본 논문에서는 해시태그를 이용해 트윗의 핵심을 파악하고 수많은 트윗을 다양한 토픽별로 분류할 수 있는 기법을 제안한다. 우선 다양한 카테고리의 인기 해시태그가 포함된 트윗을 수집하고 수집한 트윗에서 해시태그별 키워드를 추출한다. 그리고 코사인 유사도를 통해 해시태그별 내용 유사도를 파악하여 각 카테고리 내의 해시태그가 얼마나 유사한 내용을 지니고 있는지 파악한다. 마지막으로 사용자 트윗이 입력되면 모든 카테고리와 유사도를 비교하여 가장 유사도가 높은 카테고리를 찾아 추천해준다. 제안된 기법을 바탕으로 프로토타입을 구현하고 실험을 통해 성능을 평가한다.

트윗 키워드 네트워크를 이용한 구제역의 감성분석 (Sentiment Analysis of Foot-and-mouth Disease using Tweet Keyword Network)

  • 채희찬;이종욱;최윤아;박대희;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.267-270
    • /
    • 2018
  • 구제역으로 인하여 국내 축산업계 및 관련 산업분야는 매년 막대한 피해를 입고 있다. 구제역과 관련한 다양한 학술적 연구들이 현재 진행되고는 있으나, 구제역의 발병에 따른 사회적 파급효과에 관한 공학적 분석 연구는 매우 제한적이다. 본 연구에서는 구제역에 관한 일반 시민들의 감성적 반응을 텍스트 마이닝 방법론을 사용하여 분석하는 체계적인 방법론을 제안한다. 제안하는 시스템은 먼저, 트위터에 게시된 트윗 중 구제역과 관련된 데이터를 수집한 후, 감성사전을 기반으로 극성탐지 과정을 거친다. 둘째, 토픽 모델링의 대표적인 기법 중 하나인 LDA를 활용하여 트윗으로 부터 키워드들을 추출하고, 추출된 키워드들로부터 극성별 동시출현 키워드 네트워크를 구성한다. 셋째, 키워드 네트워크을 통해 각 구간별 구제역의 사회적 파급효과를 분석한다. 사례 분석으로써, 2010년 7월부터 2011년 12월까지 국내에서 발생한 구제역에 관한 일반 시민들의 감성적 변화를 분석하였다.

RDNN: Rumor Detection Neural Network for Veracity Analysis in Social Media Text

  • SuthanthiraDevi, P;Karthika, S
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.3868-3888
    • /
    • 2022
  • A widely used social networking service like Twitter has the ability to disseminate information to large groups of people even during a pandemic. At the same time, it is a convenient medium to share irrelevant and unverified information online and poses a potential threat to society. In this research, conventional machine learning algorithms are analyzed to classify the data as either non-rumor data or rumor data. Machine learning techniques have limited tuning capability and make decisions based on their learning. To tackle this problem the authors propose a deep learning-based Rumor Detection Neural Network model to predict the rumor tweet in real-world events. This model comprises three layers, AttCNN layer is used to extract local and position invariant features from the data, AttBi-LSTM layer to extract important semantic or contextual information and HPOOL to combine the down sampling patches of the input feature maps from the average and maximum pooling layers. A dataset from Kaggle and ground dataset #gaja are used to train the proposed Rumor Detection Neural Network to determine the veracity of the rumor. The experimental results of the RDNN Classifier demonstrate an accuracy of 93.24% and 95.41% in identifying rumor tweets in real-time events.

소셜 빅데이터를 활용한 영화촬영지 관광자원화 방안 -전주 지역의 관광체험 SNS 동향 분석을 토대로- (A Study on Tourism Resource Strategy of Film Location using Social Bigdata based on SNS Trend Analysis of Jeonju Area)

  • 박지영;김건;김찬영;오효정
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.477-487
    • /
    • 2016
  • 1995년 드라마 <모래시계> 촬영지가 유명 관광지로 각광받고 수많은 관광객들을 불러 모은 이후, 각 지자체는 영화 드라마 촬영을 유치하고자 다양한 노력을 기울이고 있다. 지자체 중에서도 특히 전주시는 국제영화제 개최, 전주영상위원회 및 전주영화종합촬영소 설립 등 촬영을 유치하고자 적극적으로 노력하고 있다. 그러나 이러한 풍부한 기반 환경을 갖췄음에도 불구하고, 촬영 이후에 이를 장기적으로 활용하고자 하는 노력은 타 도시에 비해 미흡한 실정이다. 본 연구에서는 이와 같은 한계를 보완하기 위하여 대표적인 SNS(Social Network Service)인 트위터(twitter)를 대상으로 특정 구문을 포함한 트윗을 수집, 그 추이를 분석하였다. 이러한 트윗 멘션의 내용 분석을 통해, 본 연구는 전주 지역의 촬영지와 관광지에 실제로 방문하는 관광객의 주요 방문 요인을 알아보고, 나아가 촬영지의 관광자원화를 위한 방안을 제안하였다.