• 제목/요약/키워드: tweet frequency

검색결과 13건 처리시간 0.026초

트위터에서 트윗 주기와 사용자 속도 사이 관계 (Relationship Between Tweet Frequency and User Velocity on Twitter)

  • 전소영;이알찬;서고은;신원용
    • 한국정보통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.1380-1386
    • /
    • 2015
  • 최근 위치 정보를 제공하는 온라인 소셜 네트워크 서비스들의 급증으로 인해 사용자들의 지리적 위치 데이터의 중요성이 강조되고 있다. 본 논문에서는 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 (geo-tagged tweet) 정보를 활용하여 트위터 사용자들의 정확한 위치와 트윗 전송시각을 알아낸 후, 이를 통해 사용자의 평균 이동속도와 트윗 주기 (tweet frequency) 사이의 관계를 분석한다. 구체적으로, 트윗 빈도수 계산 알고리즘을 소개하며, 결과에 대한 분석은 국가별, 도시별로 나누어 진행한다. 주요 결과로써, 사용자 속도에 따른 트윗 주기가 멱 법칙 분포 (power-law distribution) (또는 Zipf의 법칙 분포, Pareto 분포)를 따름을 보인다. 또한, 미국과 일본에서의 결과를 비교할 때, 일본에서의 분포도 지수가 미국의 경우에 비해 작음을 확인한다.

Term Frequency-Inverse Document Frequency (TF-IDF) Technique Using Principal Component Analysis (PCA) with Naive Bayes Classification

  • J.Uma;K.Prabha
    • International Journal of Computer Science & Network Security
    • /
    • 제24권4호
    • /
    • pp.113-118
    • /
    • 2024
  • Pursuance Sentiment Analysis on Twitter is difficult then performance it's used for great review. The present be for the reason to the tweet is extremely small with mostly contain slang, emoticon, and hash tag with other tweet words. A feature extraction stands every technique concerning structure and aspect point beginning particular tweets. The subdivision in a aspect vector is an integer that has a commitment on ascribing a supposition class to a tweet. The cycle of feature extraction is to eradicate the exact quality to get better the accurateness of the classifications models. In this manuscript we proposed Term Frequency-Inverse Document Frequency (TF-IDF) method is to secure Principal Component Analysis (PCA) with Naïve Bayes Classifiers. As the classifications process, the work proposed can produce different aspects from wildly valued feature commencing a Twitter dataset.

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석 (An Analysis of Relationship Between Word Frequency in Social Network Service Data and Crime Occurences)

  • 김용우;강행봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권9호
    • /
    • pp.229-236
    • /
    • 2016
  • 기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데 어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗 빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

트위터(twitter)에서의 파라벤(parabens) 관련 대중의 인식 변화와 치약내 파라벤에 대한 연구 현황 (Changes in public recognition of parabens on twitter and the research status of parabens related to toothpaste)

  • 오효정;전재규
    • Journal of Korean Academy of Oral Health
    • /
    • 제41권2호
    • /
    • pp.154-161
    • /
    • 2017
  • Objectives: The purpose of this study was to investigate changes in public recognition of parabens on Twitter and the research status of parabens related to toothpaste. Methods: Tweet information between 2010 and October 2016 was collected by an automatic web crawler and examined according to tweet frequency, key words (2012-October 2016), and issue tweet detection analyses to reveal changes in public recognition of parabens on Twitter. To investigate the research status of parabens related to toothpaste, queries such as "paraben," "paraben and toxicity," "paraben and (toothpastes or dentifrices)," and "paraben and (toothpastes or dentifrices) and toxicity" were used. Results: The number of tweets concerning parabens sharply increased when parabens in toothpaste emerged as a social issue (October 2014), and decreased from 2015 onward. However, toothpaste and its related terms were continuously included in the core key words extracted from tweets from 2015. They were not included in key words before 2014, indicating that the emergence of parabens in toothpaste as a social issue plays an important role in public recognition of parabens in toothpaste. The issue tweet analysis also confirmed the change in public recognition of parabens in toothpaste. Despite the expansion of public recognition of parabens in toothpaste, there are only seven research articles on the topic in PubMed. Conclusions: The general public clearly recognized parabens in toothpaste after emergence of parabens in toothpaste as a social issue. Nevertheless, the scientific information on parabens in toothpaste is very limited, suggesting that the efforts of dental scientists are required to expand scientific knowledge related to parabens in oral hygiene measures.

빅데이터 선호도 분석 시스템 설계 (Design of Big Data Preference Analysis System)

  • 손성일;박찬곤
    • 한국멀티미디어학회논문지
    • /
    • 제17권11호
    • /
    • pp.1286-1295
    • /
    • 2014
  • This paper suggests the way that it could improve the reliability about preference of user's feedback by adding weighting factor on sentiment analysis, and efficiently make a sentiment analysis of users' emotional perspective on the big data massively generated on twitter. To solve errors on earlier studies, this paper has improved recall and precision of sensibility determination by using sensibility dictionary subdivided sentiment polarity based on the level of sensibility and given impotance to sensibility determination by populating slang, new words, emoticons and idiomatic expressions not in the system dictionary. It has considered the context through conjunctive adverbs fixed in korean characteristics which are free to the word order. It also recognize sensibility words such as TF(Term Frequency), RT(Retweet), Follower which are weighting factors of preference and has increased reliability of preference analysis considering weight on 'a very emotional tweet', 'a recognised tweet from users' and 'a tweeter influencer'

소셜미디어 위험도기반 재난이슈 탐지모델 (The Detection Model of Disaster Issues based on the Risk Degree of Social Media Contents)

  • 최선화
    • 한국안전학회지
    • /
    • 제31권6호
    • /
    • pp.121-128
    • /
    • 2016
  • Social Media transformed the mass media based information traffic, and it has become a key resource for finding value in enterprises and public institutions. Particularly, in regards to disaster management, the necessity for public participation policy development through the use of social media is emphasized. National Disaster Management Research Institute developed the Social Big Board, which is a system that monitors social Big Data in real time for purposes of implementing social media disaster management. Social Big Board collects a daily average of 36 million tweets in Korean in real time and automatically filters disaster safety related tweets. The filtered tweets are then automatically categorized into 71 disaster safety types. This real time tweet monitoring system provides various information and insights based on the tweets, such as disaster issues, tweet frequency by region, original tweets, etc. The purpose of using this system is to take advantage of the potential benefits of social media in relations to disaster management. It is a first step towards disaster management that communicates with the people that allows us to hear the voice of the people concerning disaster issues and also understand their emotions at the same time. In this paper, Korean language text mining based Social Big Board will be briefly introduced, and disaster issue detection model, which is key algorithms, will be described. Disaster issues are divided into two categories: potential issues, which refers to abnormal signs prior to disaster events, and occurrence issues, which is a notification of disaster events. The detection models of these two categories are defined and the performance of the models are compared and evaluated.

LBSNS를 위한 Virtual Grid 및 필터링기법의 설계 및 구현 (Design and Implementation of Virtual Grid and Filtering Technique for LBSNS)

  • 이은식;조대수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.91-94
    • /
    • 2011
  • 기존의 SNS(Social Networking Service)서비스에 LBS(Location-Based Service)서비스가 부가된 LBSNS(Location-Based Social Networking Service)서비스들이 상용화되면서 큰 인기를 얻고 있다. 트위터는 그러한 서비스의 대표적인 예라고 볼 수 있다. 트위터의 현재 위치기반서비스는 자신이 원하는 지역정보와 상관없는 정보를 구독하게 하는 구조로 되어 있다. 팔로잉한 사용자는 단순히 개인적인 선호도에 의해 지역정보가 추가된 메시지를 트윗하지만 구독하는 입장의 팔로워는 자신이 원하지 않는 지역정보를 받아 볼 수도 있다. 이러한 사항을 개선하기 위해 공간조인을 이용한 필터링 기법이 제안되었다. 필터링 기법을 위한 우선적인 작업은 바로 각각의 사용자와 트윗들에 위치정보가 추가되어져야 한다. 여기서 위치정보는 MBR(Minimum Bounding Rectangle)로 표현된다. 위치정보는 동적속성 또는 정적속성으로 나누어진다. 동적인 경우를 예를 들어보면 사용자가 지속적으로 움직이는 상황을 들 수 있다. 이 때 발생되는 대량의 연속질의는 사용자가 많은 SNS의 특성상 서버에 많은 부하를 줄 수 있다. 본 논문에서는 구글 맵 상에서 Virtual Grid를 생성하여 문제를 해결 하였고 성능 평가 결과 Virtual Grid를 사용하지 않았을 때 보다 질의 발생 빈도수가 줄어들었다.

  • PDF

LBSNS에서 연속 질의 빈도 감소를 위한 가상그리드 기법의 설계 및 구현 (A Design and Implementation of Virtual Grid for Reducing Frequency of Continuous Query on LBSNS)

  • 이은식;조대수
    • 한국정보통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.752-758
    • /
    • 2012
  • 웹 상에서 사용자들 간의 관계(Relation)를 통해 인적 네트워크를 형성할 수 있게 해주는 온라인 서비스를 SNS(Social Networking Services)라고 한다. 최근에는 GPS가 내장된 디지털장치(스마트 폰, 태블릿 PC 등)를 통해 획득한 위치 정보를 SNS에 추가한 LBSNS(Location-Based SNS) 서비스에 대한 관심이 증가하고 있다. 사용자가 원하는 관심지역의 정보만을 구독하는 LBSNS 서비스를 구현하기 위해서는 공간필터링 기법이 요구된다. 공간필터링을 위해서는 트윗에 위치정보를 포함해야 한다. 위치정보는 사용자의 이동에 따라 함께 변하는 동적정보로 표현되거나 최초위치에서 고정되는 정적정보로 표현될 수 있다. 동적 위치정보를 사용할 경우 사용자의 이동에 따라 연속적으로 공간 필터링 질의가 발생하므로 서버에 많은 부하를 줄 수 있다. 본 논문에서는 동적 위치정보로 인해 대량으로 발생하는 연속질의 문제를 해결하기 위해서 가상그리드 기법을 이용한 공간필터링 알고리즘을 제안한다. 성능평가 결과 가상그리드 기법을 활용한 경우 질의 발생빈도 측면에서 최고 93%성능이 개선되었다.

신문기사로부터 추출한 최근동향에 대한 트위터 감성분석 (Twitter Sentiment Analysis for the Recent Trend Extracted from the Newspaper Article)

  • 이경호;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.731-738
    • /
    • 2013
  • 본 논문은 사회의 최근 동향에 대한 여론의 반응을 관찰하기 위한 방법을 나타낸다. 최근 동향을 나타내는 키워드를 신문기사로부터 추출하고, 추출된 키워드를 이용하여 수집된 트윗의 감성 분석을 통해 최근 동향에 대한 여론을 분석한다. 수집된 신문기사를 k-means알고리즘을 이용하여 군집화하고, 군집내의 단어의 출현 빈도를 이용하여 토픽 키워드를 선정하였다. 각 토픽에 대하여 수집된 트윗은 그 토픽 대한 트윗이라는 가정하에 기계학습 방법을 이용하여 긍/부정을 판별하여 감성을 판단하게 하였다. 그리고 이와 같은 가정에 대한 타당성을 검증해 보았다.

Analyzing Dissatisfaction Factors of Weather Service Users Using Twitter and News Headlines

  • Kim, In-Gyum;Lee, Seung-Wook;Kim, Hye-Min;Lee, Dae-Geun;Lim, Byunghwan
    • International Journal of Contents
    • /
    • 제15권4호
    • /
    • pp.65-73
    • /
    • 2019
  • Social media is a massive dataset in which individuals' thoughts are freely recorded. So there have been a variety of efforts to analyze it and to understand the social phenomenon. In this study, Twitter was used to define the moments when negative perceptions of the Korean Meteorological Administration (KMA) were displayed and the reasons people were dissatisfied with the KMA. Machine learning methods were used for sentiment analysis to automatically train the implied awareness on Twitter which mentioned the KMA July-October 2011-2014. The trained models were used to validate sentiments on Twitter 2015-2016, and the frequency of negative sentiments was compared with the satisfaction of forecast users. It was found that the frequency of the negative sentiments increased before satisfaction decreased sharply. And the tweet keywords and the news headlines were qualitatively compared to analyze the cause of negative sentiments. As a result, it was revealed that the individual caused the increase in the monthly negative sentiments increase in 2016. This study represents the value of sentiment analysis that can complement user satisfaction surveys. Also, combining Twitter and news headlines provided the idea of analyzing the causes of dissatisfaction that are difficult to identify with only satisfaction surveys. The results contribute to improving user satisfaction with weather services by efficiently managing changes in satisfaction.