• 제목/요약/키워드: tweet

검색결과 116건 처리시간 0.026초

Term Frequency-Inverse Document Frequency (TF-IDF) Technique Using Principal Component Analysis (PCA) with Naive Bayes Classification

  • J.Uma;K.Prabha
    • International Journal of Computer Science & Network Security
    • /
    • 제24권4호
    • /
    • pp.113-118
    • /
    • 2024
  • Pursuance Sentiment Analysis on Twitter is difficult then performance it's used for great review. The present be for the reason to the tweet is extremely small with mostly contain slang, emoticon, and hash tag with other tweet words. A feature extraction stands every technique concerning structure and aspect point beginning particular tweets. The subdivision in a aspect vector is an integer that has a commitment on ascribing a supposition class to a tweet. The cycle of feature extraction is to eradicate the exact quality to get better the accurateness of the classifications models. In this manuscript we proposed Term Frequency-Inverse Document Frequency (TF-IDF) method is to secure Principal Component Analysis (PCA) with Naïve Bayes Classifiers. As the classifications process, the work proposed can produce different aspects from wildly valued feature commencing a Twitter dataset.

도시 지역 트윗 데이터의 시간대별 공간분포 특성 - 부산광역시를 사례로 - (A Study on the Spatial Patterns of Tweet Data for Urban Areas by Time - A Case of Busan City -)

  • 구자용
    • 지적과 국토정보
    • /
    • 제46권2호
    • /
    • pp.269-281
    • /
    • 2016
  • 최근 공간 정보 분야에서 소셜 미디어와 같은 공간 빅 데이터의 분석과 처리에 많은 관심이 집중되고 있다. 본 연구에서는 공간 빅 데이터 분석의 한 사례로서 트윗 데이터가 가지고 있는 위치 정보와 시간 정보를 바탕으로 시간대별로 공간분포를 분석하고 그 특성을 파악하였다. 부산시 지역의 트윗 데이터를 수집하고, 시간대별 공간분석을 통하여 그 특성을 파악하여, 그 지역의 토지이용 특성과 비교하였다. 부산시 지역의 트윗 데이터를 시간대에 따라 평일 주간, 평일 야간, 휴일 주간, 휴일 야간으로 구분하고, 각 시간대별로 공간적 분포 특성을 파악하여, 공간적으로 집중된 지역의 토지이용 특성과 비교하였다. 본 연구의 결과 트윗 데이터는 시간대에 따라 공간분포가 다르게 나타나고 있으며, 이는 그 지역의 일상생활 패턴과 토지이용 특성을 어느 정도 반영하고 있었다. 본 연구에서는 공간정보 분야에서 트윗 데이터와 같은 소셜 미디어 자료의 분석을 통한 활용 가능성을 제시하였다. 향후 토지 계획이나 도시 계획 등의 분야에서 다양한 소셜 미디어 자료를 활용할 수 있을 것으로 전망된다.

타임라인데이터를 이용한 트위터 사용자의 거주 지역 유추방법 (Location Inference of Twitter Users using Timeline Data)

  • 강애띠;강영옥
    • Spatial Information Research
    • /
    • 제23권2호
    • /
    • pp.69-81
    • /
    • 2015
  • SNS사용자의 거주 지역을 유추하여 그들이 생성한 데이터에 거주위치를 부여하는 것은 위치희박(location sparsity)과 생태학적 오류문제로 인해 연구결과의 신뢰성이 떨어진다는 평가를 받아온 공간빅데이터 연구에 대안이 될 수 있다. 본 연구에서는 Tweet 사용자의 거주 지역을 유추하는 방법으로 사용자 타임라인데이터 속에서 찾아낸 일상생활활동패턴을 이용하는 방법을 고안하였다. 트윗 사용자의 일상생활활동패턴은 이동궤적과 사용자의 언어(text)에서 확인할 수 있었으며 전자를 활용한 모델을 일상이동패턴모델, 후자를 활용한 모델을 일상 활동장 모델이라 명명하고 각각 모델에 입력될 변수를 선정하였다. 자신의 거주 지역에서 가장 높은 빈도의 트윗 발생 여부와 가장 높은 빈도의 거주행정구역 표현 단어를 사용하는지 아닌지를 종속변수로 한 판별분석을 실시하여 모델을 작성하였으며 설명력은 일상 이동패턴모델, 일상 활동장 모델 각각 67.5%, 57.5%였다. 이 모델을 스트레스 관련 트윗을 작성한 사용자의 타임라인데이터로 구성된 테스트데이터에 입력해본 결과 전체 사용자 48,235명 중 5,301명의 거주 지역을 유추하였고 이를 활용하여 위치 부여된 스트레스 관련 트윗 9,606개를 확보하였다. 본 연구의 유추기법을 통해 기존 SNS데이터 분석연구에서 사용하는 데이터 수집 방법보다 44배 많은 위치 부여 트윗을 확보할 수 있었다. 본 연구방법론은 SNS데이터를 이용한 연구에서 위치 부여된 데이터를 확보하는데 활용 가능할 것으로 판단되며, 각종 지역통계와 상관관계파악을 통해 지역적 현상 분석에도 SNS데이터를 이용할 수 있는 가능성을 높일 것으로 판단된다.

메시지 특성, 행위의 결과, 추구 가치에 기반한 리트윗 행위 : 래더링 기법을 이용한 탐색적 연구 (Message Attributes, Consequences, and Values in Retweet Behavior : Based on Laddering Method)

  • 김효동
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.131-140
    • /
    • 2013
  • 이 연구는 트윗과 리트윗 행위가 기존 매스미디어의 기능을 제한적으로 대체한다고 가정하고, 트위터 사용자의 리트윗 행위에 내재한 동기를 파악하는 것을 목적으로 하였다. 래더링 방법을 이용하여 트윗된 메시지의 속성 (Attributes), 리트윗을 함으로써 얻는 결과(Consequences), 그리고 이를 통해서 궁극적으로 추구하는 가치(Values)에 대한 참가자들의 응답을 토대로 질적인 데이터를 구성하고, 여기에서 떠오르는 중요한 테마들(theme)을 기록, 분석했다. 그 결과 리트윗의 이유로 두드러지는 것은 공감과 공유를 통한 자기만족의 가치였고, 이를 위해서 화제성과 정보성이 포함된 트윗 메시지들을 리트윗하는 경향이 많다는 것을 밝혔다. 또 다른 테마로는 공감과 공유를 통해서 남들에게 필요한 도움을 직, 간접적으로 주고자 하는 이타적인 목적과 사회발전추구, 공동체적 의식 등의 공동체적 가치 또한 발견되었다. 연구결과 추출된 총 48항목은 요인분석을 이용하여 몇 개의 잠재변인으로 나눌 수 있는가를 살펴보는 후속연구에 사용되었다.

효과적인 정보전달을 지원하는 스마트 리트윗의 설계 (A Design of Smart Retweet Supporting the Efficient Information Transfer)

  • 정도성;조대수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.252-255
    • /
    • 2011
  • 스마트폰 수요 급증과 데이터 통신의 제약이 줄어들면서 스마트폰 자체보다 트위터(twitter)와 페이스북(facebook)이 관심의 대상이 되었다. 페이스북 사용자들은 관계 맺음에 있어서 상대방의 동의를 얻어야 하는 반면에, 트위터는 절차가 비교적 단순하기에 정보 파급력이 뛰어나다. 트위터는 단순한 소셜 네트워크 서비스를 넘어 대중의 미디어의 하나로 자리 잡고 있고 리트윗(retweet)이라는 강력한 기능을 가지고 있다. 리트윗은 자신이 공감 가는 타인의 트윗(tweet)을 자신의 구독자들에게 보내는 기능으로 정보를 빠르게 확산 시킬 수 있다. 본 연구에서는 기존의 리트윗을 확장 시켜 시스템 능동적으로 리트윗을 하는 스마트 리트윗(smart retweet)을 제안한다. 스마트 리트윗을 실현하기 위해서는 리트윗 대상을 결정하는 기준과 추가의 정보가 요구된다. 트윗을 생성한 지역 또는 트윗에서 언급하는 지역정보를 기반으로 리트윗 대상을 결정한다. 스마트 리트윗을 통해 정보전달의 속도와 범위가 확장될 것으로 기대된다.

  • PDF

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석 (An Analysis of Relationship Between Word Frequency in Social Network Service Data and Crime Occurences)

  • 김용우;강행봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권9호
    • /
    • pp.229-236
    • /
    • 2016
  • 기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데 어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗 빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

트위터를 통한 제조 기업의 부정적 구전 확산: 공급사슬 리스크 관점에서 (Spread of Negative Word-of-mouth of Manufacturing Companies Via Twitter: From the Supply Chain Risk's Perspective)

  • 정의범;유한나
    • 한국산업정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.79-94
    • /
    • 2021
  • 소셜 미디어상의 부정적 구전에 대한 기업의 공급사슬 리스크의 중요성과 심각성에도 불구하고 관련된 연구는 미흡한 실정이다. 이에 본 연구는 제품의 부정적 구전이 소셜 미디어를 통해 어떻게 유통되는지, 부정적 구전의 유통과 확산에 영향을 주는 주체의 특징은 무엇인지를 사회적 교환이론에 기초하여 분석하였다. 이를 위해 트위터를 이용해 미국도로교통안전국(NHTSA)에서 4개 자동차 기업의 자동차 리콜 정보를 수집하였다. 최초 트위터(Seed tweet)를 바탕으로 부정적 구전의 유통과 확산을 살펴보기 위한 RT(Re-tweet) 네트워크를 구조를 분석하여 부정적 구전 네트워크의 특징을 파악하고, 초기 유포자의 특성이 부정적 구전 확산에 미치는 영향을 분석하였다. 그 결과 부정적 구전은 다수 이용자와 연결된 허브 이용자를 중심으로 확산하는 스몰월드 네트워크 구조임을 확인하였으며, 초기 유포자의 영향력이 크고 상호호혜성이 높을수록 부정적 구전 확산의 속도와 규모가 유의미하게 증가함을 발견하였다.

트위터(twitter)에서의 파라벤(parabens) 관련 대중의 인식 변화와 치약내 파라벤에 대한 연구 현황 (Changes in public recognition of parabens on twitter and the research status of parabens related to toothpaste)

  • 오효정;전재규
    • Journal of Korean Academy of Oral Health
    • /
    • 제41권2호
    • /
    • pp.154-161
    • /
    • 2017
  • Objectives: The purpose of this study was to investigate changes in public recognition of parabens on Twitter and the research status of parabens related to toothpaste. Methods: Tweet information between 2010 and October 2016 was collected by an automatic web crawler and examined according to tweet frequency, key words (2012-October 2016), and issue tweet detection analyses to reveal changes in public recognition of parabens on Twitter. To investigate the research status of parabens related to toothpaste, queries such as "paraben," "paraben and toxicity," "paraben and (toothpastes or dentifrices)," and "paraben and (toothpastes or dentifrices) and toxicity" were used. Results: The number of tweets concerning parabens sharply increased when parabens in toothpaste emerged as a social issue (October 2014), and decreased from 2015 onward. However, toothpaste and its related terms were continuously included in the core key words extracted from tweets from 2015. They were not included in key words before 2014, indicating that the emergence of parabens in toothpaste as a social issue plays an important role in public recognition of parabens in toothpaste. The issue tweet analysis also confirmed the change in public recognition of parabens in toothpaste. Despite the expansion of public recognition of parabens in toothpaste, there are only seven research articles on the topic in PubMed. Conclusions: The general public clearly recognized parabens in toothpaste after emergence of parabens in toothpaste as a social issue. Nevertheless, the scientific information on parabens in toothpaste is very limited, suggesting that the efforts of dental scientists are required to expand scientific knowledge related to parabens in oral hygiene measures.

국내 공공도서관의 트위터 이용에 관한 내용분석 (A Content Analysis on the Domestic Public Libraries' Use of Twitter)

  • 심지영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.241-262
    • /
    • 2017
  • 본 연구에서는 국내 공공도서관의 트위터 이용을 파악하고 분석하고자 한다. 도서관 정보서비스 환경에서 트위터 이용의 구체적인 패턴을 파악하기 위해, 트위터 이용이 활발한 14개 공공도서관 계정으로부터 3,038개의 트윗 데이터를 수집하여 내용분석을 수행하였다. 귀납적 방식으로 코딩 체계를 수립하였으며, 오픈 코딩 방식을 통해 공공도서관 트윗 데이터를 분석하였다. 또한 도서관별로 활성화된 유형을 파악하기 위해 대응일치분석을 수행하였다. 그 결과, 공공도서관 트위터 이용에 관한 상위 범주 3개와 9개의 하위 범주, 37개의 세부 항목을 파악하였다. 본 연구의 내용분석 결과는 향후 트위터 이용을 계획하는 도서관에게 참고자료로 제시될 수 있으리라 본다.

트위터 데이터 수집을 위한 동적 시드 선택 (Dynamic Seed Selection for Twitter Data Collection)

  • 이현철;변창현;김양곤;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.217-225
    • /
    • 2014
  • 트위터와 같은 소셜 네트워크 분석은 인간의 행동을 이해하거나, 화제가 되는 주제를 탐지하거나, 영향력 있는 사람을 식별하거나, 커뮤니티나 그룹을 발견하는데 흥미로운 시각을 제공할 수 있다. 하지만 소셜 네트워크가 가지는 특성(즉 데이터가 방대하고, 정교하지 않으며 또한 동적인 특성)으로 인하여 소셜 네트워크에서 주제와 연관이 있는 데이터를 수집하는 것은 어려운 일이다. 본 논문은 주어진 주제와 관련 있는 트윗을 효과적으로 수집하기 위하여 시드 노드를 동적으로 선택하는 알고리즘을 제안한다. 본 알고리즘은 사용자의 영향력을 측정하기 위하여 사용자 속성을 활용하며, 수집 프로세스 중에 시드 노드를 동적으로 할당한다. 우리는 제안한 알고리즘을 실제 트윗 데이터에 적용하였으며, 만족할 만한 성능결과를 얻었다.