• 제목/요약/키워드: tweet analysis

검색결과 75건 처리시간 0.023초

빅데이터 선호도 분석 시스템 설계 (Design of Big Data Preference Analysis System)

  • 손성일;박찬곤
    • 한국멀티미디어학회논문지
    • /
    • 제17권11호
    • /
    • pp.1286-1295
    • /
    • 2014
  • This paper suggests the way that it could improve the reliability about preference of user's feedback by adding weighting factor on sentiment analysis, and efficiently make a sentiment analysis of users' emotional perspective on the big data massively generated on twitter. To solve errors on earlier studies, this paper has improved recall and precision of sensibility determination by using sensibility dictionary subdivided sentiment polarity based on the level of sensibility and given impotance to sensibility determination by populating slang, new words, emoticons and idiomatic expressions not in the system dictionary. It has considered the context through conjunctive adverbs fixed in korean characteristics which are free to the word order. It also recognize sensibility words such as TF(Term Frequency), RT(Retweet), Follower which are weighting factors of preference and has increased reliability of preference analysis considering weight on 'a very emotional tweet', 'a recognised tweet from users' and 'a tweeter influencer'

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석 (An Analysis of Relationship Between Word Frequency in Social Network Service Data and Crime Occurences)

  • 김용우;강행봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권9호
    • /
    • pp.229-236
    • /
    • 2016
  • 기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데 어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗 빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

트위터를 통한 제조 기업의 부정적 구전 확산: 공급사슬 리스크 관점에서 (Spread of Negative Word-of-mouth of Manufacturing Companies Via Twitter: From the Supply Chain Risk's Perspective)

  • 정의범;유한나
    • 한국산업정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.79-94
    • /
    • 2021
  • 소셜 미디어상의 부정적 구전에 대한 기업의 공급사슬 리스크의 중요성과 심각성에도 불구하고 관련된 연구는 미흡한 실정이다. 이에 본 연구는 제품의 부정적 구전이 소셜 미디어를 통해 어떻게 유통되는지, 부정적 구전의 유통과 확산에 영향을 주는 주체의 특징은 무엇인지를 사회적 교환이론에 기초하여 분석하였다. 이를 위해 트위터를 이용해 미국도로교통안전국(NHTSA)에서 4개 자동차 기업의 자동차 리콜 정보를 수집하였다. 최초 트위터(Seed tweet)를 바탕으로 부정적 구전의 유통과 확산을 살펴보기 위한 RT(Re-tweet) 네트워크를 구조를 분석하여 부정적 구전 네트워크의 특징을 파악하고, 초기 유포자의 특성이 부정적 구전 확산에 미치는 영향을 분석하였다. 그 결과 부정적 구전은 다수 이용자와 연결된 허브 이용자를 중심으로 확산하는 스몰월드 네트워크 구조임을 확인하였으며, 초기 유포자의 영향력이 크고 상호호혜성이 높을수록 부정적 구전 확산의 속도와 규모가 유의미하게 증가함을 발견하였다.

트위터(twitter)에서의 파라벤(parabens) 관련 대중의 인식 변화와 치약내 파라벤에 대한 연구 현황 (Changes in public recognition of parabens on twitter and the research status of parabens related to toothpaste)

  • 오효정;전재규
    • Journal of Korean Academy of Oral Health
    • /
    • 제41권2호
    • /
    • pp.154-161
    • /
    • 2017
  • Objectives: The purpose of this study was to investigate changes in public recognition of parabens on Twitter and the research status of parabens related to toothpaste. Methods: Tweet information between 2010 and October 2016 was collected by an automatic web crawler and examined according to tweet frequency, key words (2012-October 2016), and issue tweet detection analyses to reveal changes in public recognition of parabens on Twitter. To investigate the research status of parabens related to toothpaste, queries such as "paraben," "paraben and toxicity," "paraben and (toothpastes or dentifrices)," and "paraben and (toothpastes or dentifrices) and toxicity" were used. Results: The number of tweets concerning parabens sharply increased when parabens in toothpaste emerged as a social issue (October 2014), and decreased from 2015 onward. However, toothpaste and its related terms were continuously included in the core key words extracted from tweets from 2015. They were not included in key words before 2014, indicating that the emergence of parabens in toothpaste as a social issue plays an important role in public recognition of parabens in toothpaste. The issue tweet analysis also confirmed the change in public recognition of parabens in toothpaste. Despite the expansion of public recognition of parabens in toothpaste, there are only seven research articles on the topic in PubMed. Conclusions: The general public clearly recognized parabens in toothpaste after emergence of parabens in toothpaste as a social issue. Nevertheless, the scientific information on parabens in toothpaste is very limited, suggesting that the efforts of dental scientists are required to expand scientific knowledge related to parabens in oral hygiene measures.

공공기록관의 소셜미디어 이용 현황 및 이용자 관심도 분석: 국가기록원과 대통령기록관을 중심으로 (A Study on Social Media Usage of Government Archival Services and Users' Interestedness: Focused on "National Archives of Korea" and "Presidential Archives")

  • 최정원;강주연;박준형;오효정
    • 정보관리학회지
    • /
    • 제33권2호
    • /
    • pp.135-156
    • /
    • 2016
  • 최근 이용자 중심의 기록관리에 대한 중요도가 높아짐에 따라, 공공기록관에서도 소셜 네트워크 서비스(Social Network Service: 이하 SNS)를 통해 기존 방식인 단방향이 아닌 쌍방향 활동으로 이용자와 소통을 유도하여 이용자 중심 서비스를 시도하고 있다. 본 연구의 목적은 공공기록관의 소셜미디어 이용 현황을 분석하고 그에 대한 이용자들의 관심도를 파악하는데 있다. 이를 위해 본 연구에서는 국가기록원과 대통령기록관 트위터를 선정, 2010년부터 2016년 4월 15일까지의 공공기록관과 관련 트윗(tweet)들을 수집하였고, 계량분석과 소셜미디어 분석 방법(노출추이분석, 시계열분석)을 적용하였다. 공공기록관에서 자체적으로 게시한 트윗과 일반 사용자가 게시한 트윗 집합간의 차이점을 분석하고, 공공기록관에 대한 이용자 관심이슈와 시계열에 의한 사회적 이슈간의 상관관계를 파악하였으며, 이를 통해 효과적인 소셜미디어 환경에서의 공공기록관 서비스 활용 방안을 제시한다.

트윗 데이터를 이용한 황사 관련 질병 유의성 분석 (Significance Analysis of Yellow Dust Related Disease Using Tweet Data)

  • 정용한;서민송;유환희
    • 지적과 국토정보
    • /
    • 제47권1호
    • /
    • pp.267-276
    • /
    • 2017
  • 우리나라는 황사로 인해 농업 및 산업분야, 시민건강 등 다양한 분야에 걸쳐 피해가 발생되고 있으며 이에 대한 대책 마련이 시급한 실정이다. 이에 본 연구에서는 2009년 이후 최대 황사가 나타났던 2015년 2월 23일을 기준으로 전후 11일간의 황사 관련 트윗 데이터를 수집하고, 이슈어 분석, 건강과 관련된 트윗 데이터 그룹 재구성, 질병과의 연관규칙 분석 등을 걸쳐 황사발생과 관련 질병의 유의성을 검정한 결과 다음과 같은 결론을 얻었다. 황사관련 트윗 데이터로부터 도출된 질병과 건강보험심사평가원에서 취득한 환자실태 자료를 종합하여 비염, 천식, 결막염 환자에 대한 유의성 검정을 실시한 결과, 유의확률 5%에서 결막염은 16개 시 도 중 13개 지역에서 유의하게 나타났으며, 비염은 6개 지역에서, 천식은 3개 지역에서 질병 발생에 유의한 것으로 나타났다. 이상과 같이 트윗 데이터와 같은 SNS데이터로 부터 시민들의 건강에 대한 정보를 취득할 수 있었으며, 이를 활용한 시민건강 관리 대책을 수립하는데 유용한 정보를 제공해 줄 수 있을 것으로 판단된다.

토픽 모델링을 이용한 트위터 데이터의 공간 분포 패턴 분석 (Spatial Distribution Patterns of Twitter Data with Topic Modeling)

  • 우현지;김영훈
    • 한국지역지리학회지
    • /
    • 제23권2호
    • /
    • pp.376-387
    • /
    • 2017
  • 본 연구는 트위터를 대상으로 트윗 공간 데이터에서 지리적 의미를 탐색하기 위한 방법을 모색하였다. 트윗 공간 데이터의 구축 과정 및 지리적 분석의 프레임워크를 정립하고 지리적 연구 방법론을 제안하였다. 이를 위해 본 연구는 제주도의 GPS 좌표 참조 트윗(geotweet)을 대상으로 트윗의 내용적 특성과 트윗 발생 위치의 공간 분포 특성을 확인하였다. 제주도 좌표 참조 트윗에서는 지명 또는 장소명이 많이 출현하였는데, 이는 자신의 위치를 알리고자하는 의도로 파악하였다. 트윗의 공간 분포는 제주공항을 중심으로 한 일부 관광지 주변으로 핫스팟이 확인되었고, 이는 제주도 유동인구 핫스팟과 유사한 패턴을 보였다. 주제 중심의 트윗 분석을 위해 본 연구에서는 토픽 모델링 알고리즘을 이용하여 분석하였다. 분석 결과, 주제의 지리적 위치와 트윗의 내용은 서로 관련이 있음을 알 수 있었다. 마지막으로 본 연구는 토픽 모델링 분석을 통해 방대한 트윗 데이터의 내용에 상응하는 지역 분포 특성을 직관적으로 확인하는데 유용하게 활용될 수 있다는 것을 확인하였다.

  • PDF

트위터 사용자의 위치정보와 성향을 고려한 트윗 수집 시스템 (Tweet Acquisition System by Considering Location Information and Tendency of Twitter User)

  • 최우성;임준엽;황병연
    • Spatial Information Research
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 2014
  • 최근 소셜 네트워크 서비스가 급격히 성장하면서, 소셜 네트워크 분석에 관련된 연구들도 많은 관심을 받고 있다. 특히 트위터는 사회적 이슈나 사건들에 대해 실시간으로 반응하기 때문에, 사회과학 분야나 정보검색 분야의 연구자들이 유용한 실험 데이터를 수집하는 데에 활용되고 있다. 그러나 정작 데이터를 수집하는 방법론에 관한 연구는 아직 미흡하다. 이에 본 논문에서는 위치 기반의 이벤트와 정치 사회적 이벤트 위주의 사용자의 성향을 고려한 트윗 수집 시스템을 제안한다. 우선 위치정보와 이벤트 관련 키워드를 포함하고 있는 트윗과 정치 사회적인 이벤트 검출에 필요한 ID들을 수집한 후, 사용자들의 성향을 분류할 ID 분석기를 설계했다. 또한 ID 분석기의 신뢰도 측정을 위해 상위 등급에 분류된 ID를 이용하여 트윗을 분석했다. 분석결과 1등급으로 분류된 ID는 88.8%의 신뢰도를 보였으며, 2등급으로 분류된 ID는 76.05%의 신뢰도를 보였다. 또한 ID 분석기는 77.5%의 신뢰도를 보였으며 소수의 ID를 사용함으로써 데이터의 수집시간을 줄였다.

실시간 트위터 분석을 통한 트렌드 및 연관키워드 추출 (Trend and related keyword extraction based on real-time Twitter analysis)

  • 김대용;김대훈;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1710-1712
    • /
    • 2012
  • 최근 Twitter를 비롯한 소셜 네트워크 서비스의 급속한 확산으로 인해, 많은 수의 SNS 메시지가 실시간으로 생성되고 있다. 이러한 SNS상에서의 단문 글들을 실시간으로 분석하여 최신의 트렌드를 추출해 낼 수 있다면, 사용자에게 유용한 정보를 제공하는 것이 가능하다. 본 논문에서는 다량의 Tweet글들에 대한 실시간 분석을 바탕으로 트렌드를 추출하고 연관된 키워드를 제공하는 기법을 제안한다. 제안하는 기법은 실시간으로 생성되는 Tweet내에서 영어의 언어적 특성을 활용하여 최근 이슈화된 트렌드 키워드를 추출해낸다. 또한, Tweet 내에서 각 트렌드 키워드간 관계를 분석하여 연관 키워드를 제공하며, 동시에 Wikipedia와 Google에서의 검색을 통하여 다른 형태의 연관 키워드도 추출한다. 이 모든 과정은 제안된 트렌드 추출 알고리즘을 통해 실시간으로 제공된다. 제안된 기법을 바탕으로 시스템을 구현하고 다양한 실험을 통하여 키워드의 유효성 및 처리 속도 면에서 시스템의 성능을 평가한다.

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.