• 제목/요약/키워드: Twitter

검색결과 662건 처리시간 0.023초

트위터 이용한 인물 평판 분석 시스템 (Design of a Reputation System for Twitter)

  • 이경호;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.62-66
    • /
    • 2012
  • 본 논문은 트위터 사용자들이 글(트윗)을 통해 표현한 인물에 대한 평가를 수집, 분석하여 인물에 대한 평판을 종합적으로 분석하는 시스템의 구성에 대한 논문이다. 트위터의 Open API를 이용한 데이터 수집과 수집된 데이터의 특징에 대하여 분석하고 감성사전을 이용한 데이터 분석과 분석된 결과의 저장방식에 대하여 논한다. 2012년에 치루어지는 18대 대통령 선거의 출마자들을 본 시스템에 적용하여 시스템의 유효성을 검증하고자 한다.

  • PDF

Word Embedding기반 Twitter 해시 태그 클러스터링 (Twitter Hashtags Clustering with Word Embedding)

  • 티엔윙안;양형정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.179-180
    • /
    • 2019
  • Nowadays, clustering algorithm is considered as a promising solution for lacking human-labeled and massive data of social media sites in numerous machine learning tasks. Many researchers propose disaster event detection systems have ability to determine special local events, such as missing people, public transport damage by clustering similar tweets and hashtags together. In this paper, we try to extend tweet hashtag feature definition by applying word embedding. The experimental results are described that word embedding achieve better performance than the reference method.

  • PDF

트위터에서의 악성코드 유포 실태조사 (A Survey on Twitter Malware Distribution)

  • 강정인;도희성;이희조
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1327-1330
    • /
    • 2010
  • 최근 전세계적으로 마이크로-블로그 형태의 소셜네트워크 서비스가 확산되어가고 있으며, 트위터(Twitter)란 이러한 가장 대표적인 소셜네트워크 서비스이다. 본 논문에서는 트위터를 매개로써 이루어지는 악성코드 유포 행위를 조사하기 위해 트위터에 올라오는 게시물(Tweet)들에서 약 93 만개의 링크를 임의 추출하여 다운받았고, 이중 7 개의 악성코드 배포 계정을 검출하여 해당 게시물과 계정의 특징을 조사하였다.

빅 데이터를 이용한 재해 정보 지원에 관한 연구 (A Study on Disaster Information Support using Big Data)

  • 신봉희;전혜경
    • 한국융합학회논문지
    • /
    • 제9권8호
    • /
    • pp.25-32
    • /
    • 2018
  • 최근 우리나라에서 일어나고 있는 재해의 규모 및 유형은 과거와 달리 다양화되고 있다. 하지만 우리나라는 이러한 여러 재해를 예측하기 위한 다양한 정보지원체계를 구축하지 못하고 있다. 현재 많은 기관에서 관련정보를 제공하고 있다. 이들 정보는 주로 웹으로 제공되고 있지만 대부분 실시간정보가 아니다. 본 연구에서는 기관들이 제공하는 정보와 함께 좀 더 양질의 실시간 정보를 제공하기 위해서 빅데이터를 활용한 정보지원을 주목하게 되었다. 빅데이터는 실시간성을 갖는 많은 양의 정보가 있고, 이를 이용하여 사용자맞춤 서비스를 할 수 있다. 그 중에서 트위터나 페이스북 등의 SNS는 재난이 발생했을 때 새로운 정보수집매체로서 이용할 수 있다. 그러나 너무 많은 정보로부터 필요한 정보를 자세히 검색하는 것은 무척 어렵고, 직감적인 정보수집이 곤란하다는 문제가 있다. 이를 위해서 본 연구에서는 트위터를 이용한 정보지원시스템을 개발한다. 시스템은 트위터 해시태그를 이용하여 정보를 검색한다. 또한 직감적으로 정보를 파악할 수 있도록, 지도상에 정보 매핑을 수행한다. 시스템의 평가를 위해, 정보추출, 매핑정도, 추천속도를 평가한다.

시공간 정보를 사용한 개선된 트윗 봇 검출 (Improved Tweet Bot Detection Using Spatio-Temporal Information)

  • 김효상;신원용;김동건;조재희
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2885-2891
    • /
    • 2015
  • 온라인 소셜 네트워크 서비스 중 하나인 트위터는 가장 보편적으로 사용되는 마이크로 블로그인데, 트위터의 개방적 구조로 인해 자동화 프로그램인 트윗 봇이 많이 생성되고 있다. 이 트윗 봇은 적법한 봇과 악성 봇으로 분류되는데, 이 중 악성 봇은 일반 사용자들에게 많은 양의 스팸 정보나 유해한 컨텐츠를 배포하기 때문에 트윗 봇을 검출하는 작업은 반드시 필요하다. 기존 연구에서는 시간적 정보를 활용하여 사람과 트윗 봇을 분류하였다. 본 논문에서는 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 정보를 활용하여 트위터 사용자들의 정확한 위치와 트윗 전송시각을 알아낸 후, 각 사용자의 시공간 엔트로피를 계산하여 트윗 봇을 검출하는 개선된 두 단계 알고리즘을 제안한다. 주요 결과로써, 시간 정보만을 이용한 기존 연구결과보다 각 신뢰도별 봇 검출 확률 및 거짓 경보 확률이 모두 우수하게 나타난다.

소셜네트워크 분석을 통한 마케팅 전략 : 트위터의 검색네트워크 (Marketing Strategies using Social Network Analysis : Twitter's Search Network)

  • 유병국;김순홍
    • 한국콘텐츠학회논문지
    • /
    • 제13권5호
    • /
    • pp.396-407
    • /
    • 2013
  • 입소문효과의 극대화를 위한 유력자의 역할은 트위터 네트워크에서도 매우 중요하다고 볼 수 있다. 본 논문에서는 기업 마케팅의 관점에서 트위터 유력자를 파악하고자 하였다. 기업의 마케팅 메시지가 가능한 한 많은 사람들에게 노출되기 위해서는 특정인의 팔로어 수뿐만 아니라 계속적인 리트윗을 통해 입소문이 많이 확산되어야 할 것이다. 즉, 팔로어 수는 많은데 리트윗되지 않거나 리트윗은 많이 되는데 소수자에게 주로 리트윗된다면 전체적인 노출의 정도는 미약하게 될 것이다. 트위터의 특정 검색네트워크 데이터를 이용한 그래프 비교를 통해 다음과 같은 사실을 확인할 수 있었다. 첫째, 리트윗이 없는 팔로어 유력자에 비하여 팔로어 유력자의 리트윗을 받는 상대적인 소수자들의 노출도가 크다는 것을 알 수 있었다. 둘째, 리트윗 유력자중에서도 팔로어 유력자에 의하여 리트윗을 받지 못하는 사용자의 노출도는 매우 미미하다는 것을 알 수 있었다. 위와 같은 사실은 노출도를 높이기 위해서는 실제 유력자도 중요하지만 그런 유력자의 리트윗을 유도하는 사용자의 파악이 더 중요하다는 점을 시사해준다고 볼 수 있다. 이와 함께 노출도의 경우 대부분의 중앙성 척도와 고른 상관관계를 유지하고 있어 노출도가 높은 이용자일수록 네트워크구조상에서도 중심적인 위상을 차지한다는 점도 살펴볼 수 있었다.

정부부처의 소셜미디어 소통방식: 국가간 트위터 이용 및 연결망에 대한 탐색적 연구 (Government's Social Media: A Study of Twitter Use and Network among Seven Nations)

  • 조성은;박한우
    • 한국콘텐츠학회논문지
    • /
    • 제13권8호
    • /
    • pp.160-170
    • /
    • 2013
  • 이 연구는 트위터 계정을 가지고 있는 7개 국가 175개 정부부처의 트위터 이용 및 연결망을 분석했다. 분석 결과 트위터 이용 특징 대부분에서 국가 별 뚜렷한 차이를 찾기 힘들었으나 맞팔율에서는 국가 간 극명한 차이가 있었다. 미국이 다른 국가로부터 팔로잉을 가장 많이 받는 국가인 반면, 다른 국가를 팔로잉 하는 데는 소극적인 것으로 나타났다. 또 국가 간 연결관계에서 같은 언어나 문화적, 역사적 유사성이 어느 정도 영향을 주고 있음을 알 수 있었다. 그밖에 비슷한 업무를 담당하는 정부부처 간 연결의 경우가 많았다. 이 연구는 트위터 연결망을 가시화함으로 해서 미국이 비공식채널에서도 주목을 받고 있음을 확인하는 동시에, 언어 및 업무 유사성에 의한 연결관계도 확인함으로 해서 향후 소셜 미디어에서의 연성 권력 형성을 통한 새로운 지식 패권 구도가 출현할 수 있는 잠재성을 제시한다.

타임라인의 감정추출을 통한 트위터 사용자의 정치적 성향 분석 (Propensity Analysis of Political Attitude of Twitter Users by Extracting Sentiment from Timeline)

  • 김석중;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제17권1호
    • /
    • pp.43-51
    • /
    • 2014
  • 소셜 네트워크 서비스는 편리한 접근성과 뚜렷한 사용자 주관 점에서 사회 여러 분야에서 폭 넓고 유용하게 사용될 충분한 가능성을 가지고 있다. 그 중에서도 트위터는 사용자간의 네트워크 형성이 간단하고 개방적이며 실시간 전파력이 뛰어난 특징을 가지고 있다. 그러나 140글자로 제한된 글에서 의미 분석을 시도해야 한다는 점과 한글 자연어처리의 한계, 트위터 자체의 제약과 기술적 문제들로 실제 분석에는 많은 어려움이 따른다. 본 논문은 특정 계정이나 키워드에 의존하여 개별 트윗을 분석한 기존의 방법 대신 항구성을 띄는 인간의 정치적 성향을 분석에 적용할 경우 정확도 향상에 기여할 수 있음을 가정하고 2012년 4월 11일 제19대 국회의원선거 기간 동안 수집한 트윗 코퍼스에 적용한 실험을 통해 보였다. 실험 결과는 실제 선거 결과와 정확히 일치하였으며, 75.4%의 정확도와 34.8%의 재현율을 보인 개별 트윗 분석보다 사용자의 타임라인별 정치 성향 분석이 약 8%의 정확도와 5%의 재현율 향상을 가져옴을 보였다.

트레이닝 데이터가 제한된 환경에서 N-Gram 사전을 이용한 트위터 스팸 탐지 방법 (A Method for Twitter Spam Detection Using N-Gram Dictionary Under Limited Labeling)

  • 최혁준;박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권9호
    • /
    • pp.445-456
    • /
    • 2017
  • 본 논문에서는 트레이닝 데이터가 제한된 환경에서 n-gram 사전을 이용하여 불건전 정보를 포함하는 스팸 트윗을 탐지하는 방법을 제안한다. 불건전 정보를 포함하는 스팸 트윗은 유사한 단어와 문장을 사용하는 경향이 있다. 이러한 특성을 이용하여 스팸 트윗과 정상 트윗에 대한 n-gram 사전을 구축하고 나이브 베이스 분류기를 적용하여 효과적으로 스팸 트윗을 탐지할 수 있음을 보인다. 반면에, 실시간으로 대용량의 데이터가 유입되는 트위터의 특성은 초기 트레이닝 집합 구성에 매우 큰 비용을 요구 한다. 따라서, 초기 트레이닝 집합이 매우 작거나 존재하지 않는 환경에서 적용할 수 있는 스팸 트윗 탐지 방법이 필요하다. 이를 위해 트위터의 리트윗 기능을 활용하여 의사 라벨을 생성하고 초기 트레이닝 집합의 구성과 n-gram 사전 업데이트에 활용하는 방법을 제안한다. 2016년 12월 1일부터 2016년 12월 7일까지 수집된 한국어 트윗 130만 건을 사용한 다양한 실험 결과는 비교 방법들보다 제안하는 방법의 성능이 우수함을 입증한다.

소셜 빅데이터를 이용한 영화 흥행 요인 분석 (Movie Box-office Analysis using Social Big Data)

  • 이오준;박승보;정다울;유은순
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.527-538
    • /
    • 2014
  • 수요 예측은 영화 산업에서 매우 중요한 문제이다. 최근 들어 트위터(Twitter), 페이스북(Facebook)과 같은 소셜미디어의 비정형 텍스트 데이터를 이용하여 영화 흥행을 예측하고 분석하는 시도들이 활발하게 이루어지고 있다. 기존에는 주로 데이터의 주기별 변화량을 측정하여 데이터 양과 영화 흥행간의 상관성을 분석하거나 데이터에 대해 감성의 극성 값을 부여하는 오피니언 마이닝을 통해 영화의 흥행 추이를 예측하였다. 하지만 이러한 정량적 접근만으로는 관객들이 영화를 선택하게 된 근거나 영화의 어떤 속성을 선호하는지를 알 수 없기 때문에 영화의 흥행 요인을 밝히는데 한계가 있었다. 따라서 본 연구는 트위터 데이터를 수집한 후 빈도수 측정을 통해 트윗의 내용을 대표하는 토픽(topic) 키워드를 추출하여 관객들의 관심을 반영하는 영화적 속성들이 무엇인지를 밝히고, 그 속성들에 대한 관객들의 반응을 분석함으로써 영화의 흥행에 영향을 미친 요인들을 제시한다.