• 제목/요약/키워드: 트위터 사용자 분석

검색결과 116건 처리시간 0.023초

LDA를 이용한 트윗 유저의 연령대, 성별, 지역 분석 (Analyzing ages, gender, location on Twitter using LDA)

  • 이호경;천주룡;송남훈;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.116-119
    • /
    • 2013
  • 요즘 많은 사람들은 트위터를 통해 짧은 문장의 트윗을 작성하여 자신의 의견이나 생각을 표현한다. 사람들이 작성한 트윗은 사용자의 연령, 성별, 지역에 따라 다른 특성이 담겨있다. 이러한 정보를 이용하여, 기업에서는 연령대, 성별, 지역에 따라 각기 다른 마케팅 전략을 세울 수 있을 것이다. 본 논문에서는 트위터 사용자들의 트윗을 분석하여 연령대, 성별, 지역을 예측하려 한다. 네이버 오픈사전의 자질, 한국전자통신연구원(ETRI)의 개체명 사전을 이용한 자질 및 한국어 형태소 분석, 음절 단위의 bigram을 클래스별 의미 있는 자질로 선택하고 LDA를 이용하여 예측된 확률분포를 활용하여 분류한 결과, 연령 72%, 성별 75%, 지역 43%의 납득할만한 예측 정확도 결과를 얻게 되었다.

  • PDF

자연어 처리 기반 맞춤형 트윗 추천 시스템 (Natural Language Processing-based Personalized Twitter Recommendation System)

  • 이현창;유동필;정가빈;남용욱;김용혁
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.39-45
    • /
    • 2018
  • 트위터 사용자는 팔로우, 리트윗 등을 사용하여 자신이 관심 있어 하는 트윗을 찾는다. 하지만 사용자가 3억여 명에 달하는 트위터에서 사용자가 관심 있는 트윗을 찾기는 힘든 일이다. 이를 해결하기 위해 본 논문에서는 사용자 맞춤형 트윗 추천 시스템을 개발하였다. 우선, 사용자에게 추천할 수 있을 만한 가치가 있는 트윗을 수집하기 위해 현재 트랜드를 수집하고, 트랜드에 대해 이야기하는 인기 있는 트윗들을 수집한다. 이후 사용자를 분석하고 맞춤형 트윗을 추천하기 위해 사용자의 트윗과 수집한 트윗을 범주화한다. 최종적으로 웹서비스를 이용하여 사용자에게 본인과 카테고리가 일치하는 트윗과 관심사가 일치하는 사용자를 추천해준다. 결과적으로 67.2%로 적절한 트윗을 추천하였다.

트위터 데이터 수집을 위한 동적 시드 선택 (Dynamic Seed Selection for Twitter Data Collection)

  • 이현철;변창현;김양곤;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.217-225
    • /
    • 2014
  • 트위터와 같은 소셜 네트워크 분석은 인간의 행동을 이해하거나, 화제가 되는 주제를 탐지하거나, 영향력 있는 사람을 식별하거나, 커뮤니티나 그룹을 발견하는데 흥미로운 시각을 제공할 수 있다. 하지만 소셜 네트워크가 가지는 특성(즉 데이터가 방대하고, 정교하지 않으며 또한 동적인 특성)으로 인하여 소셜 네트워크에서 주제와 연관이 있는 데이터를 수집하는 것은 어려운 일이다. 본 논문은 주어진 주제와 관련 있는 트윗을 효과적으로 수집하기 위하여 시드 노드를 동적으로 선택하는 알고리즘을 제안한다. 본 알고리즘은 사용자의 영향력을 측정하기 위하여 사용자 속성을 활용하며, 수집 프로세스 중에 시드 노드를 동적으로 할당한다. 우리는 제안한 알고리즘을 실제 트윗 데이터에 적용하였으며, 만족할 만한 성능결과를 얻었다.

소셜네트워크서비스 사용자 접속요인 비교분석 : 트위터, 페이스북, 카카오스토리를 중심으로 (Comparative analysis on Social Network Service users access : Based on Twitter, Facebook, KakaoStory)

  • 홍삼열;오재철
    • 인터넷정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.9-16
    • /
    • 2012
  • 2009년 아이폰이 수입되면서 트위터와 페이스북이라는 소셜네트워크서비스가 국내에 알려지게 된 이후 국내에서나 국외에서 폭발적인 성장을 가져왔다. 뿐만 아니라 최근에 개통한 카카오스토리가 소셜네트워크서비스 시장에 가세하면서 국내에서는 단 시간에 선두를 달릴 만큼 성장하였다. 소셜네트워크서비스는 인터넷 상에서 공통의 관심사를 지니고 있는 사용자들 간의 관계형성을 지원하고, 이렇게 형성된 지인 관계를 바탕으로 인맥 관리, 정보 및 콘텐츠 공유 등 다양한 활동을 할 수 있도록 지원하는 서비스이다. 소셜네트워크서비스는 다양한 콘텐츠와의 결합을 통하여 네트워크를 통해 형성된 지인 관계를 기반으로 공유와 배포를 원활하게 하는 주요 플랫폼으로 활용되는 등 몇 가지의 공통적인 기능을 가지고 있다. 사용자가 각각의 서비스에 접속할 때는 서비스마다 특별히 강한 접속요인을 가지고 있다. 이에 트위터, 페이스북, 카카오스토리를 모두 사용하고 있는 사용자들을 대상으로 설문조사를 진행하였으며, 설문에 응답한 자료를 통계 내어 사용자 접속요인을 비교분석하였다. 이 연구결과는 사용자들의 목적에 따라 소셜네트워크 서비스를 선택하는 기준이 되고, 새로운 소셜네트워크서비스를 개발하거나 기존의 서비스를 발전시키는데 고려해야 할 요인들을 정리하였다. 이 연구는 향후 소셜시대의 윤리 중 하나의 덕목인 신뢰형성과 관련한 연구를 위해서도 기초자료가 될 것이다.

트위터 메세지 특성에 따른 온라인 구전효과에 대한 분석 (The Impact of Message Characteristics on Online Viral Diffusion in Online Social Media Services : The Case of Twitter)

  • 남영우;손인수;이동원
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.75-94
    • /
    • 2011
  • 본 연구에서는 최근 온라인 소셜미디어 서비스로 각광받고 있는 트위터 상에 게재되는 메세지의 특성이 메세지의 재전달에 미치는 영향을 전달 빈도와 전달 속도 관점에서 분석함으로써 소셜네트워트 환경하에서의 정보확산 체계를 탐구하고자 하였다. 이를 위해 최근 소셜미디어 상에서 많이 언급되고 있는 정치, 연예, 스포츠, 유명인, 최신 디지털 제품과 같은 사회적 관심사를 나타내는 여덟 가지 주요 키워드(예: 무상급식, 반값등록금, 나가수, 평창, 김연아, 박태환, 아이폰, 갤럭시)을 선정하였다. 또한 트위터 메세지의 특성을 정의하기 위한 기준은 기존 문헌연구를 통해 개인의견, 하이퍼링크 포함 메세지, 하이퍼링크 및 개인의견 포함 메세지, 단순 재인용 등의 네가지 유형을 적용하였으며 이들 주요 키워드와 메세지 유형별로 트위터 트위터 메세지의 재전달 빈도와 재전달 속도를 측정하였다. 2011년 6월부터 2011년 7월까지 수집된 81,472개의 1회 이상 재전달된 트위터 메세지에 대한 분석을 통해, 재전달 트위터 메시지의 50퍼센트 이상이 특정 키워드에 대한 개인의견을 표현한 메시지임을 알 수 있었다. 아울러 표본 트위터 메세지 중 하이퍼 링크를 포함한 메세지가 가장 빠른 메세지 재전달 시간을 보이는 것을 알수 있었다. 이러한 분석결과를 바탕으로 메시지의 고유 특성이 온라인 소셜 미디어 상의 정보확산 패턴에 중요한 영향요소로 작용하고 있음을 확인 할 수 있었다. 또한 트위터와 같은 온라인 소셜 미디어는 더 이상 단순한 의사소통 도구가 아닌 다양한 사회현상에 대한 사용자의 개인적 의견을 피력하고 상호간의 심도있는 논의가 가능한 현대사회의 중요한 커뮤니케이션 플랫폼으로 발전하고 있으며 정보기술이 이러한 의사소통 혁신에 중요한 요소로 작용하고 있다는 것을 이해 할 수 있었다. 본 연구의 결과는 온라인 소셜 미디어상의 정보확산에 대한 기존의 학문적 지식을 증대키고 실무적으로 기업이 고객과 소통하는 데 있어 온라인 소셜 미디어를 어떻게 전략적으로 활용할 수 있는가에 대한 실질적인 방향을 제시할 것이라 기대된다.

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

소셜네트워크 분석을 통한 마케팅 전략 : 트위터의 검색네트워크 (Marketing Strategies using Social Network Analysis : Twitter's Search Network)

  • 유병국;김순홍
    • 한국콘텐츠학회논문지
    • /
    • 제13권5호
    • /
    • pp.396-407
    • /
    • 2013
  • 입소문효과의 극대화를 위한 유력자의 역할은 트위터 네트워크에서도 매우 중요하다고 볼 수 있다. 본 논문에서는 기업 마케팅의 관점에서 트위터 유력자를 파악하고자 하였다. 기업의 마케팅 메시지가 가능한 한 많은 사람들에게 노출되기 위해서는 특정인의 팔로어 수뿐만 아니라 계속적인 리트윗을 통해 입소문이 많이 확산되어야 할 것이다. 즉, 팔로어 수는 많은데 리트윗되지 않거나 리트윗은 많이 되는데 소수자에게 주로 리트윗된다면 전체적인 노출의 정도는 미약하게 될 것이다. 트위터의 특정 검색네트워크 데이터를 이용한 그래프 비교를 통해 다음과 같은 사실을 확인할 수 있었다. 첫째, 리트윗이 없는 팔로어 유력자에 비하여 팔로어 유력자의 리트윗을 받는 상대적인 소수자들의 노출도가 크다는 것을 알 수 있었다. 둘째, 리트윗 유력자중에서도 팔로어 유력자에 의하여 리트윗을 받지 못하는 사용자의 노출도는 매우 미미하다는 것을 알 수 있었다. 위와 같은 사실은 노출도를 높이기 위해서는 실제 유력자도 중요하지만 그런 유력자의 리트윗을 유도하는 사용자의 파악이 더 중요하다는 점을 시사해준다고 볼 수 있다. 이와 함께 노출도의 경우 대부분의 중앙성 척도와 고른 상관관계를 유지하고 있어 노출도가 높은 이용자일수록 네트워크구조상에서도 중심적인 위상을 차지한다는 점도 살펴볼 수 있었다.

감성 분석 및 감성 정보 부착 시스템 구현 (Developing a Sentiment Analysing and Tagging System)

  • 이현규;이성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권8호
    • /
    • pp.377-384
    • /
    • 2016
  • 본 연구의 목적은 트위터에서 수집된 트윗들의 감성을 분석하고 각 문장의 감성 정보를 반자동으로 부착하여 감성 말뭉치를 구축할 수 있는 시스템의 구현이다. 트위터 API를 이용해 트윗을 수집한 후 각 트윗이 어떤 감성을 갖는지 감성사전을 이용해 분석한다. 사용자는 감성 분석 결과를 확인하고 누락된 감성 정보를 추가하거나 의존구조 사이에 존재하는 감성 정보를 추가할 수 있다. 감성 정보는 JSON 구조로 부착함으로써 감성 말뭉치 구축 및 활용에 용이하게 하였다. 제안 시스템은 긍정, 부정, 중립 문장에 대한 감성 분석 결과 약 76%의 성능을 보였다.

소셜네트워크 활용이 사회자본 형성에 미치는 영향 : 트위터, 페이스북, 카카오스토리를 중심으로 (The Effect of Social Network Usage on the Formation of Social Capital : Based on Twitter, Facebook, KakaoStory)

  • 홍삼열;오재철
    • 한국전자통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1471-1477
    • /
    • 2012
  • 소셜네트워크는 다양한 콘텐츠와의 결합을 통하여 네트워크를 통해 형성된 지인 관계를 기반으로 공유와 배포를 원활하게 하는 주요 플랫폼으로 활용되는 등 몇 가지의 공통적인 기능을 가지고 있다. 이에 트위터, 페이스북, 카카오스토리를 모두 사용하고 있는 사용자들을 대상으로 설문조사를 진행하였으며, 설문에 응답한 자료를 통계 내어 각각의 서비스가 영향을 주는 요인들은 어떤 것인지 완성적 사회자본과 도구적 사회자본으로 나누어 분석한 결과를 제시하였다. 이 연구는 사용자들의 목적에 따라 소셜네트워크를 선택하는 기준이 되고, 새로운 소셜네트워크를 개발하거나 기존의 서비스를 발전시키는데 기여할 수 있을 것이다.

트위터를 이용한 이벤트 감지 시스템 (Event Detection System Using Twitter Data)

  • 박태수;정옥란
    • 인터넷정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.153-158
    • /
    • 2016
  • 최근 소셜 네트워크 사용자들이 늘어나면서, 각 지역에서 관심 받고 있는 사회적인 이슈나 재해 등과 같은 이벤트에 대한 정보들이 소셜 미디어 사이트를 통해 실시간으로 빠르게 대량으로 게시되고 있으며, 사회적 파급효과도 매우 커지고 있다. 본 논문에서는 지역정보를 가진 트위터 데이터를 이용하여 특정 시간, 지역에 사용자들이 관심을 가지고 있는 이벤트를 탐지하는 방법을 제안하고자 한다. 이를 위해 트위터 스트리밍 API를 이용해 데이터를 수집하고, 트윗의 키워드들의 시간에 따른 빈도수를 분석하여 정상적인 패턴과 다른 패턴을 가진 키워드를 이벤트로 추출하고, 같은 이벤트에 대한 키워드들을 군집화 하기 위해 co-occurrence 그래프를 이용하여 이벤트 감지 시스템을 구현하였다. 그리고 실험을 통해 제안한 기법의 유효성을 검증한다.