• 제목/요약/키워드: 트위터 이용자

검색결과 72건 처리시간 0.02초

트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 (Geographical Name Denoising by Machine Learning of Event Detection Based on Twitter)

  • 우승민;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권10호
    • /
    • pp.447-454
    • /
    • 2015
  • 본 논문에서는 트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 방식을 제안한다. 최근 스마트폰 이용자의 증가로 소셜 네트워크 서비스(SNS) 이용자가 증가하고 있는 추세이다. 그중 트위터는 140자 이내의 단문서비스와 팔로우 기능으로 정보의 빠른 전달력과 확산성을 가지고 있다. 이러한 특성과 모바일에 최적화된 트위터의 특성상 정보 전달 속도가 매우 빠르기 때문에 재난 상황이나 이벤트 전달의 매개체 역할을 하고 있다. 이와 관련된 연구로는 트위터 사용자 개개인을 이벤트 탐지의 센서로 사용하여 현실에서 발생하는 이벤트를 탐지하였는데 이벤트가 특정 장소에서 발생한다는 특성을 이용해서 지명 키워드를 사용하였다. 그러나 지명과 동형이의어 관계에 관한 노이즈제거에 대한 부분이 누락되어있어서 이벤트 탐지의 정확도를 낮추는 요인이 된다. 이에 본 논문에서는 제거와 예측 두 가지 방식으로 노이즈제거 기법을 적용하였다. 먼저 노이즈 관련 데이터베이스 구축을 이용하여 제거 필터링을 진행한 후에 나이브 베이지안 분류를 이용해서 지명 유무를 결정하였다. 실험 데이터를 이용해서 기계학습을 위한 확률값을 구했으며, 지명마다 본 논문에서 제시하는 예측기법을 검증했을 때 89.6%의 신뢰도로 노이즈제거 기법의 필요성을 보였다.

트위터 API를 활용한 트위터 검색 기능 개선 (Improving Twitter Search Function Using Twitter API)

  • 남용욱;김용혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.879-886
    • /
    • 2018
  • 트위터에서 제공해주는 기본 검색 기능은 검색어가 담긴 트윗 뿐 아니라 검색어를 포함하는 닉네임을 가진 유저가 쓰는 모든 트윗들을 보여준다. 따라서 검색 키워드와 관계 없는 트윗들도 검색 결과로 노출하게 되어 해당 키워드가 포함된 트윗 만을 검색하려고 하는 많은 사용자들에게 불편함을 주고 있다. 본 연구에서는 이러한 문제점을 해결하고자 검색 키워드가 들어있는 트윗만을 검색하는 알고리즘을 만들어 트위터 검색 기능을 개선하였다. 개선된 기능은 ASP.NET MVC5를 이용하여 웹 서비스로 구현하여 많은 사람들이 이용할 수 있다. 검색 결과를 모아놓은 객체에 C#의 강력한 컬렉션 메소드를 사용하여 '리트윗' 이나 '마음에 들어요' 의 개수가 많은 순서대로 출력할 수도 있고, 리트윗 숫자가 설정한 수치보다 적을 경우 검색 결과에서 제외할 수 있는 필터 기능도 추가하였다. 따라서 사람들에게 관심을 많이 받는 의견을 빠르게 탐색할 수도 있으며, 이는 검색 이용자와 데이터 분석가들이 트위터에서 검색하는데 편리함을 줄 것으로 기대된다.

소셜미디어를 통한 우울 경향 이용자 담론 주제 분석 (An Analysis of the Discourse Topics of Users who Exhibit Symptoms of Depression on Social Media)

  • 서하림;송민
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.207-226
    • /
    • 2019
  • 우울증은 전 세계적으로 많은 사람들이 겪고 있으며, 최근 다양한 분야에서 꾸준히 우울증에 대한 연구가 수행되고 있다. 특히 사람들이 본인의 스트레스나 감정 상태에 대해 소셜미디어에 공유한 글을 통해 그들의 심리나 정신건강에 대해 파악해보고자 하는 맥락에서 소셜미디어를 활용한 연구 역시 유의미하게 받아들여지고 있다. 이에 본 연구에서는 우울 경향의 이용자와 그렇지 않은 이용자들의 2016년부터 2019년 2월까지의 트위터 데이터를 수집하여 어떤 주제적, 어휘 사용의 특성을 보이는지 보고자 하였으며, 우울 경향의 시기별로도 어떤 차이를 보이는지 살펴보기 위해 우울 경향 관측 날짜를 기준으로 하여 이전(before) 시기와 이후(after) 시기를 구분하여 실험을 수행하였다. 토픽모델링, 동시출현 단어분석, 감성분석 방법을 통해 우울 경향과 비(非)우울 경향 이용자의 텍스트의 주제적 차이를 살펴보았고, 감성 반응에 따라 사용한 어휘에 대해서도 살펴봄으로써 어떠한 특성이 있는지 확인해 보았다. 데이터 수집 단계에서 '우울' 표현을 포함한 텍스트 데이터 수집방법을 통해 비교적 긴 기간, 많은 양의 데이터를 수집할 수 있었고, 또한 우울 경향의 여부와 시기적 구분에 따른 관심 주제에 대한 차이도 확인할 수 있었다는 점에서 유의미하다고 볼 수 있다.

트위터를 통한 루머의 확산 과정 연구: 한미 FTA 관련 루머의 자극성에 따른 의견 확산 추이와 이용자의 상호작용성을 중심으로 (The Diffusion of Rumor Via Twitter : The Diffusion Trend and the User Interactivity in the Korea-U.S. FTA Case)

  • 홍주현;윤해진
    • 한국언론정보학보
    • /
    • 제66권
    • /
    • pp.59-86
    • /
    • 2014
  • 이 연구는 소셜 네트워크 사이트를 통해 루머가 급속하게 확산될 뿐만 아니라 정책 결정과정에까지 영향을 미치는 현상에 주목하였다. 이에 거시적 관점에서 한미 FTA와 관련된 여론의 확산 추이를 살펴보고 미시적 관점에서 이용자 간에 상호작용성이 얼마나 활발하게 나타나는지 분석하였다. 이 연구는 루머의 자극성을 루머의 확산에 영향을 미치는 요인으로 보았다. 한미 FTA 관련 루머 중 트위터 검색 엔진을 통해 연관 검색어로 나타난 맹장수술 괴담, 약값 폭등, 건강보험 붕괴를 중심으로 루머의 자극성과 자극성에 따른 확산 추이, 상호작용성을 분석하였다. 루머의 자극성을 사실적 측면과 표현적 측면으로 구분해 분석한 결과, 사실적 측면의 자극성은 맹장 수술 괴담이, 표현적 측면의 자극성은 약값 폭등이 가장 컸다. 루머의 자극성에 따른 여론의 확산 유형을 분석한 결과, 맹장 수술 괴담의 경우 '폭발적 소멸형 파동'이, 약값 폭등의 경우 '잠재적 소멸형 파동'이, 건강 보험 붕괴의 경우 '반복적 파동'이 형성되었다. 루머의 자극성과 상호작용의 관계를 상관관계 분석한 결과, 맹장 수술 괴담의 경우 약한 정도의 상관관계가, 건강 보험의 경우 높은 정도의 상관관계가 나타났다. 건강 보험 붕괴의 자극성이 맹장 수술 괴담의 자극성보다 낮았지만, 건강 보험의 경우 이용자들이 체감하는 이슈 관여도가 높아 논의가 더 활발하게 이루어진 것으로 생각된다. 이 연구를 통해 한미 FTA 체결과 관련하여 트위터가 부정적인 메시지가 확산되는 통로의 역할을 한 것으로 판단된다. 향후 정부는 소셜네트워크사이트를 통한 루머의 확산 과정을 파악하고, 이에 대한 대책을 마련해야 할 것이다.

  • PDF

트위터를 통한 제조 기업의 부정적 구전 확산: 공급사슬 리스크 관점에서 (Spread of Negative Word-of-mouth of Manufacturing Companies Via Twitter: From the Supply Chain Risk's Perspective)

  • 정의범;유한나
    • 한국산업정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.79-94
    • /
    • 2021
  • 소셜 미디어상의 부정적 구전에 대한 기업의 공급사슬 리스크의 중요성과 심각성에도 불구하고 관련된 연구는 미흡한 실정이다. 이에 본 연구는 제품의 부정적 구전이 소셜 미디어를 통해 어떻게 유통되는지, 부정적 구전의 유통과 확산에 영향을 주는 주체의 특징은 무엇인지를 사회적 교환이론에 기초하여 분석하였다. 이를 위해 트위터를 이용해 미국도로교통안전국(NHTSA)에서 4개 자동차 기업의 자동차 리콜 정보를 수집하였다. 최초 트위터(Seed tweet)를 바탕으로 부정적 구전의 유통과 확산을 살펴보기 위한 RT(Re-tweet) 네트워크를 구조를 분석하여 부정적 구전 네트워크의 특징을 파악하고, 초기 유포자의 특성이 부정적 구전 확산에 미치는 영향을 분석하였다. 그 결과 부정적 구전은 다수 이용자와 연결된 허브 이용자를 중심으로 확산하는 스몰월드 네트워크 구조임을 확인하였으며, 초기 유포자의 영향력이 크고 상호호혜성이 높을수록 부정적 구전 확산의 속도와 규모가 유의미하게 증가함을 발견하였다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

신제품 프로모션에 대한 온라인 소셜네트워크의 구전효과 분석 : 트위터의 정보전달과정을 중심으로 (The Viral Effect of Online Social Network on New Products Promotion: Investigating Information Diffusion on Twitter)

  • 김형진;손인수;이동원
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.107-130
    • /
    • 2012
  • 인터넷으로 대표되는 정보기술의 발전은 우리의 일상생활과 기업활동에 많은 영향을 미쳐 왔다. 아울러 최근에는 온라인 소셜네트워크라는 새로운 인터넷 커뮤니케이션 채널의 등장과 확산으로 인해 이용자들은 시간과 공간적인 제약 없이 전세계적인 의사소통을 할 수 있게 되었고 우리사회는 또 다른 패러다임의 변화를 맞이하고 있다. 이들 소셜네트워크 중 트위터는 가장 빠른 성장세를 보이는 온라인 매체 중 하나로 사용자는 140 단어 이내의 비교적 간단한 문장을 온라인 상에 게시하고 (Tweet) 다른 사용자들이 게시한 메시지를 다시 게시할 (Retweet) 수도 있다. 트위터의 이러한 Tweet/Retweet 기능은 새로운 온라인 정보확산 매카니즘의 예를 보여주며 상호 의사소통의 속도와 범위에 영향을 주고 있다. 비즈니스 관점에서의 트위터의 확산은 온라인 소셜네트워크를 제품 프로모션을 위한 새로운 마케팅 커뮤니케이션의 도구로 활용할 수 있는 기회를 제공하고 있다. 본 연구는 마케팅 전략적 관점에서 트위터의 잠재성을 이해하는 목적에서 트위터 상의 정보전달체계 중심으로 신제품 프로모션에 대한 온라인 소셜네트워크의 구전효과를 분석 하였다. 이를 위해 특정 신제품과 관련하여 2011년 6월부터 9월 사이에 게재된 트위터 메시지를 수집하여 트위터 메시지가 제공하는 정보의 충실도, 메시지 특성, 메시지 게재자의 성격등과 같은 변수와 온라인 소셜네트워크 상의 구전효과 (리트윗 횟수)와의 관계를 분석하였다. 분석결과 신제품 출시일자 정보, 제품사양, 리트윗 요청, 트윗 게시자 특성 등이 구전효과에 유의한 영향을 미치는 것으로 파악되었다. 아울러 제품의 특성과 트윗 메시지 게시일에 따라 구전효과에 미치는 영향이 달라짐을 발견하였다. 본 연구의 결과는 신제품 프로모션과 관련한 구전효과 발생에 있어 온라인 소셜네트워크의 영향에 관한 연구기반을 제공하며 기업이 새로운 제품에 대한 광고 및 마케팅 커뮤니케이션을 수행 함에 있어 온라인 소셜네트 워크를 효과적으로 활용하는데 필요한 유용한 가이드를 제시 할 것으로 기대된다.

소셜네트워크 분석을 통한 마케팅 전략 : 트위터의 검색네트워크 (Marketing Strategies using Social Network Analysis : Twitter's Search Network)

  • 유병국;김순홍
    • 한국콘텐츠학회논문지
    • /
    • 제13권5호
    • /
    • pp.396-407
    • /
    • 2013
  • 입소문효과의 극대화를 위한 유력자의 역할은 트위터 네트워크에서도 매우 중요하다고 볼 수 있다. 본 논문에서는 기업 마케팅의 관점에서 트위터 유력자를 파악하고자 하였다. 기업의 마케팅 메시지가 가능한 한 많은 사람들에게 노출되기 위해서는 특정인의 팔로어 수뿐만 아니라 계속적인 리트윗을 통해 입소문이 많이 확산되어야 할 것이다. 즉, 팔로어 수는 많은데 리트윗되지 않거나 리트윗은 많이 되는데 소수자에게 주로 리트윗된다면 전체적인 노출의 정도는 미약하게 될 것이다. 트위터의 특정 검색네트워크 데이터를 이용한 그래프 비교를 통해 다음과 같은 사실을 확인할 수 있었다. 첫째, 리트윗이 없는 팔로어 유력자에 비하여 팔로어 유력자의 리트윗을 받는 상대적인 소수자들의 노출도가 크다는 것을 알 수 있었다. 둘째, 리트윗 유력자중에서도 팔로어 유력자에 의하여 리트윗을 받지 못하는 사용자의 노출도는 매우 미미하다는 것을 알 수 있었다. 위와 같은 사실은 노출도를 높이기 위해서는 실제 유력자도 중요하지만 그런 유력자의 리트윗을 유도하는 사용자의 파악이 더 중요하다는 점을 시사해준다고 볼 수 있다. 이와 함께 노출도의 경우 대부분의 중앙성 척도와 고른 상관관계를 유지하고 있어 노출도가 높은 이용자일수록 네트워크구조상에서도 중심적인 위상을 차지한다는 점도 살펴볼 수 있었다.

트위터에서 문맥상 지역명을 기반으로 한 불특정 이벤트 탐지 시스템 (Unspecified Event Detection System Based on Contextual Location Name on Twitter)

  • 오평화;임준엽;윤진영;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.341-348
    • /
    • 2014
  • 스마트폰의 확산으로 인한 웹 접근성의 발달은 소셜 네트워크를 기반으로 하는 플랫폼 서비스 이용자의 급격한 증가를 이끌어냈다. 그중에서도 개방적인 네트워크를 기반으로 빠른 확산과 강력한 영향력을 보이는 트위터(Twitter)는 하루 평균 5억 건이 넘는 트윗(Tweet)이 생산되는 대표적인 서비스이다. 따라서 트위터를 이용하여 이벤트를 탐지하려는 다양한 연구들이 진행되고 있다. 그러나 기존의 연구들은 이벤트 탐지를 위해 트윗을 구성하는 다양한 조건에 대한 고려 없이 일반 문서와 동일하게 일반적인 TFIDF 알고리즘을 적용하였다. 또한 TF와 DF에 대한 언급이 생략된 채, 사전에 지정한 키워드와 관련된 이벤트를 대상으로 탐지하였다. 이에 본 논문에서는 트위터의 특징을 반영한 TFIDF 변형 알고리즘인 RTFIDF VT를 제안하고, 실험을 통해 이벤트 탐지에 최적인 것으로 검증된 TF와 DF 구간을 밝힌다. 최종 검증된 TF와 DF의 구간과 RTFIDF VT를 적용하여 특정시점을 입력받아 이벤트로 예상되는 지역명들과 이벤트 관련 키워드의 결과 집합을 추출하는 시스템을 제안한다.

대통령 기록관 및 기록물에 대한 SNS 이용자 인식변화 분석: 탄핵 전후 기간의 트위터와 뉴스 프레임 분석을 중심으로 (Analysis of Changes in SNS Users' Perceptions of Presidential Archives and Records: Focusing on Twitter and News Frame Analysis before and after Impeachment)

  • 최두원;김건;이균형;윤승욱
    • 한국기록관리학회지
    • /
    • 제19권1호
    • /
    • pp.167-194
    • /
    • 2019
  • 본 연구는 탄핵 전후 국내 대통령 기록관 및 기록물에 대한 이용자 프레임을 분석하여 인식변화를 파악하는데 그 목적이 있다. 이를 위해 탄핵 전후의 프레임 분서에 대한 문헌조사를 수행하고, 관련 트위터를 수집 분석하였다. 이후 선행연구와 트위터 네트워크 분석을 통해 연구에 활용할 책임귀인, 인간적 흥미, 갈등, 도덕성, 법적 쟁점 등 5개 프레임을 설정했으며, 이를 통해 트위터에서 추출한 트위터, 뉴스를 분석하여 시간에 따른 프레임의 변화를 분석하였다. 분석결과, 인간적 흥미 프레임이 가장 높은 비율을 보였으며, 책임귀인 및 인간적 흥미 프레임은 모든 구간에서 높은 비율을 나타냈다. 이러한 프레임 분석을 통해 탄핵 전후에 따른 프레임의 변화를 살펴보고, 대통령 기록물 및 기록관에 대한 일반 대중들의 인식변화를 파악했으며, 어떠한 부분에 관심이 많았는지 분석하였다. 본 연구는 대통령 기록관 및 기록물에 대한 일반 대중들이 보인 인식의 변화를 파악한 점, 일반 대중들이 관심을 보인 부분이 무엇인지를 파악했다는 점에서 그 의의가 있다.