• 제목/요약/키워드: 트윗 분석

검색결과 128건 처리시간 0.031초

문체 분석을 활용한 한국어 트위터 사용자의 연령대 및 성별 예측 (Age and Gender Prediction from Korean Tweets with Stylometric Analysis)

  • 김상채;박종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.303-305
    • /
    • 2012
  • 사람들은 주변의 영향을 받아 가면서 각자의 독특한 글쓰기 양식을 만들어간다. 따라서 같은 연령대와 성별을 가지는 사람들은 유사한 글쓰기 양식을 나타내는 경향이 있다. 이와 같은 가정을 바탕으로, 본 연구에서는 다양한 연령대와 성별의 사람들이 작성한 트윗의 문체를 분석하여 임의의 트윗을 작성한 저자의 연령대와 성별을 예측하는 실험을 진행하였다. 한국어 웹 언어에서 자주 보이는 표현들을 토대로 구성한 자질들과, 그에 비해 데이터와 관계가 적은 n-gram 단위의 자질들을 함께 사용하여 예측을 진행함으로써, 최대 공산 기준치보다 25%가량 높은 정확도를 보이는 예측 결과를 얻게 되었다. 이와 함께 각 자질 구성이 예측에 얼마나 효율적으로 기여하는지에 대한 이해도를 높일 수 있었다.

소셜 네트워크 서비스 기반 마이닝을 이용한 실시간 랜섬웨어 위험도 분석 시스템 설계 (Design of a Real-time Risk Analysis System for Ransomware Using Mining based on Social Network Service)

  • 나재호;김미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.254-256
    • /
    • 2017
  • 본 논문에서는 소셜 네트워크 서비스 중 트위터를 마이닝하여 실시간으로 랜섬웨어 위험도 분석을 하는 시스템을 설계한다. 이를 위해 2017년 5월 12일에 가장 피해가 컸던 워너크라이 랜섬웨어를 중심으로 5월 10일에서 20일 사이의 트윗 데이터를 마이닝하고, 기존 시스템인 구글 트렌드와의 유사성을 비교 실험하여 트윗 데이터의 가치를 확인한다. 마지막으로 제안하는 시스템에 대한 향후 연구주제를 제시한다.

트위터를 활용한 이벤트 결정 모듈 설계 (Designing of Event Decision Module using Twitter)

  • 임준엽;윤진영;이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.680-683
    • /
    • 2014
  • 최근 스마트폰의 보급과 더불어 소셜 네트워크 서비스의 사용자가 급증하였다. 그 중 트위터는 개방적인 네트워크 구조로 인한 정보의 빠른 확산성을 가지고 있다. 또한 트위터 사용자들은 주로 자신들이 경험하거나 겪은 일들을 글로 작성하여 다른 사용자들과 공유한다. 따라서 그들이 남긴 데이터를 수집하고 분석할 수 있다면 트위터를 이벤트 탐지의 도구로써 활용하는 것이 가능하다. 이에 본 논문에서는 트위터를 이용하여 이벤트를 탐지하는 시스템을 제안한다. 실험을 위해 6개월간 수집한 트윗을 이용하였으며 분석을 위해 트윗 발생량에 관한 각종 수치들을 제시하였다. 이를 이용하여 이벤트 후보지역들을 선별하였고 실험 결과 최종 90%의 탐지율로 이벤트 지역들을 추출하였다.

트위터 분석을 위한 분산 시스템 설계 및 구현 (DiSAnT: Design and Implementation of Distributed System for Analysing Twitter)

  • 윤진영;김석중;이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1326-1329
    • /
    • 2012
  • 트위터는 대표적인 소셜 네트워크 서비스이며 스마트 기기의 발달로 사용자 수뿐만 아니라 생성되는 트윗의 수도 지속적으로 늘고 있다. 또한 트위터는 인증과정을 통하여 API 요청을 제한해 데이터의 수집이 어렵기 때문에 트위터 기반 연구를 위해서는 빅 데이터를 처리하기 위한 분산처리 기술이 요구된다. 본 논문에서는 네트워크로 연결된 다수의 클라이언트를 이용해 계정과 트윗의 수집에 용이하고 수집한 데이터를 분석할 수 있는 기능까지 추가한 분산처리 시스템인 DiSAnT을 소개한다.

트위터 자료의 시간별 분석과 감성 자질을 이용한 핵심 사건 추출 (Extracting Core Event Feature Based on Timeline Analysis and Sentiment Feature in Twitter Corpus)

  • 김희환;촐몽 바야르;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.395-398
    • /
    • 2011
  • 트위터 사용자들은 어떠한 이슈에 대해 트위터를 통해 빠르고 간결하게 다른 사람들과의 지속적인 커뮤니케이션을 원하고, 이러한 특징은 이슈 별 사건에 따라 트윗 개수에 영향을 미치게 된다. 만약 어느 하나의 사회적 이슈에 대해 어떠한 사건이 일어나게 되면 그때의 트윗 개수는 폭발적으로 증가하게 된다. 본 논문에서는 이러한 특징을 이용하여 트위터 자료를 시간별로 분석하여 사건을 인식하고, 감성 자질과 카이제곱 값을 이용해 해당 날짜에 대한 핵심 사건을 추출한다.

트위터 유력자와의 의견일치여부가 의견표명에 미치는 영향: 유력자 유형의 상호작용효과를 중심으로 (The Effect of Opinion Congruency with Twitter Influentials on Opinion Expression: The Interaction Effect of Influential Type)

  • 진소연;이숙정
    • 한국콘텐츠학회논문지
    • /
    • 제16권4호
    • /
    • pp.455-465
    • /
    • 2016
  • 본 연구는 트위터 유력자가 이용자의 온-오프라인 의견표명 의도에 미치는 영향을 살펴보고자 하였다. 침묵의 나선 이론과 수정 행동 가설에 근거하여 상반된 가설을 도출하였고, 어느 가설이 더 타당한지를 검증해보기 위해 실험연구를 진행하였다. 실험참가자들은 입양특례법 개정안에 대한 공인 유력자의 찬성 트윗, 공인 유력자의 반대 트윗, 일반인 유력자의 찬성 트윗, 일반인 유력자의 반대 트윗이라는 4개의 실험 조건에 배치되었다. 입양특례법 개정안에 대한 실험참가자의 의견을 바탕으로, 실험집단은 공인 유력자와의 의견일치 집단, 공인 유력자와의 의견불일치 집단, 일반 유력자와의 의견일치 집단, 일반 유력자와의 의견불일치 집단으로 구분되었다. 분석결과, 유력자와의 의견일치여부는 이용자의 의견표명 의도에 영향을 주지 않았다. 그러나 유력자 유형에 따른 상호작용 효과가 발견되었는데, 일반인 유력자와의 의견불일치가 이용자들의 온-오프라인 의견표명 의지를 높이는 것으로 나타났다. 본 연구결과는 트위터 유력자가 이용자들을 침묵시키는 것이 아니라 오히려 의견표명을 동기화시킬 가능성이 있음을 보여준다.

트위터 이용자의 언어권별 자기노출 및 경계 불투과성 (Self-Disclosure and Boundary Impermeability among Languages of Twitter Users)

  • 장필식
    • 한국콘텐츠학회논문지
    • /
    • 제16권4호
    • /
    • pp.434-441
    • /
    • 2016
  • 본 연구에서는 빅데이터 분석기법을 이용하여 트위터 이용자들을 대상으로 언어에 따른 자기노출과 경계불투과성에 대한 양상을 파악하였다. 6개월 동안 5천4백만 명의 트위터 이용자가 작성한 4억여 개의 트윗을 수집하였으며, 이들 중 트윗 수 상위 10개 언어권 이용자의 프로파일 및 관련 데이터를 조사하였다. 이를 통해 트위터 이용자의 언어가 이용자 프로파일, 프로파일 이미지, 지리정보, URL, 사용자 설명 등 자기정보 공개 항목의 공개비율과 경계불투과성에 미치는 영향을 분석하였다. 분석결과, 경계 불투과성과 자기노출 비율(프로파일, 프로파일 이미지, URL, 이용자 설명, 지리정보)은 언어권에 따라 각각 통계적으로 유의한(p<0.001) 차이가 있는 것으로 나타났다. 자기노출 비율과 평균 점수는 포르투갈어, 인도네시아어 및 스페인어 이용자가 아랍어, 일본어, 터키어, 한국어 이용자에 비해 높은 것으로 파악되었다. 또한 리트윗을 포함한 트윗 수가 많은 이용자일수록 경계 불투과성이 높아지는 것으로 나타났다.

메시지 특성, 행위의 결과, 추구 가치에 기반한 리트윗 행위 : 래더링 기법을 이용한 탐색적 연구 (Message Attributes, Consequences, and Values in Retweet Behavior : Based on Laddering Method)

  • 김효동
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.131-140
    • /
    • 2013
  • 이 연구는 트윗과 리트윗 행위가 기존 매스미디어의 기능을 제한적으로 대체한다고 가정하고, 트위터 사용자의 리트윗 행위에 내재한 동기를 파악하는 것을 목적으로 하였다. 래더링 방법을 이용하여 트윗된 메시지의 속성 (Attributes), 리트윗을 함으로써 얻는 결과(Consequences), 그리고 이를 통해서 궁극적으로 추구하는 가치(Values)에 대한 참가자들의 응답을 토대로 질적인 데이터를 구성하고, 여기에서 떠오르는 중요한 테마들(theme)을 기록, 분석했다. 그 결과 리트윗의 이유로 두드러지는 것은 공감과 공유를 통한 자기만족의 가치였고, 이를 위해서 화제성과 정보성이 포함된 트윗 메시지들을 리트윗하는 경향이 많다는 것을 밝혔다. 또 다른 테마로는 공감과 공유를 통해서 남들에게 필요한 도움을 직, 간접적으로 주고자 하는 이타적인 목적과 사회발전추구, 공동체적 의식 등의 공동체적 가치 또한 발견되었다. 연구결과 추출된 총 48항목은 요인분석을 이용하여 몇 개의 잠재변인으로 나눌 수 있는가를 살펴보는 후속연구에 사용되었다.

트위터 사용자의 도시 내 활동반경과 거주지역의 탐색: 라스베이거스 사례 (Investigation of Twitter Users' Activity Radius and Home Region in the City: The Case of Las Vegas)

  • 조재희;서일정
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.505-513
    • /
    • 2017
  • 본 연구는 전 세계에서 발생한 200,578,703건의 지오트윗을 수집하여 트윗 봇을 제거한 후, 인간의 도시 내 이동패턴을 분석하였다. 활동반경(Activity Radius)이라는 개념을 이용하여 트위터 사용자를 구분하였으며, 거주지역을 국내와 국외로 구분하고 국내는 다시 시내와 시외로 구분하였다. 그리고 활동반경과 거주지역에 따라 트위터 사용자의 활동성과 활동지역에 대한 통계적 특성을 기술하였고 지리적 분포를 시각적으로 표현하였다. 라스베이거스를 대상으로 하는 사례 분석을 통해, 거주지역에 따른 활동성과 활동지역의 차이를 확인하였다. 향후 본 연구의 방법에 따라 다양한 도시를 대상으로 분석을 수행하면, 인간의 이동성에 대한 다양한 이론을 도출할 수 있을 것이다.

트위터 기반 고객의 관심도 분석을 통한 마케팅 조언 시스템의 설계 및 구현 (Design and Implementation of Marketing Advisement System through the Concern Degree Analysis of Customers Based on Twitter)

  • 이기영;김혜영;김아름;김성배
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권3호
    • /
    • pp.185-190
    • /
    • 2014
  • 최근 급속한 스마트폰 이용자의 증가와 무선인터넷 서비스의 확장과 함께 SNS 이용자도 급증하고 있다. 많은 SNS 중에서도 트위터(Twitter)는 대한민국 내 SNS 시장을 주도하고 있다. 트위터 이용자들은 트위터를 통해 자신의 생각과 감정을 표현한다. 본 논문에서는 유통업체 인근의 트윗을 오피니언 마이닝을 통해 분석하고 긍정, 중립, 부정의 정도와 트윗의 개수를 이용한 관심도의 분석을 통해 마케터에게 마케팅 메시지를 전달한다. 그 결과, 우리는 해당 유통업체의 마케팅과 운영에 인근 고객의 요구를 반영하는 시스템을 제안한다.