• 제목/요약/키워드: Tweet data

검색결과 54건 처리시간 0.028초

소셜 네트워크 서비스에 노출된 개인정보의 소유자 식별 방법 (A Method of Identifying Ownership of Personal Information exposed in Social Network Service)

  • 김석현;조진만;진승헌;최대선
    • 정보보호학회논문지
    • /
    • 제23권6호
    • /
    • pp.1103-1110
    • /
    • 2013
  • 본 논문에서는 소셜 네트워크 서비스 상에 공개된 개인정보의 소유자 식별 방법을 제안한다. 구체적으로는 트위터상에 언급된 지역 정보가 게시자의 거주지를 의미하는지를 자동으로 판단하는 방법이다. 개인정보 소유자 식별은 특정인의 개인정보가 온라인 상에 얼마나 노출되어 있는지 파악하여 그 위험도를 산정하기 위한 과정의 일부로서 필수적이다. 제안 방법은 트윗 문장의 어휘 및 구조적 특징 13개를 자질(feature set)로 활용한 소유자 식별 규칙들을 통해 지역정보가 게시자의 거주지를 의미하는지 판단한다. 실제 트위터 데이터를 이용한 실험에서 제안방법이 n-gram을 자질로 사용한 나이브베이지안 같은 전통적인 문서 분류 모델보다 더 높은 성능 (F1값 0.876)을 보였다.

Anatomy of Sentiment Analysis of Tweets Using Machine Learning Approach

  • Misbah Iram;Saif Ur Rehman;Shafaq Shahid;Sayeda Ambreen Mehmood
    • International Journal of Computer Science & Network Security
    • /
    • 제23권10호
    • /
    • pp.97-106
    • /
    • 2023
  • Sentiment analysis using social network platforms such as Twitter has achieved tremendous results. Twitter is an online social networking site that contains a rich amount of data. The platform is known as an information channel corresponding to different sites and categories. Tweets are most often publicly accessible with very few limitations and security options available. Twitter also has powerful tools to enhance the utility of Twitter and a powerful search system to make publicly accessible the recently posted tweets by keyword. As popular social media, Twitter has the potential for interconnectivity of information, reviews, updates, and all of which is important to engage the targeted population. In this work, numerous methods that perform a classification of tweet sentiment in Twitter is discussed. There has been a lot of work in the field of sentiment analysis of Twitter data. This study provides a comprehensive analysis of the most standard and widely applicable techniques for opinion mining that are based on machine learning and lexicon-based along with their metrics. The proposed work is helpful to analyze the information in the tweets where opinions are highly unstructured, heterogeneous, and polarized positive, negative or neutral. In order to validate the performance of the proposed framework, an extensive series of experiments has been performed on the real world twitter dataset that alter to show the effectiveness of the proposed framework. This research effort also highlighted the recent challenges in the field of sentiment analysis along with the future scope of the proposed work.

소셜 미디어에 기반한 이벤트 정보의 시공간적 시각화를 통한 추이 분석 (Trend Analysis using Spatial-Temporal Visualization of Event Information based on Social Media)

  • 오효정;윤보현;유철중;김용
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.65-75
    • /
    • 2014
  • 본 논문의 주안점은 다양한 매스 미디어에 나타난 이벤트(event) 정보를 자동으로 인식하고, 이를 시간 및 장소 축으로 시각화함으로써 특정 이벤트의 시간의 흐름에 따른 장소 이동의 추이를 분석하는 데에 있다. 특히 사용자가 직접 작성한 소셜 미디어에 기반하여 이벤트를 추출하고 그들 간의 연속성 분석을 통해 해당 이벤트의 변화 방향성과 사회적 영향을 가늠할 수 있다. 연속성 이벤트의 특성을 규명하기 위해 2년간의 뉴스 기사 및 트윗(tweet)을 수집하여 관련 도메인 선정을 위한 전수조사를 수행하였다. 수행 결과, '질병'과 '여가'도메인을 선정, 본 논문에서 제안한 시각화 방법을 적용한 사례 연구를 통해 시간 및 장소 관점에서의 시각화를 통한 추이 분석의 효용성과 제안된 방법의 유용성을 검증하였다. 특히 단순 사실기반의 연속성 시각과 결과와 사용자의 관심도가 반영된 소셜 미디어에 기반한 연속성 시각화 결과를 비교한 결과, 같은 시기의 이벤트들이라 하더라도 사회적으로 미치는 파장이 큰 장소 이동의 흐름을 파악할 수 있음을 보였다.

사회적 재난에 대한 트위터 여론 수렴 모델: '가습기 살균제' 사건을 중심으로 (A Collecting Model of Public Opinion on Social Disaster in Twitter: A Case Study in 'Humidifier Disinfectant')

  • 박준형;류법모;오효정
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권4호
    • /
    • pp.177-184
    • /
    • 2017
  • 최근 점차 복잡해져가는 사회구조 속에서 사회적 재난은 빈번하게 발생되고 있으며, 그 피해 규모 또한 점차 대형화되고 있다. 따라서 사회적 재난에 신속하게 대응함으로써, 추가 피해를 방지할 수 있는 체계화된 방법이 필요하다. 그 중에서도 소셜미디어, 특히 트위터는 신속성 및 확장성이 높아 재난에 대한 대응책으로 새롭게 주목받고 있다. 다양한 대중들의 관심이 드러나는 트위터의 여론을 수렴하는 것은 재난 발생에 신속하게 대응하고, 추가적인 피해를 방지하는데 유용한 수단으로 활용될 수 있다. 따라서 본 연구는 키워드 분석 및 이슈 트윗 추출, 시계열 분석 과정을 통해 사회적 재난에 대한 트위터 여론 수렴 방법을 제안하였으며, 최근 사회적으로 이슈화된 가습기 살균제 사건을 연구 대상으로 선정, 실제 적용가능성을 보이는데 의의가 있다.

문화콘텐츠 상품 확산의 시·공간적 특성 -싸이의 "강남스타일" 뮤직비디오를 중심으로- (Spacio-temporal Characteristics of Cultural Contents Diffusion: The Case of PSY's "Gangnam Style" Music Video)

  • 이금숙;김호성
    • 한국경제지리학회지
    • /
    • 제18권2호
    • /
    • pp.224-241
    • /
    • 2015
  • 본 연구의 목적은 문화콘텐츠 상품의 소비 및 확산에 나타나는 시공간적 특징을 밝히는 것이다. 이를 위하여 본 연구에서는 최근 전 세계적 인기를 누리며 확산되고 있는 싸이의 "강남스타일" 뮤직비디오의 확산과정을 분석한다. 특히 싸이의 "강남스타일"이 유튜브에 탑재된 이후 4~6개월간의 지역별 유튜브 조회 수와 트윗 자료 및 구글 검색 수를 바탕으로 이들이 확산되어 나가는 과정의 시공간적 특성을 파악 한다. 분석 결과 뮤직비디오와 같은 문화콘텐츠 상품의 경우 물리적인 공간 거리와 무관할 수 있는 온라인 매체를 통한 확산의 경우도 지역에 따라 전파되는 시점과 전개 과정이 상이함을 확인하였다. 특히 언어, 문화적 연관성 및 한류에 대한 호의성 및 배타성 등으로 정의될 수 있는 문화적 거리가 이러한 문화 상품의 확산에 영향을 미치는 것으로 판단된다.

  • PDF

트위터에서 문맥상 지역명을 기반으로 한 불특정 이벤트 탐지 시스템 (Unspecified Event Detection System Based on Contextual Location Name on Twitter)

  • 오평화;임준엽;윤진영;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.341-348
    • /
    • 2014
  • 스마트폰의 확산으로 인한 웹 접근성의 발달은 소셜 네트워크를 기반으로 하는 플랫폼 서비스 이용자의 급격한 증가를 이끌어냈다. 그중에서도 개방적인 네트워크를 기반으로 빠른 확산과 강력한 영향력을 보이는 트위터(Twitter)는 하루 평균 5억 건이 넘는 트윗(Tweet)이 생산되는 대표적인 서비스이다. 따라서 트위터를 이용하여 이벤트를 탐지하려는 다양한 연구들이 진행되고 있다. 그러나 기존의 연구들은 이벤트 탐지를 위해 트윗을 구성하는 다양한 조건에 대한 고려 없이 일반 문서와 동일하게 일반적인 TFIDF 알고리즘을 적용하였다. 또한 TF와 DF에 대한 언급이 생략된 채, 사전에 지정한 키워드와 관련된 이벤트를 대상으로 탐지하였다. 이에 본 논문에서는 트위터의 특징을 반영한 TFIDF 변형 알고리즘인 RTFIDF VT를 제안하고, 실험을 통해 이벤트 탐지에 최적인 것으로 검증된 TF와 DF 구간을 밝힌다. 최종 검증된 TF와 DF의 구간과 RTFIDF VT를 적용하여 특정시점을 입력받아 이벤트로 예상되는 지역명들과 이벤트 관련 키워드의 결과 집합을 추출하는 시스템을 제안한다.

SNS 감성분석을 이용한 정보 추출 방법론에 관한 연구 (Study on the Methodology for Extracting Information from SNS Using a Sentiment Analysis)

  • 홍두표;정하림;박상민;한음;김홍회;윤일수
    • 한국ITS학회 논문지
    • /
    • 제16권6호
    • /
    • pp.141-155
    • /
    • 2017
  • 최근 SNS 이용이 활발해짐에 따라 많은 사람들이 특정 이벤트 등에 대한 자신들의 생각을 비정형 데이터인 텍스트 형태로 자신의 SNS에 게시하고 있다. 이에 따라 금융, 유통 등 다양한 분야에서 이미 SNS를 이용하여 서비스 만족도 조사, 소비자 요구사항 모니터링, 대선 후보 선호도 등을 수행하고 있다. 하지만 교통 분야에서는 감성분석과 같은 비정형 데이터 분석을 활용하는 사례가 부족한 실정이다. 이에 본 연구에서는 한국도로공사에서 수집한 비정형 데이터인 고속도로 VOC 데이터를 이용하여 교통분야에서 사용할 수 있는 감성분석 방법론을 개발하였다. 개발된 감성분석 방법론은 수집된 비정형 데이터에 대한 형태소 분석, 감성사전 구축, 감성 판별 등으로 구성되어 있다. 개발된 방법론은 고속도로 관련 트윗 데이터를 이용하여 검증하였다. 분석 결과, 분석 기간 동안 고속도로와 관련하여 공사, 사고에 대한 정보 전달이 많이 이루어졌음을 짐작할 수 있었다. 또한 공사 및 사고로 인해 발생한 지체에 대하여 이용자들의 불만이 높았던 것으로 판단된다. 결론적으로 SNS 감성분석이 교통분야에서도 의미 있는 정보추출이 가능한 기법임을 확인하였다.

트위터 상의 이미지 이용에 관한 분석 (An Analysis of Image Use in Twitter Message)

  • 정은경;윤정원
    • 한국비블리아학회지
    • /
    • 제24권4호
    • /
    • pp.75-90
    • /
    • 2013
  • 이용자들은 최근 소셜 미디어를 활발하게 이용하고 있으며, 소셜 미디어는 이미지와 같은 멀티미디어 정보의 배태가 주요한 특징이다. 본 연구는 트위터 상에서 이미지 이용 행태를 규명하고자 하였다. 이를 위하여 2013년 4월에 발생한 "보스턴 마라톤 대회 테러" 사건과 관련된 1,589건의 이미지 포함 트윗 메시지를 수집하여 이 중에서 영향력 있는 트윗 메시지 200건과 선호하는(favorite) 트윗 메시지 200건, 무작위로 선택된 일반 트윗 메시지 200건을 각각 선정하여 데이터 분석을 실시하였다. 데이터 분석은 두 단계의 분석과정과 세 그룹의 데이터 셋을 대상으로 수행하였다. 첫 번째 단계에서는 기존 선행연구를 바탕으로 개발된 코딩 체계를 활용하여 세 그룹의 데이터에 대해서 트윗 메시지, 이미지 이용, 이용자에 관하여 각각 수행되었다. 두 번째 단계는 세 그룹의 데이터 셋(일반 트윗, 영향력 있는 트윗, 선호하는 트윗)의 코딩 결과를 비교 분석하였다. 이러한 분석과정을 통해서, 의견을 표현하는 트윗이 가장 선호되었으며, 정보를 공유하는 트윗이 가장 영향력이 있는 것으로 나타났다. 이미지 이용 관점에서는 정보배포, 일러스트레이션, 감정적/설득적, 정보처리 이용목적이 가장 두드러지게 나타났다. 이러한 이미지 이용은 기존의 이미지 이용 패턴과 달리 이미지를 데이터로서 이용하는 목적이 객체 중심으로 이용하는 목적보다 높은 것으로 나타났다. 이용자 분석에서는 정부기관, 유명인, 이미지 사이트가 가장 선호되고 영향력 있는 것으로 나타났다. 이러한 연구결과는 이용 맥락 관점의 차세대 이미지 정보 검색 패러다임을 위한 이용자 관점의 이해 증진에 기여할 수 있을 것으로 기대한다.

텍스트 및 영상의 멀티모달분석을 이용한 트위터 사용자의 감성 흐름 모니터링 기술 (Monitoring Mood Trends of Twitter Users using Multi-modal Analysis method of Texts and Images)

  • 김은이;고은정
    • 한국융합학회논문지
    • /
    • 제9권1호
    • /
    • pp.419-431
    • /
    • 2018
  • 본 논문은 개인 사용자의 트윗을 분석하여 사용자의 감정 흐름을 모니터링할 수 있는 새로운 방법을 제안한다. 본 논문에서는 사용자의 감성 흐름을 정확하게 예측하기 위해서 기존의 텍스트 위주의 시스템과 달리 본 연구에서는 사용자가 쓴 텍스트와 영상 등으로부터 감성을 인식하는 멀티 모달 분석 기법이 개발된다. 제안된 방법에서는 먼저 어휘분석 및 문맥을 이용한 텍스트분석기와 학습기반의 영상감성인식기를 이용하여 텍스트 및 영상 트윗에 숨겨진 개별 감성을 추출한다. 이후 이들은 규칙기반 통합 방법에 의해 날짜별로 통합되고, 마지막으로 개인의 감성흐름을 보다 직관적으로 관측할 수 있도록 감성흐름그래프로 시각화한다. 제안된 방법의 효용성을 평가하기 위해 두 단계의 실험이 수행되었다. 먼저 4만여 개의 트윗으로부터 제안된 방법의 정확도 평가 실험이 수행되고, 최신 트윗 분석 기술과 비교 분석되었다. 두 번째 실험에서는 40명의 우울증을 가진 사용자와 일반사용자를 구분할 수 있는지에 대한 실험이 수행된 결과, 제안된 기술이 실제 사용자의 감성흐름을 모니터하는데 효율적임을 증명하였다.

트위터의 감정 분석을 통한 실시간 장소 추천 시스템 (Real-time Spatial Recommendation System based on Sentiment Analysis of Twitter)

  • 오평화;황병연
    • 한국전자거래학회지
    • /
    • 제21권3호
    • /
    • pp.15-28
    • /
    • 2016
  • 본 논문에서는 모바일에서 획득한 GPS(Global Positioning System)를 활용하여 사용자의 위치 주변에서 발생한 SNS 데이터를 수집하고 분석을 통해 사용자가 원하는 장소를 추천하는 시스템을 제안한다. 이를 위해 트위터에서 위치정보를 포함하는 게시글을 표본 집합으로 정하고 모바일의 위치정보와 함께 활용했을 때, 사용자의 검색의도에 부합하는 양질의 정보를 제공할 수 있음을 실험을 통해 증명하였다. 이를 위해 2015년 11월부터 12월까지 수집한 트윗(Tweet)을 대상으로 임의의 위치정보와 검색어로 구성된 질의를 구성하고 형태소 분석을 거쳐 분석에 적합한 형태의 데이터로 변환하였다. 또한 장소 추천을 위해 감정사전을 구축하여 긍정 및 부정을 의미하는 극성 키워드들을 정의하고 레이블을 구성한 후, 감정사전과 극성키워드를 이용해 개별 트윗의 추천 점수를 도출하였다. 논문은 추천 점수와 사용자의 현재 위치, 트윗이 작성된 위치와 사용자 위치 사이의 거리 계산을 통해 가까운 거리 순으로 10개의 장소 정보를 정렬하여 결과를 보인다. 또한 성능평가를 위해 감정 분석된 트윗에 대한 정밀도와 재현율을 도출하여 시스템의 성능을 확인한다. 실험은 '맛집', '공연' 2개의 키워드와 10개 지역을 기준으로 수행하였다. 실험 결과 키워드 1개당 수집된 트윗은 평균 10.5개였으며, 총 10번의 실험에 사용된 평균 210개의 트윗 중 긍정 또는 부정의 단어를 포함한 트윗의 개수는 평균 122개였다. 또한 감정 분석을 통해 긍정 또는 부정으로 분류된 트윗은 평균 65개였으며 그 중 실제로 긍정 또는 부정의 의미를 담은 트윗은 평균 46개였다. 이를 통해 시스템은 38%의 재현율로 감정요소를 담은 트윗을 탐지하고, 71%의 정밀도로 감정 분석을 수행했음을 확인했다.