• 제목/요약/키워드: 트윗 분석

검색결과 128건 처리시간 0.027초

도시 지역 트윗 데이터의 시간대별 공간분포 특성 - 부산광역시를 사례로 - (A Study on the Spatial Patterns of Tweet Data for Urban Areas by Time - A Case of Busan City -)

  • 구자용
    • 지적과 국토정보
    • /
    • 제46권2호
    • /
    • pp.269-281
    • /
    • 2016
  • 최근 공간 정보 분야에서 소셜 미디어와 같은 공간 빅 데이터의 분석과 처리에 많은 관심이 집중되고 있다. 본 연구에서는 공간 빅 데이터 분석의 한 사례로서 트윗 데이터가 가지고 있는 위치 정보와 시간 정보를 바탕으로 시간대별로 공간분포를 분석하고 그 특성을 파악하였다. 부산시 지역의 트윗 데이터를 수집하고, 시간대별 공간분석을 통하여 그 특성을 파악하여, 그 지역의 토지이용 특성과 비교하였다. 부산시 지역의 트윗 데이터를 시간대에 따라 평일 주간, 평일 야간, 휴일 주간, 휴일 야간으로 구분하고, 각 시간대별로 공간적 분포 특성을 파악하여, 공간적으로 집중된 지역의 토지이용 특성과 비교하였다. 본 연구의 결과 트윗 데이터는 시간대에 따라 공간분포가 다르게 나타나고 있으며, 이는 그 지역의 일상생활 패턴과 토지이용 특성을 어느 정도 반영하고 있었다. 본 연구에서는 공간정보 분야에서 트윗 데이터와 같은 소셜 미디어 자료의 분석을 통한 활용 가능성을 제시하였다. 향후 토지 계획이나 도시 계획 등의 분야에서 다양한 소셜 미디어 자료를 활용할 수 있을 것으로 전망된다.

트위터 데이터 수집을 위한 동적 시드 선택 (Dynamic Seed Selection for Twitter Data Collection)

  • 이현철;변창현;김양곤;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.217-225
    • /
    • 2014
  • 트위터와 같은 소셜 네트워크 분석은 인간의 행동을 이해하거나, 화제가 되는 주제를 탐지하거나, 영향력 있는 사람을 식별하거나, 커뮤니티나 그룹을 발견하는데 흥미로운 시각을 제공할 수 있다. 하지만 소셜 네트워크가 가지는 특성(즉 데이터가 방대하고, 정교하지 않으며 또한 동적인 특성)으로 인하여 소셜 네트워크에서 주제와 연관이 있는 데이터를 수집하는 것은 어려운 일이다. 본 논문은 주어진 주제와 관련 있는 트윗을 효과적으로 수집하기 위하여 시드 노드를 동적으로 선택하는 알고리즘을 제안한다. 본 알고리즘은 사용자의 영향력을 측정하기 위하여 사용자 속성을 활용하며, 수집 프로세스 중에 시드 노드를 동적으로 할당한다. 우리는 제안한 알고리즘을 실제 트윗 데이터에 적용하였으며, 만족할 만한 성능결과를 얻었다.

트위터 사용자의 위치정보와 성향을 고려한 트윗 수집 시스템 (Tweet Acquisition System by Considering Location Information and Tendency of Twitter User)

  • 최우성;임준엽;황병연
    • Spatial Information Research
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 2014
  • 최근 소셜 네트워크 서비스가 급격히 성장하면서, 소셜 네트워크 분석에 관련된 연구들도 많은 관심을 받고 있다. 특히 트위터는 사회적 이슈나 사건들에 대해 실시간으로 반응하기 때문에, 사회과학 분야나 정보검색 분야의 연구자들이 유용한 실험 데이터를 수집하는 데에 활용되고 있다. 그러나 정작 데이터를 수집하는 방법론에 관한 연구는 아직 미흡하다. 이에 본 논문에서는 위치 기반의 이벤트와 정치 사회적 이벤트 위주의 사용자의 성향을 고려한 트윗 수집 시스템을 제안한다. 우선 위치정보와 이벤트 관련 키워드를 포함하고 있는 트윗과 정치 사회적인 이벤트 검출에 필요한 ID들을 수집한 후, 사용자들의 성향을 분류할 ID 분석기를 설계했다. 또한 ID 분석기의 신뢰도 측정을 위해 상위 등급에 분류된 ID를 이용하여 트윗을 분석했다. 분석결과 1등급으로 분류된 ID는 88.8%의 신뢰도를 보였으며, 2등급으로 분류된 ID는 76.05%의 신뢰도를 보였다. 또한 ID 분석기는 77.5%의 신뢰도를 보였으며 소수의 ID를 사용함으로써 데이터의 수집시간을 줄였다.

국내 공공도서관의 트위터 이용에 관한 내용분석 (A Content Analysis on the Domestic Public Libraries' Use of Twitter)

  • 심지영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.241-262
    • /
    • 2017
  • 본 연구에서는 국내 공공도서관의 트위터 이용을 파악하고 분석하고자 한다. 도서관 정보서비스 환경에서 트위터 이용의 구체적인 패턴을 파악하기 위해, 트위터 이용이 활발한 14개 공공도서관 계정으로부터 3,038개의 트윗 데이터를 수집하여 내용분석을 수행하였다. 귀납적 방식으로 코딩 체계를 수립하였으며, 오픈 코딩 방식을 통해 공공도서관 트윗 데이터를 분석하였다. 또한 도서관별로 활성화된 유형을 파악하기 위해 대응일치분석을 수행하였다. 그 결과, 공공도서관 트위터 이용에 관한 상위 범주 3개와 9개의 하위 범주, 37개의 세부 항목을 파악하였다. 본 연구의 내용분석 결과는 향후 트위터 이용을 계획하는 도서관에게 참고자료로 제시될 수 있으리라 본다.

트윗 데이터를 이용한 황사 관련 질병 유의성 분석 (Significance Analysis of Yellow Dust Related Disease Using Tweet Data)

  • 정용한;서민송;유환희
    • 지적과 국토정보
    • /
    • 제47권1호
    • /
    • pp.267-276
    • /
    • 2017
  • 우리나라는 황사로 인해 농업 및 산업분야, 시민건강 등 다양한 분야에 걸쳐 피해가 발생되고 있으며 이에 대한 대책 마련이 시급한 실정이다. 이에 본 연구에서는 2009년 이후 최대 황사가 나타났던 2015년 2월 23일을 기준으로 전후 11일간의 황사 관련 트윗 데이터를 수집하고, 이슈어 분석, 건강과 관련된 트윗 데이터 그룹 재구성, 질병과의 연관규칙 분석 등을 걸쳐 황사발생과 관련 질병의 유의성을 검정한 결과 다음과 같은 결론을 얻었다. 황사관련 트윗 데이터로부터 도출된 질병과 건강보험심사평가원에서 취득한 환자실태 자료를 종합하여 비염, 천식, 결막염 환자에 대한 유의성 검정을 실시한 결과, 유의확률 5%에서 결막염은 16개 시 도 중 13개 지역에서 유의하게 나타났으며, 비염은 6개 지역에서, 천식은 3개 지역에서 질병 발생에 유의한 것으로 나타났다. 이상과 같이 트윗 데이터와 같은 SNS데이터로 부터 시민들의 건강에 대한 정보를 취득할 수 있었으며, 이를 활용한 시민건강 관리 대책을 수립하는데 유용한 정보를 제공해 줄 수 있을 것으로 판단된다.

감성 분석 및 감성 정보 부착 시스템 구현 (Developing a Sentiment Analysing and Tagging System)

  • 이현규;이성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권8호
    • /
    • pp.377-384
    • /
    • 2016
  • 본 연구의 목적은 트위터에서 수집된 트윗들의 감성을 분석하고 각 문장의 감성 정보를 반자동으로 부착하여 감성 말뭉치를 구축할 수 있는 시스템의 구현이다. 트위터 API를 이용해 트윗을 수집한 후 각 트윗이 어떤 감성을 갖는지 감성사전을 이용해 분석한다. 사용자는 감성 분석 결과를 확인하고 누락된 감성 정보를 추가하거나 의존구조 사이에 존재하는 감성 정보를 추가할 수 있다. 감성 정보는 JSON 구조로 부착함으로써 감성 말뭉치 구축 및 활용에 용이하게 하였다. 제안 시스템은 긍정, 부정, 중립 문장에 대한 감성 분석 결과 약 76%의 성능을 보였다.

트윗 키워드 네트워크를 이용한 구제역의 감성분석 (Sentiment Analysis of Foot-and-mouth Disease using Tweet Keyword Network)

  • 채희찬;이종욱;최윤아;박대희;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.267-270
    • /
    • 2018
  • 구제역으로 인하여 국내 축산업계 및 관련 산업분야는 매년 막대한 피해를 입고 있다. 구제역과 관련한 다양한 학술적 연구들이 현재 진행되고는 있으나, 구제역의 발병에 따른 사회적 파급효과에 관한 공학적 분석 연구는 매우 제한적이다. 본 연구에서는 구제역에 관한 일반 시민들의 감성적 반응을 텍스트 마이닝 방법론을 사용하여 분석하는 체계적인 방법론을 제안한다. 제안하는 시스템은 먼저, 트위터에 게시된 트윗 중 구제역과 관련된 데이터를 수집한 후, 감성사전을 기반으로 극성탐지 과정을 거친다. 둘째, 토픽 모델링의 대표적인 기법 중 하나인 LDA를 활용하여 트윗으로 부터 키워드들을 추출하고, 추출된 키워드들로부터 극성별 동시출현 키워드 네트워크를 구성한다. 셋째, 키워드 네트워크을 통해 각 구간별 구제역의 사회적 파급효과를 분석한다. 사례 분석으로써, 2010년 7월부터 2011년 12월까지 국내에서 발생한 구제역에 관한 일반 시민들의 감성적 변화를 분석하였다.

지오트윗 사용자의 이동 특성 분석에 관한 연구: 국내 이동과 해외 이동 비교 연구 (A Study on the Movement Characteristics of Geotweet Users: A Comparative Study on Domestic and International Movements)

  • 백의영;조재희
    • 한국융합학회논문지
    • /
    • 제11권7호
    • /
    • pp.169-180
    • /
    • 2020
  • 본 연구는 국가 간 이동이 발생한 지오트윗 사용자를 이동거리평균과 이동거리표준편차에 따라 그룹화하여, 국가 간 이동과 자국 내 이동에서 나타나는 특징을 발견하고 연구의 의의를 찾고자 하였다. 데이터마트를 구축 후 국가 간 이동과 자국 내 이동이 발생한 지오트윗을 분리하였고, 해버사인공식을 이용해 사용자의 이동거리를 측정하였다. 국가 간 이동 집단에서는 동일한 언어를 사용하며 생활방식이 비슷한 국가 사이에서 많이 이동하였고, 자국 내 이동에서는 인프라가 잘 구축된 선진국 위주의 국가에서 많은 이동이 발생하였다. 본 연구는 사용자별 이동거리를 계산하여 공통된 특징을 도출하고자 하였으며, 사용자의 이동거리 특성에 따라 그룹화하였다. 본 연구에서 분석한 21개국은 국가별 경제력이나 나이, 직업 등에서 차이가 커 많은 제반 사항이 고려되어야 정밀한 분석이 가능할 것이다. 향후에는 현실적인 사항을 추가한 연구가 진행되어야 할 것이다.

트위터 API를 활용한 트위터 검색 기능 개선 (Improving Twitter Search Function Using Twitter API)

  • 남용욱;김용혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.879-886
    • /
    • 2018
  • 트위터에서 제공해주는 기본 검색 기능은 검색어가 담긴 트윗 뿐 아니라 검색어를 포함하는 닉네임을 가진 유저가 쓰는 모든 트윗들을 보여준다. 따라서 검색 키워드와 관계 없는 트윗들도 검색 결과로 노출하게 되어 해당 키워드가 포함된 트윗 만을 검색하려고 하는 많은 사용자들에게 불편함을 주고 있다. 본 연구에서는 이러한 문제점을 해결하고자 검색 키워드가 들어있는 트윗만을 검색하는 알고리즘을 만들어 트위터 검색 기능을 개선하였다. 개선된 기능은 ASP.NET MVC5를 이용하여 웹 서비스로 구현하여 많은 사람들이 이용할 수 있다. 검색 결과를 모아놓은 객체에 C#의 강력한 컬렉션 메소드를 사용하여 '리트윗' 이나 '마음에 들어요' 의 개수가 많은 순서대로 출력할 수도 있고, 리트윗 숫자가 설정한 수치보다 적을 경우 검색 결과에서 제외할 수 있는 필터 기능도 추가하였다. 따라서 사람들에게 관심을 많이 받는 의견을 빠르게 탐색할 수도 있으며, 이는 검색 이용자와 데이터 분석가들이 트위터에서 검색하는데 편리함을 줄 것으로 기대된다.

텍스트 마이닝을 활용한 대선 관련 SNS 분석 (SNS Analysis Related to Presidential Election Using Text Mining)

  • 권영우;정덕길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.361-363
    • /
    • 2017
  • 최근 소셜 미디어의 이용률이 폭발적으로 증가함에 따라, 방대한 데이터가 네트워크로 쏟아져 나오고 있다. 이들 데이터는 기존의 정형 데이터뿐만 아니라 이미지, 동영상 등의 비정형 데이터가 있으며, 이들을 포괄하여 빅데이터라고 불린다. 이러한 빅데이터는 오피니언 마이닝, 테스트 마이닝 등의 기술적인 분석 기법과 빅데이터 요약 및 효과적인 표현방법에 대한 시각화 기법에 대하여 활발한 연구가 이루어지고 있다. 이 논문은 인기 있는 사회연결망 서비스인 Twitter의 트윗을 수집하고, 빅데이터 분석 기법인 텍스트 마이닝을 활용하여 2017년 대선에 대하여 분석하였다. 또한 분석된 자료의 효과적인 전달을 위해 워드 클라우드 진행하였다. 이 논문을 위하여 인기 있는 SNS인 Twitter의 최근 7일간 트윗(tweet)을 수집하고 분석하였다.

  • PDF