• 제목/요약/키워드: 트윗 분석

검색결과 128건 처리시간 0.024초

국내 트위터 유저 분석을 위한 예비연구 (Preliminary Research for Korean Twitter User Analysis Focusing on Extreme Heavy User's Twitter Log)

  • 정혜란;지숙영;이중식
    • 한국HCI학회논문지
    • /
    • 제5권1호
    • /
    • pp.37-43
    • /
    • 2010
  • 트위터는 2006년 10월에 출시된 이래로 지속적으로 성장하고 있다. 특히 방문자 수 등의 수치적인 성장과 함께 마이크로 블로깅(micro blogging)이라는 새로운 소셜 네트워크의 양식을 확산시키고 있다. 국내에서도 me2day 등 '토종' 서비스가 등장했을 뿐 아니라, 향상된 모바일 디바이스의 인터넷 접근성이 마이크로 블로그의 확산을 자극 할 것으로 예측된다. 이런 맥락에서 본 연구는 마이크로 블로그라는 새로운 매체에 대한 예비 연구를 시도한다. 이를 위해, 국내 상황에 초점을 맞추어 국내 트위터 사용자 로그를 수집, 분석했다. 특히, 트위터라는 '외산' 서비스의 언어적, 문화적 장벽에도 불구하고 이를 극단적으로 활발하게 이용하는 "익스트림 헤비 유저"에 주목하여, 이들은 도대체 누구이며 왜, 어떤 방식으로 마이크로 블로그를 이용하는지 검토했다. 먼저, 무작위 추출 방식으로 일정 수준의 표본을 수집하여 팔로우와 메시지 작성 활동의 전반적인 양상을 검토하였다. 여기서 로렌츠 커브를 적용하여 활동의 쏠림 현상을 확인하였고, 이 곡선을 토대로 국내 트위터 강참여자 집단인 익스트림 헤비 유저 그룹을 도출하였다. 본 연구에서 확보한 표본 가운데에는 총 6명의 익스트림 헤비 유저가 있었고, 이들의 2010년 1월 중 일주일치의 실제 트위터 로그를 추가로 수집하여 분석하였다. 결과적으로 이들은 모바일과 데스크탑에서 다수의 클라이언트를 이용하여 다양한 방식으로 트위터에 접근하고 있었으며, 인터넷 이용 시간과 유사한 패턴으로 이용하되, 생활 속에서 "촘촘한(micro)" 시간 간격으로 꾸준히 많은 양의 메시지를 작성하고 있었다. 중요한 정보, 특별한 이벤트나 감정을 다룰 뿐 아니라, 습관적으로 트위터를 이용하고 있었으며 무엇보다 이들은 마치 SMS나 인터넷 메신저처럼 일종의 '대화의 도구'로써 트위터를 이용하고 있었다. 수집기간 중 이들이 작성한 트윗의 68%가 대화형에 속하는 것으로 나타났다. 또한 나머지 중 24%는 리트윗으로, 가상적으로(virtually) 연결된 '사람' 및 '관계'가 발화의 지배적인 동인(trigger)으로 작용하고 있음을 확인하였다.

  • PDF

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

LSTM 기법을 활용한 수위 예측 알고리즘 개발 시 비정형자료의 역할에 관한 연구: 잠수교 사례 (Role of unstructured data on water surface elevation prediction with LSTM: case study on Jamsu Bridge, Korea)

  • 이승연;유형주;이승오
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1195-1204
    • /
    • 2021
  • 최근 이상기후로 인한 국지성호우가 잦아져 하천변 사회기반시설을 포함한 인적·물적 피해가 급증하고 있다. 본 연구에서는 해당 시설들의 침수 피해를 예측·방지하고자 기계학습 중 시계열자료에 특화된 LSTM(Long Short- term Memory)기법을 활용하여 수위 예측 알고리즘을 개발하였다. 연구대상지는 잠수교로 연구기간은 총 6년(2015년~2020년)의 6, 7, 8월로 3시간 후의 잠수교 수위를 예측하였다. 입력자료(Input data)는 잠수교 수위(EL.m), 팔당댐 방류량(m3/s), 강화대교 조위(cm), 서울시 트윗의 개수로 기존 연구에 주로 사용된 정형자료뿐만 아니라 워드클라우드를 통해 구축된 비정형자료도 함께 사용하여 상호 보완형 자료를 구축하고, 비정형자료 활용 유무의 비교·분석을 통해 비정형자료의 역할도 제시하였다. 잠수교의 수위 예측 시 상호 보완형의 자료가 정형자료만을 사용한 경우에 비해 예측 정확도가 향상하였는 데, 이는 인명 피해를 감소시킬 수 있는 보수적인 예/경보가 가능함을 알 수 있었다. 본 연구에서는 하천변 사회기반시설의 이용자 안전 및 편의 제공에 상호 보완형 자료의 사용이 보다 효과적이라 판단하였다. 향후에는 비정형자료의 종류를 추가하거나 입력자료의 세밀한 전처리를 통하여 더욱 정확한 수위 예측을 기대해본다.

감정과 날씨에 따른 개인 맞춤형 옷 및 음식 추천 시스템 (Personalized Clothing and Food Recommendation System Based on Emotions and Weather)

  • ;박두순
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.447-454
    • /
    • 2022
  • 4차 산업혁명 시대를 맞아 우리는 정보의 홍수 속에 살고 있다. 이런 환경에서 우리에게 필요한 정보를 찾기란 매우 어렵고 복잡하다. 따라서 정보의 홍수 속에서 추천 시스템은 필수적이다. 이러한 추천 시스템 중 영화, 음악, 음식, 의류의 각각에 대한 추천 시스템들은 많은 연구가 진행되어 왔다. 현재까지 대부분의 개인화 추천 시스템들은 개인의 성향인 나이, 장르, 지역, 성별 등을 체크해서 옷들을 추천한다던가, 책들을 추천한다던가, 영화들을 추천해왔다. 미래 세대에서는 나이, 장르, 지역, 성별 등을 체크해서 옷, 책, 영화들을 한꺼번에 추천 받기를 원할 것이다. 본 논문에서는 사용자의 감정과 날씨에 따라 개인 맞춤형 옷과 음식을 한꺼번에 추천하는 추천 시스템을 제안한다. 소셜미디어인 트위터에서 사용자의 데이터를 얻었고, 트윗을 기반으로 감정 분석을 해서 Paul Eckman 이론에 따라 사람의 6 가지의 기본 감정으로 분류했다. 이렇게 얻어진 기본 감정을 Hayashi의 Quantification Method III를 적용하여 색깔로 변환하였으며, 이러한 색깔은 추천하는 옷의 색상으로 표현하였다. 또한, visualcrossing.com API의 날씨 정보를 이용하여 의류의 종류를 추천한다. 그리고 감정에 따른 컴포트 푸드의 내용에 따라 다양한 음식을 추천한다.

브랜드 개성 효과: 트위터 상의 브랜드 개성 전달이 온라인 커뮤니티 참여에 미치는 영향 (The Brand Personality Effect: Communicating Brand Personality on Twitter and its Influence on Online Community Engagement)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.67-101
    • /
    • 2014
  • 새로운 기술의 활용은 고객과의 관계를 맺기위한 기업들의 마케팅 전략을 변모시켜왔다. 새로운 기술 중에서 소셜 미디어는 기업들이 온라인 고객들에게 다가가기 위한 도구이며, 유명한 소셜 미디어 사이트 중의 하나는 마이크로 블로깅 플랫폼인 트위터이다. 매일 5억건이상의 트윗이 발생하기때문에 연구자들에게는 풍부한 데이터의 원천이며, 기업들에겐 매력적인 마케팅 채널이다. 그럼에도 불구하고 효과적인 트위터 활용전략을 수립하는 것이 어려우며, 이는 적절한 트위터 활용에 대한 이론적인 또는 실증적인 검증이 이루어지지 않았기 때문이다. 본 연구는 기업들이 마케팅 채널로서의 트위터를 어떻게 효과적으로 활용할 수 있는지에 대한 실증적인 근거를 브랜드 개성과 브랜드 관여를 중심으로 연구하여 제공하고자 한다. 본 연구는 Aaker의 브랜드 개성에 대한 연구에서 제시한 브랜드 개성 척도를 활용하여 트위터 메시지가 브랜드 개성을 띄고 있는지와 이에 따른 고객들의 참여와 반응을 분석하고자 한다. 또한, 제품의 관여도에 따라서 조절효과가 존재하는지도 분석하였다. 23개 브랜드의 8주간의 트위터 계정의 포스팅을 수집하였으며, 오피니언 마이닝을 통하여 연구 가설을 검증하였다. 구체적인 본 연구의 목적은 첫째로 마케팅 연구에서 제시된 브랜드 개성의 개념이 소셜 미디어인 트위터에도 적용이 가능한지 분석하는 것이다. 둘째는 오프라인 브랜드 개성과 온라인 브랜드 개성간의 일치여부와 소셜 미디어 브랜드 커뮤니티의 활성화간의 관계를 밝히고자 한다. 마지막으로, 제품의 관여도에 따라 온라인/오프라인 브랜드 개성의 일치도가 조절효과를 갖는지를 분석하고자 한다.

K-pop 수용자의 세계관 수용 현상 연구 : 그룹 에스파의 세계관 사례를 중심으로 (A phenomenon Study on Acceptance Universe of K-pop Audience : Focused on Group Aespa's Universe Case)

  • 김나경
    • 트랜스-
    • /
    • 제12권
    • /
    • pp.173-222
    • /
    • 2022
  • 이 논문은 현재 K-pop분야 콘텐츠 전략으로 활용되고 있는 '세계관' 수용 현상에 대해 K-pop수용자 관점에서 살펴본 후, 그들의 수용 경험과 세계관의 의미 인식을 파악하고자 하였다. 이를 위해 현재 가장 활발하게 세계관을 콘텐츠 전략으로 활용하는 그룹 에스파의 세계관 수용경험과 관련된 트윗을 수집하여, 이 자료를 개인 경험의 의미구조 및 현상의 본질을 탐구하고자 하는 접근방식인 현상학적 접근방식에 따라 분석하였다. 무스타카스의 방식을 활용하여 분석한 결과, 총 21개의 주제를 통해 K-pop 수용자들의 세계관 수용 현상의 의미구조를 도출하였다. 현재 K-pop 수용자들은 세계관 수용을 통해 일방적이거나 수동적이기 보다는 능동적인 문화소비 경험을 하고 있는 것으로 나타났다. 이는 의미를 생산하고 팬덤 내부의 활발한 상호작용을 통해 외부 영향력을 행사하는 대안적 공동체인 능동적 수용자의 특성을 K-pop 수용자들이 지니고 있으며, 동시에 이 특성이 세계관을 수용하는 세부 행위들에 영향을 미치고 있음을 의미한다. 다음으로는 능동적 수용 경험을 통해 K-pop 수용자들이'마케팅 자산', '팬덤 공동체 자산', 'K-pop 산업 확장 자산'이라는 의미를 세계관에 부여하고 있음이 발견되었다. 이 중 '마케팅 자산'인식은 관련 선행연구들의 논의들을 뒷받침하는 근거로 재확인 되었다. 뿐만 아니라, 기존의 생산자적 측면의 선행연구들이 발견하지 못한 '팬덤 고유의 자산'과 'K-pop 산업의 확장 자산'의미를 발견하여 K-pop 분야 세계관의 새로운 가치를 도출하였으며, 향후 세계관의 가치 확장 측면에서 그 의미 및 방향성을 논의하여 제시하였다. 결과적으로, 이 연구는 세계관 수용 현상의 의미구조를 밝혀냈다는 것과, 기존에 논의되지 않았던 K-pop 세계관의 새로운 의미를 발견했다는 데 의의가 있으며, 관련 주제의 후속 연구를 다각도에서 제언하는 것을 통해 연구의 장을 넓히는데 기여하고자 하였다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

텍스트 분석을 활용한 정보의 수요 공급 기반 뉴스 가치 평가 방안 (A Method for Evaluating News Value based on Supply and Demand of Information Using Text Analysis)

  • 이동훈;최호창;김남규
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.45-67
    • /
    • 2016
  • 최근 정보 유통의 주요 매체인 인터넷 뉴스와 SNS의 매체 간 특성 차이를 주목한 많은 연구가 있었음에도 불구하고, 양 매체의 차이를 정보의 수요 및 공급 관점에서 파악한 연구는 상대적으로 매우 부족하다. 일반적으로 새로운 정보는 언론사의 뉴스 기사를 통해 대중에게 노출되고, 대중은 이러한 기사에 대한 의견 또는 추가정보를 SNS를 통해 공유함으로써 해당 정보를 수용함과 동시에 확산시킨다. 이러한 측면에서 언론사가 뉴스를 제공하는 행위를 정보의 공급으로 파악할 수 있으며, 대중은 SNS를 통해 이에 대한 관심을 능동적으로 나타냄으로써 해당 정보에 대한 소비 수요를 표출하는 것으로 이해할 수 있다. 이는 상품 및 서비스의 가격이 수요와 공급의 관계에 의해 결정되는 것과 유사한 원리로, 정보의 가치를 정보 수요와 정보 공급의 관계에 기반을 두어 측정할 수 있음을 시사한다. 본 연구에서는 정보 공급의 대표 매체로 인터넷 뉴스 기사를, 정보 수요를 나타내는 대표 매체로 트위터를 선정하고, 특정 이슈에 대한 뉴스의 정보로서의 가치를 이와 관련된 트위터의 양으로 평가하는 뉴스가치지수(NVI, News Value Index)를 고안하여 제시한다. 구체적으로 제안 방법론은 각 이슈별로 NVI를 도출하고 이를 통해 시간의 흐름에 따른 정보 가치의 변화를 시각화하여 나타낸다. 또한 본 연구에서는 제안 방법론의 실무 적용 가능성을 평가하기 위해 인터넷 뉴스 387,018건과 트윗 31,674,795건에 대한 실험을 수행하였다. 그 결과 대부분의 이슈가 전체 정보 시장의 평균 가치에 수렴하는 형태로 변화함을 알 수 있었으며, 꾸준히 평균 이상의 가치를 가지며 정보 시장을 장악하는 등 특이한 양상을 보이는 흥미로운 이슈도 존재함을 파악할 수 있었다.