• 제목/요약/키워드: 소셜 데이터

검색결과 974건 처리시간 0.031초

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

소셜미디어 재난이슈 탐지 및 모니터링 (Monitoring and Sensing Disaster Issues from Social Media)

  • 최선화;최우정;이종국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.332-335
    • /
    • 2013
  • 최근 IT기술발전으로 데이터 저장 및 처리비용은 하락하고 소셜네트워크 서비스 등이 확대되어 데이터의 양적 팽창이 가속화되면서 빅데이터에서 가치를 창출하려는 시도가 늘어나고 있다. 특히, 국내 스마트폰 이용자가 3천만을 넘어서면서 모바일 기기는 대량 데이터 생산의 원천이 되고 있다. 모바일 기기는 스마트시대 대표 통신채널인 소셜미디어 활용을 가속화 시키며 다양한 분야에서 영향력을 발휘하고 있다. 특히 일본과 아이티 지진피해, 강남역 침수 등 재난발생 시 피해상황 파악 및 경보, 정보교환 등에 소셜미디어 채널이 활발히 활용되면서 새로운 매체로 떠오르고 있다. 본 논문에서는 언어분석을 통해 소셜미디어 속에 재난이슈를 모니터링하고 소셜미디어가 재난예방 및 대응에 적극 활용되기 위해 필요한 기술개발 방안을 제시하고자 한다.

CoAID+ : 소셜 컨텍스트 기반 가짜뉴스 탐지를 위한 COVID-19 뉴스 파급 데이터 (CoAID+ : COVID-19 News Cascade Dataset for Social Context Based Fake News Detection)

  • 한소은;강윤석;고윤용;안지원;김유심;오성수;박희진;김상욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권4호
    • /
    • pp.149-156
    • /
    • 2022
  • 최근 전 세계적으로 COVID-19이 유행하는 상황 속에서 이와 관련된 가짜뉴스가 심각한 사회적 혼란을 야기하고 있다. 이러한 배경에서 가짜뉴스를 정확하게 탐지하기 위해, 뉴스가 소셜 미디어를 통해 파급되는 과정과 같은 소셜 컨텍스트 정보를 활용하는 소셜 컨텍스트 기반 탐지 기법들이 널리 사용되고 있다. 그러나 대부분의 기 구축된 가짜뉴스 탐지를 위한 데이터들은 뉴스 자체의 내용 정보 위주로 구성되어, 소셜 컨텍스트 정보를 거의 포함하지 않는다. 즉, 이 데이터들에는 소셜 컨텍스트 기반 탐지 기법을 적용할 수 없으며, 이러한 데이터의 한계는 가짜뉴스 탐지 연구 분야의 발전을 저해하는 방해 요소이다. 본 논문은 이러한 한계를 극복하기 위해, 기존의 저명한 가짜뉴스 데이터인 CoAID 데이터를 기반으로, 소셜 컨텍스트 정보를 추가적으로 수집하여, CoAID 데이터의 뉴스 내용 정보와 해당 뉴스들의 소셜 컨텍스트 정보를 모두 포함하는 CoAID+ 데이터를 구축한다. 본 논문에서 구축한 CoAID+ 데이터는 기존의 대부분의 소셜 컨텍스트 기반 탐지 기법들에 적용될 수 있으며, 향후 새로운 소셜 컨텍스트 기반 탐지 기법들에 대한 연구도 더욱 활성화시킬 수 있을 것으로 기대된다. 마지막으로, 본 논문은 다양한 관점에서 CoAID+ 데이터를 분석하여 진짜뉴스와 가짜뉴스의 파급 패턴 및 키워드에 따른 파급 패턴도 파악하여 소개한다.

태그 온톨로지와 기계학습을 이용한 추천시스템 (Recommendation System based on Tag Ontology and Machine Learning)

  • 강신재
    • 한국산업정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.133-141
    • /
    • 2008
  • 소셜웹은 정보를 공유하고 사용자간 연결 정도를 높이기 위해 현재의 웹을 소셜 플랫폼으로 변화시키고 있다. 본 논문은 여러 소셜웹 사이트에 산재되어 있는 소셜 데이터를 중재하고 연결하는 방법을 제공하기 위해 딜리셔스, 플리커, 유튜브와 같은 대표적인 소셜 태깅 사이트의 태깅 데이터를 분석한다. 그 결과로 서로 다른 태깅 데이터를 통합하고 서로 다른 소셜 메타데이터를 연결하기 위한 태그 온톨로지를 제안한다. 또한 태깅 데이터의 기계 학습을 통하여 유사 태그 그룹과 사용자 그룹 정보를 획득한 후 태그 온톨로지를 학습한다. 이의 활용 방안으로는 학습된 태그 온톨로지를 이용하여 모델링한 추천 시스템도 제안한다.

  • PDF

소셜 미디어 오피니언 마이닝에 기반한 기업의 위기관리에 관한 연구 (A Study on Social media Opinion Mining based Enterprise Crisis Management)

  • 차승준;강재우;최재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.142-144
    • /
    • 2012
  • 소셜 미디어가 확산되고 사용자가 증가하면서, 사용자들은 소셜 미디어를 통해 의견을 공유한다. 소셜 미디어는 실시간 정보에 대한 전달이 빠르며 데이터를 수집, 분석할 수 있다. 오피니언 마이닝은 텍스트로부터 사용자의 의견이 포함된 패턴을 추출하여 특정 제품이나 서비스에 대한 의견의 긍정, 부정 표현의 정도를 측정한다. 본 논문에서는 오피니언 마이닝을 기반으로 소셜 미디어 데이터에서 기업의 제품, 서비스와 관련된 사용자의 의견을 분석하여 긍정, 부정인지를 판단한다. 그리고 부정 패턴의 빈도를 통해 기업의 위기 상황을 인지하며, 위기 대응을 위한 4단계의 위기관리 모델을 제시한다. 또한 소셜 미디어에서 기업의 위기관리 사례를 확인하고, 표본조사를 통하여 평가 및 분석을 수행한다. 이 모델을 이용하여 방대한 소셜 미디어 데이터에서 기업의 제품이나 서비스에 대한 부정적 의견을 초기에 감지하고, 체계적으로 대응 할 수 있다.

공공데이터 및 소셜 웹 데이터를 이용한 뷰티 트렌드 분석 서비스 (Beauty Trend Analysis Services using Public Data and Social Web Data)

  • 송재오;김경배;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.51-52
    • /
    • 2017
  • 요우커를 중심으로 한 한류 열풍은 연예인, 미디어 콘텐츠 시장을 넘어서 한국산 제품에도 큰 영향을 미치고 있다. 특히, 화장품을 비롯한 뷰티 관련 제품은 가장 대표적인 시장으로 주목 받고 있다. 본 논문에서는 공공데이터 및 소셜 웹 데이터를 이용하여 화장품 관련 기업의 비즈니스를 위한 뷰티 트렌드 분석 서비스를 제안한다. 소셜 웹 데이터는 국내외 뷰티 시장에 대한 제품인지도를 중심으로 분석되며, 공공데이터는 국내에서 유통되는 화장품에 대한 안정성을 중심으로 분석한다.

  • PDF

소셜네트워크 분석을 활용한 생보사와 손보사의 대면/비대면 채널의 적합성 비교 (Face/non-face channel fit comparison of life insurance company and non-life insurance company using social network analysis)

  • 전희주;임병학
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1207-1219
    • /
    • 2014
  • 본 연구의 목적은 1) 보험전문가인 보험회사에 근무하는 임직원들이 가지고 있는 채널의 유형, 채널평가 항목, 보험 상품과 보험판매 시 요구되는 채널특성들간의 적합성에 대한 의견을 가지고 생명보험업계와 손해보험업계 각각 2-mode 소셜네트워크 데이터를 구성하고 2) 생명보험업계와 손해보험업계 2-mode 소셜 네트워크 데이터를 1-mode 소셜 네트워크 데이터로 변환하여 생명보험업계와 손해보험업계 두 소셜 네트워크의 구조와 네트워크 특성 변수들을 찾아 비교 분석하고, 소셜 네트워크 기반 측면에서의 생명보험사와 손해보험사의 판매채널 전략의 방향을 제시하고자 한다. 보험 판매채널의 평가에 의한 소셜 네트워크를 비교한 결과, 생명보험업계 소셜 네트워크가 손해보험업계 소셜 네트워크보다 더욱 강한 연결을 보였다. 즉 생명보험업계의 소셜 네트워크의 중심성 변수들이 손해보험업계의 것 들 보다 모두 높게 나타나 생명보험회사들은 채널전략 운영 측면에서 한 방향으로 움직이기가 수월함을 보이는 반면, 손해보험사들은 회사의 규모나 처한 환경에 따라 판매채널 전략이 다를 수 있어 각사의 개별적인 보험 판매 채널전략을 운영해야 함을 의미한다.

정확한 이슈를 찾기 위한 트위터 기반 정제기법 제안 (Tweet-Based Filtering and Refinement for Finding Accurate Issues)

  • 최봉준;우호진;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.653-655
    • /
    • 2014
  • 스마트 디바이스 산업의 발전으로 소셜미디어 데이터의 양은 기하급수적으로 증가하고 있다. 이렇게 증가한 데이터와 함께 분석을 통해 발견할 수 있는 정보의 양도 다양해지면서 여러 산업분야에서 소셜미디어 데이터 분석을 위한 연구가 진행되고 있다. 소셜미디어는 종류가 다양하고 하루 평균 발생량이 너무 많기 때문에 분석시간이 오래 걸릴 뿐 아니라, 불필요한 불용어 및 방해요소 때문에 적절한 정제작업이 필요하다. 본 논문에서는 소셜미디어의 한 종류인 트위터 분석을 위해 여러 가지 기법으로 데이터를 정제한다. 정제과정은 분석에 용이한 형태로 데이터를 변형시킨 후 의미없는 데이터와 분석에 방해가 되는 불용어를 제거한다. 이 정제를 통해 데이터 정보의 질을 높이고 분석 시간을 단축시켜 빠르고 신뢰성 높은 분석결과를 도출할 수 있다.

A Development Method of Framework for Collecting, Extracting, and Classifying Social Contents

  • Cho, Eun-Sook
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.163-170
    • /
    • 2021
  • 빅데이터가 여러 분야에서 다양하게 접목됨에 따라 빅데이터 시장이 하드웨어로부터 시작해서 서비스 소프트웨어 부문으로 확장되고 있다. 특히 빅데이터 의미 파악 및 이해 능력, 분석 결과 등 총체적이고 직관적인 시각화를 위하여 애플리케이션을 제공하는 거대 플랫폼 시장으로 확대되고 있다. 그 중에서 SNS(Social Network Service) 등과 같은 소셜 미디어를 활용한 빅데이터 추출 및 분석에 대한 수요가 기업 뿐만 아니라 개인에 이르기까지 매우 활발히 진행되고 있다. 그러나 이처럼 사용자 트렌드 분석과 마케팅을 위한 소셜 미디어 데이터의 수집 및 분석에 대한 많은 수요에도 불구하고, 다양한 소셜 미디어 서비스 인터페이스의 이질성으로 인한 동적 연동의 어려움과 소프트웨어 플랫폼 구축 및 운영의 복잡성을 해결하기 위한 연구가 미흡한 상태이다. 따라서 본 논문에서는 소셜 미디어 데이터의 수집에서 추출 및 분류에 이르는 과정을 하나로 통합하여 운영할 수 있는 프레임워크를 개발하는 방법에 대해 제시한다. 제시된 프레임워크는 이질적인 소셜 미디어 데이터 수집 채널의 문제를 어댑터 패턴을 통해 해결하고, 의미 연관성 기반 추출 기법과 주제 연관성 기반 분류 기법을 통해 소셜 토픽 추출과 분류의 정확성을 높였다.

소셜 네트워크에서의 사용자관계 시각화 방안 (Visualization Method of User Relationship in Social Networks)

  • 양승연;조현성;이천희;박석천
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1260-1263
    • /
    • 2013
  • 데이터 시각화 기술을 이용하여 데이터에 대한 접근성과 이해도를 높여 사용자가 빅데이터 가치를 효율적으로 활용할 수 있도록 소셜 네트워크에서의 사용자 관계 시각화 기술에 대해 연구하였다. 본 논문은 소셜 네트워크의 사용자관계를 시각화하기 위해 소셜 네트워크 데이터 스트리밍 기술, 동적 애니메이션 적용을 위한 시각화 기술 그리고 사용자 관계를 분석하기 위한 데이터마이닝 기술을 적용하여 소셜 네트워크 사용자들 간의 관계를 본인 중심으로 시각화하는 방안을 제시하였다.