• 제목/요약/키워드: 소셜 데이터 분석

검색결과 735건 처리시간 0.026초

대용량 소셜 데이터의 의미 분석을 위한 MapReduce 기반의 분석 모듈 설계 및 구현 (Design and Implementation of an Analysis module based on MapReduce for Large-scalable Social Data)

  • 이혁주;김명진;이한구;윤효근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.357-360
    • /
    • 2011
  • 최근 인터넷과 통신기술, 특히 모바일과 관련된 기술의 급속한 발전으로 소셜 커뮤니케이션 수단으로 대표되는 SNS(Social Networking Service)가 중요한 이슈로 부각되어지고 있다. SNS 서비스 제공시 중요하게 고려되어져야 할 사항은 정확하고 의미 있는 데이터를 통해서 사용자가 원하고 관심 있는 분야의 정보를 어떻게 제공할 것인가에 초점이 맞춰져 있어야 한다. 그러나 최근 폭발적으로 증가되어지고 있는 소셜 데이터 때문에 사용자는 의미 분석이 정확하게 이루어지지 않은 신뢰성이 결여된 소셜 커뮤니케이션 서비스를 제공받고 있다. 이러한 소셜데이터 분석의 문제점을 해결하기 위해서 본 논문에서는 소셜 네트워크 서비스에 필요한 데이터를 수집하고, 클라우드 컴퓨팅 환경에서 수집된 대용량 SNS 데이터의 의미를 분석 할 수 있는 MapReduce 기반의 분석 모듈의 구조를 제안하였다. 제안한 모듈은 의미 분석에 필요한 소셜 데이터를 수집하는 수집 기능과 수집된 소셜데이터의 의미 분석을 수행하는 분석 기능을 포함하고 있다. 수집 기능은 SNS에서 생성되는 텍스트 형태의 데이터를 수집하고 MapReduce를 통해서 데이터를 분석하기 쉽게 적절한 크기로 생성된 파일을 분할한다. 수집된 소셜 데이터의 의미 분석은 기존 TF-IDF 방식에 개선된 Weighted-MINMAX 적용한 알고리즘을 통해서 구현하였다. 개선된 알고리즘은 단어의 중요도를 평가하고, 중요도가 높은 단어로 구성된 의미정보 제공 서비스를 지원한다. 시스템의 성능 평가를 위해서 노드별 데이터 처리시간과 추출 키워드의 정확도를 측정하였다.

소셜 빅데이터 마이닝 기반 이슈 분석보고서 자동 생성 (Automatic Generation of Issue Analysis Report Based on Social Big Data Mining)

  • 허정;이충희;오효정;윤여찬;김현기;조요한;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권12호
    • /
    • pp.553-564
    • /
    • 2014
  • 본 논문은 지금까지의 소셜미디어 분석과 분석보고서 생성의 세 가지 문제점을 해결하기 위해서 소셜 빅데이터 마이닝에 기반한 이슈분석보고서 자동 생성 시스템을 제안한다. 세 가지 문제점은 분석의 고립성, 전문가의 주관성과 고비용에 기인한 정보의 폐쇄성이다. 시스템은 자연언어 질의분석, 이슈분석, 소셜 빅데이터 분석, 소셜 빅데이터 상관성분석과 자동 보고서 생성으로 구성된다. 생성된 보고서의 유용성을 평가하기 위해, 본 논문에서는 리커트척도를 사용하였고, 빅데이터 분석 전문가 2명이 평가하였다. 평가결과는 리커트 척도 평가에서 보고서의 품질이 비교적 유용하고 신뢰할 수 있는 것으로 평가되었다. 보고서 생성의 저비용, 소셜 빅데이터의 상관성 분석과 소셜 빅데이터 분석의 객관성 때문에, 제안된 시스템이 소셜 빅데이터 분석의 대중화를 선도할 것으로 기대된다.

소셜 메타데이터 활용에 관한 탐색적 연구 - 국내 대학도서관 웹 사이트 분석을 중심으로 - (An Explorative Study on the Social Metadata in Academic Libraries)

  • 박희진
    • 한국비블리아학회지
    • /
    • 제24권2호
    • /
    • pp.231-246
    • /
    • 2013
  • 소셜 메타데이터는 정보를 기술하는 메타데이터에 사회적 기능이 부여된 것을 말한다. 본 연구는 국내 대학도서관의 소셜 메타데이터와 관련된 현황을 살펴보고 이용자의 상호작용을 통해 공유와 협력을 도모할 수 있는 소셜 메타데이터의 방향성을 제시하고자 하였다. 173개의 국내 대학도서관의 웹 사이트를 조사하여 실제 활용되고 있는 소셜 메타데이터의 유형을 살피고 유형에 따른 활용방식을 조사, 분석하였다. 대부분의 도서관에서 소셜 메타데이터는 제공하고 있는 콘텐츠에 대한 이용자의 의견을 자유롭게 제시하는 표현형 참여 수준에 그치고 있으며, 이용자의 상호작용과 협업을 촉진하는 보다 적극적인 참여 수준에는 미치지 못함을 알 수 있었다. 본 연구의 소셜 메타데이터의 개괄적인 분석의 결과는 대학 도서관에서 소셜 메타데이터를 활용하는 데 기본적인 틀을 마련하는데 도움이 될 수 있을 것으로 기대한다.

Social Network Big Data 분석 기법과 응용

  • 최병진;황용근;정교민
    • 정보와 통신
    • /
    • 제31권11호
    • /
    • pp.46-51
    • /
    • 2014
  • 최근 정보통신 기술의 발전과 더불어 급성장 중인 소셜 네트워크는 개인 혹은 집단간의 실제 사회적 관계를 네트워크 구조로 반영하고 있다. 소셜 네트워크를의 구조를 보다 정확하게 이해하고 소셜 네트워크 내에서 정보가 전파되는 패턴을 파악하기 위해 소셜 네트워크를 수학적으로 모델링하고, 이를 응용하여 소셜 네트워크 빅 데이터를 분석하는 다양한 연구가 이루어지고 있다. 본고에서는 소셜 네트워크의 구조 분석과 정보 확산 패턴 파악에 관한 주요 연구 사례들을 소개하고, 특히 소셜 빅 데이터 분석과 관련된 연구 주제 및 응용 사례들을 살펴보고자 한다.

악성 집단 댓글 분석에 의한 SNS 여론 소셜데이터 분석 (Analysis of Opinion Social Data on the SNS (Social Network Service) by Analyzing of Collective Damage Reply)

  • 황윤찬;고찬
    • 디지털융복합연구
    • /
    • 제11권5호
    • /
    • pp.41-51
    • /
    • 2013
  • 미디어를 통한 많은 소셜 데이터가 유통, 활용, 공개 되고 있다. 이 소셜 데이터를 이용한 미디어에 대한 즐거움과 정보의 효율적인 측면만 부각되고, 여기에서 발생되는 지나친 정보 노출과 사용자에 대한 인신 공격적 집단 댓글의 피해 문제는 소흘히 취급되고 있다. 본 연구에서는, 악성 집단 댓글 분석에 의한 SNS 여론 소셜 데이터 분석을 하였다. 소셜 네트워크가 가진 구조적 정보 이용을 통해 분석된 정보 분석 데이터의 양, 즉 SNS 언급 횟수 인 버즈량이 얼마나 많은 사람들에게 배포되고 악용되는가에 대한 문제를 다양한 측정 방법으로 분석하였다.

공간 소셜 분석을 위한 마이크로블로그 데이터의 맵리듀스 기반 공간 집계 알고리즘 (A MapReduce based Algorithm for Spatial Aggregation of Microblog Data in Spatial Social Analytics)

  • 조현구;양평우;유기현;남광우
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.781-790
    • /
    • 2015
  • 인터넷과 모바일 환경의 발전에 따라 최근에는 마이크로블로그가 성행하고 있다. 마이크로블로그에는 부가적인 데이터가 담겨있다. 그 중 위치 정보에 대한 데이터를 포함하는 마이크로블로그 데이터를 공간 소셜 웹 객체라고 지칭한다. 이러한 마이크로블로그 데이터에 대한 일반 집계는 사용자별 데이터 집계 등이 있으나, 단일 정보에 대한 집계만 가능하다. 본 연구는 공간 소셜 웹 객체의 특성을 갖는 마이크로블로그 데이터의 공간 소셜 분석을 위해, 일반 집계와 공간 데이터를 결합하고 지오해시와 맵리듀스를 이용한 공간 집계에 대한 알고리즘을 제시한다. 이를 통해 의미있는 공간 소셜에 대한 분석의 기반을 마련하였다.

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

정확한 이슈를 찾기 위한 트위터 기반 정제기법 제안 (Tweet-Based Filtering and Refinement for Finding Accurate Issues)

  • 최봉준;우호진;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.653-655
    • /
    • 2014
  • 스마트 디바이스 산업의 발전으로 소셜미디어 데이터의 양은 기하급수적으로 증가하고 있다. 이렇게 증가한 데이터와 함께 분석을 통해 발견할 수 있는 정보의 양도 다양해지면서 여러 산업분야에서 소셜미디어 데이터 분석을 위한 연구가 진행되고 있다. 소셜미디어는 종류가 다양하고 하루 평균 발생량이 너무 많기 때문에 분석시간이 오래 걸릴 뿐 아니라, 불필요한 불용어 및 방해요소 때문에 적절한 정제작업이 필요하다. 본 논문에서는 소셜미디어의 한 종류인 트위터 분석을 위해 여러 가지 기법으로 데이터를 정제한다. 정제과정은 분석에 용이한 형태로 데이터를 변형시킨 후 의미없는 데이터와 분석에 방해가 되는 불용어를 제거한다. 이 정제를 통해 데이터 정보의 질을 높이고 분석 시간을 단축시켜 빠르고 신뢰성 높은 분석결과를 도출할 수 있다.

소셜미디어 재난이슈 탐지 및 모니터링 (Monitoring and Sensing Disaster Issues from Social Media)

  • 최선화;최우정;이종국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.332-335
    • /
    • 2013
  • 최근 IT기술발전으로 데이터 저장 및 처리비용은 하락하고 소셜네트워크 서비스 등이 확대되어 데이터의 양적 팽창이 가속화되면서 빅데이터에서 가치를 창출하려는 시도가 늘어나고 있다. 특히, 국내 스마트폰 이용자가 3천만을 넘어서면서 모바일 기기는 대량 데이터 생산의 원천이 되고 있다. 모바일 기기는 스마트시대 대표 통신채널인 소셜미디어 활용을 가속화 시키며 다양한 분야에서 영향력을 발휘하고 있다. 특히 일본과 아이티 지진피해, 강남역 침수 등 재난발생 시 피해상황 파악 및 경보, 정보교환 등에 소셜미디어 채널이 활발히 활용되면서 새로운 매체로 떠오르고 있다. 본 논문에서는 언어분석을 통해 소셜미디어 속에 재난이슈를 모니터링하고 소셜미디어가 재난예방 및 대응에 적극 활용되기 위해 필요한 기술개발 방안을 제시하고자 한다.

공공데이터 및 소셜 웹 데이터를 이용한 뷰티 트렌드 분석 서비스 (Beauty Trend Analysis Services using Public Data and Social Web Data)

  • 송재오;김경배;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.51-52
    • /
    • 2017
  • 요우커를 중심으로 한 한류 열풍은 연예인, 미디어 콘텐츠 시장을 넘어서 한국산 제품에도 큰 영향을 미치고 있다. 특히, 화장품을 비롯한 뷰티 관련 제품은 가장 대표적인 시장으로 주목 받고 있다. 본 논문에서는 공공데이터 및 소셜 웹 데이터를 이용하여 화장품 관련 기업의 비즈니스를 위한 뷰티 트렌드 분석 서비스를 제안한다. 소셜 웹 데이터는 국내외 뷰티 시장에 대한 제품인지도를 중심으로 분석되며, 공공데이터는 국내에서 유통되는 화장품에 대한 안정성을 중심으로 분석한다.

  • PDF