• 제목/요약/키워드: 소셜 데이터 분석

검색결과 735건 처리시간 0.03초

Contextual LSTM 기반 변분 오토인코더를 이용한 이동 경로 예측 (Trajectory Prediction by Using Contextual LSTM based Variational AutoEncoder)

  • 조광호;차재혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.587-590
    • /
    • 2020
  • 스마트폰, GPS 장비, 위치 기반 소셜네트워크의 발달로 방대한 이동 경로 데이터 수집이 가능하게 됐다. 이를 통해 다양한 분야에서 GPS 데이터를 가지고 사람의 이동성을 분석하고 POI를 예측하는 기회가 많아졌다. 실생활에서 사람의 이동성은 다양한 상황에 영향을 받지만, 실제 GPS 데이터는 위치, 시간 정보의 수준이다. 따라서 다양한 상황을 내재하는 정보가 사람의 이동성 분석과 POI 예측에 필요하다. 본 논문에서는 POI의 순위, 사용자의 POI 활동, 카테고리 선호도 같은 맥락적 특징을 이용하여 이에 관련된 상황에 맞는 POI 시퀀스를 예측하는 Contextual LSTM 기반 딥러닝 기법을 제안한다. Contextual LSTM은 사람의 이동성에 영향을 주는 시퀀스의 맥락적 특징을 모델에 통합하기 위해 LSTM을 확장한다. 제안된 기법은 HITS 알고리즘과 여러 제약조건 기반으로 추출한 맥락적 특징별로 딥 러닝 모델에 통합하여 각각 POI 시퀀스를 검출했으며, 다양한 맥락적 특징에 대해서 공공 데이터와 수집한 데이터로 평가하였다.

대용량 네트워크 압축 기반 클러스터링 알고리즘 개발 (Development of Clustering Algorithm based on Massive Network Compression)

  • 서동민;유석종;이민호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.53-54
    • /
    • 2016
  • 빅데이터란 대용량 데이터 활용 및 분석을 통해 가치 있는 정보를 추출하고, 이를 바탕으로 대응 방안 도출 또는 변화를 예측하는 기술을 의미한다. 그리고 빅데이터 분석에 활용되는 데이터인 페이스북과 같은 소셜 데이터, 유전자 발현과 같은 바이오 데이터, 항공망과 같은 지리정보 데이터들은 대용량 네트워크로 구성되어 있다. 네트워크 클러스터링은 서로 유사한 특성을 갖는 네트워크 내의 데이터들을 동일한 클러스터로 묶는 기법으로 네트워크 데이터를 분석하고 그 특성을 파악하는데 폭넓게 사용된다. 최근 빅데이터가 다양한 분야에서 활용되면서 방대한 양의 네트워크 데이터가 생성되고 있고, 이에 따라서 대용량 네트워크 데이터를 효율적으로 처리하는 클러스터링 기법의 중요성이 증가하고 있다. MCL(Markov Clustering) 알고리즘은 플로우 기반 무감독(unsupervised) 클러스터링 알고리즘으로 확장성이 우수해 다양한 분야에서 활용되고 있다. 하지만, MCL은 대용량 네트워크에 대해서는 많은 클러스터링 연산을 요구하며 너무 많은 클러스터를 생성하는 문제를 갖는다. 본 논문에서는 네트워크 압축을 기반으로 한 클러스터링 알고리즘을 제안함으로써 MCL보다 클러스터링 속도와 정확도를 향상시켰다. 또한, 희소행렬을 효율적으로 저장하는 CSC(Compressed Sparse Column) 자료구조와 MapReduce 기법을 제안한 클러스터링 알고리즘에 적용함으로써 대용량 네트워크에 대한 클러스터링 속도를 향상시켰다.

  • PDF

현대 소비자의 공간소비행동에 관한 연구 -소셜미디어 데이터 분석을 중심으로- (A Study on Space Consumption Behavior of Contemporary Consumers -Focusing on Analysis of Social Media Big Data-)

  • 안서영;고애란
    • 한국의류학회지
    • /
    • 제44권5호
    • /
    • pp.1019-1035
    • /
    • 2020
  • This study examines the millennial generation, who express themselves and share information on social media after experiencing constantly changing 'hot places' (places of interest) in contemporary cities, with the goal of analyzing space consumption behaviors. Data were collected via an Instagram crawler application developed with Python 3.4 administered to 19,262 posts using the term 'hot places' from November 1 and December 15, 2019. Issues were derived from a text mining technique using Textom 2.0; in addition, semantic network analysis using Ucinet6 and the NetDraw program were also conducted. The results are as follows. First, a frequency analysis of keywords for hot places indicated words frequently found in nouns were related to food, local names, SNS and timing. Words related to positive emotions felt in experience, and words related to behavior in hot places appeared in predicate. Based on importance, communication is the most important keyword and influenced all issues. Second, the results of visualization of semantic network analysis revealed four categories in the scope of the definition of "hot place": (1) culinary exploration, (2) atmosphere of cafés, (3) happy daily life of 'me' expressed in images, (4) emotional photos.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

소셜 빅데이터 분석을 통해 알아본 대중의 과학관에 대한 인식 및 사용 행태 (Public Perception and Usage Pattern of Science Museum by Social Media Big Data Analysis)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권6호
    • /
    • pp.1005-1014
    • /
    • 2017
  • 본 연구는 대중의 과학적 소양을 함양하기 위한 기관으로서의 과학관의 역할에 주목하고, 우리나라 과학관이 대중에게 어느 정도 영향을 미치고 있는지 알아보기 위하여 소셜 빅데이터 분석을 통해 대중의 과학관에 대한 인식과 사용 행태를 알아보고자 하였다. 이를 위해 네이버 블로그와 트위터에에서 '과학관'이 포함된 게시글들을 추출한 뒤 텍스트 네트워크 분석, 빈도 분석, 공기어 분석 및 의미 분석을 실시하고 영어권의 분석 결과와 비교해 보았다. 그 결과 블로그에서는 주로 어린 자녀를 둔 부모 층에서 과학관이 이슈가 되고 있었고, 트위터에서는 단체 관람을 하는 학생 층이 다수 드러났다. 따라서 우리나라 대중들은 과학관을 주로 아이의 체험을 위한 공간으로 활용하고 있었고, 이 경우 과학관의 프로그램과 전시에 대해서는 긍정적으로 인식하고 있었다. 한편 단체 관람하는 학생들은 다소 부정적 감정을 표출하고 있는 것으로 나타났다. 과학관과 대중과의 소통, 대중의 과학에 대한 참여 등 제 3세대적 과학관의 기능적 측면에서 외국의 사례와 비교해본 결과 우리나라 대중들은 과학관 관람 이후 관람한 과학적 내용에 대한 언급이 거의 없었고, 논쟁이나 심포지움 등 과학적 의사소통과 관련된 언급 역시 거의 없었다. 또한 해설사나 직원들도 외국과는 달리 전혀 회자되지 않고 있었다. 한편, 영어권 게시글의 동사 분석에서 '배우다', '참여하다', '듣다', '읽다', '묻다', '생각하다', '그리다' 등의 유의미한 활동과 관련된 동사들이 다수 나타난 것에 비해 우리나라 게시글에서는 '물어보다', '생각하다' 가 소수 나타나는 것에 그치고 있었다. 따라서 과학관은 과학관 관람객들이 관람을 마친 뒤에 그들의 기억에 남고 대중들 사이에서 회자될 만큼 영향력 있고 다양한 내용과 활동이 일어날 수 있도록 개선할 필요가 있겠다.

소셜 빅 데이터분석을 통한 해양스포츠 현황 분석 : 소셜매트릭스TM 기법의 활용 (An Analysis of the Current State of Marine Sports through the Analysis of Social Big Data: Use of the Social MaxtixTM Method)

  • 박태승
    • 수산해양교육연구
    • /
    • 제29권2호
    • /
    • pp.593-606
    • /
    • 2017
  • This study aims to provide preliminary data capable of suggesting directivity of an initiating start by understanding consumer awareness through analysis of SNS social big data on marine sports. This study selected windsurfing, yacht, jet ski, scuba diving and sea fishing as research subjects, and produced following results by setting period of total 1 month from January 22 through February 22, 2017 on the SNS (twitter, blog) through the Social MatrixTM service of Daumsoft Co., Ltd., and analyzing frequency of mention, associated words etc. First, sports that was mentioned the most out of marine sports was yacht, which was 3,273 cases on twitter and 2,199 on blog respectively. Second, the word which was shown the most associated with marine sports was the attribute showing unique characteristic of marine sports, which was 6,261 cases in total.

포스퀘어 사용자의 집단적 활동 군집화: 서울시 사례 (Clustering Foursquare Users' Collective Activities: A Case of Seoul)

  • 서일정;조재희
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.55-63
    • /
    • 2020
  • 본 연구는 서울시에서 발생한 포스퀘어 사용자의 체크인 데이터를 이용하여 위치 기반 소셜 네트워크 사용자의 집단적 활동 군집을 발견하는 방법을 제안하였다. 집단적 활동 군집을 발견하기 위하여 순차 규칙 마이닝을 통해 활동의 순차 규칙을 생성하고, 그 규칙을 기반으로 활동 네트워크를 구성하였다. 활동 네트워크를 분석하여 네트워크의 구조와 허브 활동을 확인하였고 군집 분석을 실시하여 활동 군집을 분류하였다. 본 연구는 위치 기반 소셜 네트워크 사용자의 활동에 대한 전환 패턴을 분석한 이전 연구들과 달리 연속적인 여러 활동의 전체적인 구조와 군집을 분석하는 데 초점을 맞추었다. 본 연구에서 제안한 방법을 이용하여 파악할 수 있는 허브 활동과 활동 군집은 위치 기반의 서비스나 마케팅에 활용할 수 있을 것이다. 또한 바이러스 감염과 관련된 업무나 도시 정책과 같이 공공부문에서 사용할 수도 있을 것이다.

Hotspot DBC: 모바일 소셜 네트워크 상에서 마케팅 전략을 위한 위치 기반 정보 유포 (Hot spot DBC: Location based information diffusion for marketing strategy in mobile social networks)

  • 류제광;양성봉
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.89-105
    • /
    • 2017
  • 모바일 디바이스의 무선 네트워크 통신 기술과 온라인 소셜 네트워크 발전으로 모바일 소셜 네트워크는 모바일 기기 사이에 마케팅 전략의 기회를 제공한다. 이에 따라 모바일 소셜 네트워크 상에서 정보 유포는 중요한 문제가 되었으며 여러 기법을 제안해왔다. 정보 유포 연구 정의는 메시지와 같은 정보를 가진 초기 노드로부터 최소한의 시간에 최대한 많은 유저에게 정보를 전달하는 기법이다. 본 논문에서 우리는 새로운 정보 유포 기법인 기계학습과 소셜 위치정보 기반의 Hotspot DBC를 제안한다. 위치기반 정보 유포 기법으로써 핫스팟 지역을 사용한다. 웜업 기간에 움직임 패턴을 활용하여 초기 영향력 있는 노드를 찾는다. 이후 전체 네트워크 지역을 고려하는 것이 아닌 특정 핫스팟 지역에서만 패턴을 추출하여 찾는다. 웜업 기간 끝나는 시점에서 각 노드는 움직임 패턴을 추출한다. 마지막으로 각 패턴에서 소셜 관계를 분석함으로써 영향력 있는 노드 k개가 선정된다. 우리는 기회적 네트워크 환경에서 GPS 위치 기록의 실제 모바일 노드의 움직임 데이터를 ONE 시뮬레이터 환경에서 실험하였다. 추가적으로 통신범위와 초기 정보 유포 k 노드 수를 다양하게 실험하여 기존 기법보다 더 나은 결과를 확인할 수 있다.

컨텍스트 기반 사용자 간 소셜 네트워크 구성 방법 (Context-based Social Network Configuration Method between Users)

  • 한종현;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.11-14
    • /
    • 2009
  • 본 논문에서는 사용자의 컨텍스트 및 프로파일을 이용하여 사용자들 간의 소셜 네트워크를 구성하는 방법을 제안한다. 최근 협업 시스템과 관련하여 소셜 네트워크에 대한 관심이 증대되고 있다. 하지만 기존 연구의 경우, 사용자 로그 및 프로파일과 같은 정적인 데이터에 기반하고 있어서 동적으로 변화하는 환경에서의 소셜 네트워크를 구성하기 어렵다. 따라서 제안된 방법은 유비쿼터스 컴퓨팅 환경에서 정적인 사용자 프로파일과 함께 사용자의 행동을 반영하는 컨텍스트를 이용하여 소셜 네트워크를 구성한다. 컨텍스트 도메인 지식 모델의 계층적 구조 특성을 이용하여 컨텍스트들 간의 유사도를 계산하고, 컨텍스트 모델의 카테고리에 가중치를 부여하여 컨텍스트들 간의 관계성을 계산한다. 제안된 방법의 유용성을 검증하기 위해 사용자의 컨텍스트 변화에 따른 소셜 네트워크의 동적 구성을 실험하였다. 제안된 방법을 활용하여 사용자들의 행동에 동적으로 반응하는 관계 분석이 가능하게 될 것으로 기대된다.

  • PDF

소셜 네트워크 환경에서 사용자 행위를 고려한 콘텐츠 추천 기법 (Contents Recommendation Scheme Considering User Activity in Social Network Environments)

  • 고건식;김병훈;김대윤;최민웅;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제17권2호
    • /
    • pp.404-414
    • /
    • 2017
  • 스마트폰의 보급과 온라인 소셜 네트워크 서비스의 발전으로 사용자들은 많은 콘텐츠를 생산하거나 서로 공유한다. 이로 인해 사용자는 자신이 원하지 않는 콘텐츠를 받아보거나 소비함으로써 많은 시간을 소요하게 된다. 이와 같은 문제를 해결하기 위해 소셜 네트워크 사용자에게 적합한 콘텐츠를 추천하기 위한 기법들이 활발하게 연구되고 있다. 본 논문에서는 온라인 소셜 네트워크 사용자에게 협업 필터링을 이용하여 적합한 콘텐츠를 추천하는 기법을 제안한다. 제안하는 기법은 추천의 정확성을 낮추는 사용자의 데이터를 제거하기 위해서 사용자 신뢰도를 고려한다. 사용자의 신뢰도는 온라인 소셜 네트워크의 사용자 행위를 분석해서 도출한다. 사용자의 신뢰도를 다양한 관점에서 평가하기 위해서 기존기법에서 사용하지 않았던 사용자 행위들을 수집해서 사용한다. 다양한 성능평가를 통해 제안하는 기법이 기존 기법보다 우수함을 보인다.