• 제목/요약/키워드: 소셜 데이터 분석

검색결과 735건 처리시간 0.028초

대용량 그래프에서의 유사 매칭을 위한 그래픽 사용자 인터페이스 기반 서브 그래프 생성 도구에 대한 연구 (A Study on GUI based Subgraph Generation Tool for Similar Matching in Large Capacity Graphs)

  • 송재오;홍승민;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.349-350
    • /
    • 2018
  • 최근 빅데이터를 비롯한 각종 실험 장비의 발전에 따라 첨단 분야에서의 과학데이터가 급격히 증가하고 있는 가운데, 그래프 매칭은 컴퓨터 네트워크 모니터링, 소셜 네트워크의 진화 분석, 생물학 네트워크에서 모티프(motif) 탐지 등 네트워크 분석 및 데이터 마이닝 분야에서 널리 활용되고 있다. 이와 같이, 폭발적으로 증가하는 데이터에 대한 네트워크 모델링 및 유사 그래프 매칭 분석을 수행하기 위한 연구 및 기반 기술 개발은 필수적인 실정이다. 본 논문에서는 이미 확보된 대용량 그래프에서 유사한 형태의 서브 그래프를 매칭할 수 있는 GUI(Graphic User Interface)기반의 생성 도구를 제안한다.

  • PDF

감정 분석에서의 심리 모델 적용 비교 연구 (A Comparative Study on Sentiment Analysis Based on Psychological Model)

  • 김해준;도준호;선주오;정서희;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.450-452
    • /
    • 2020
  • 기술의 발전과 함께 사용자에게 가까이 자리 잡은 소셜 네트워크 서비스는 이미지, 동영상, 텍스트 등 활용 가능한 데이터의 수를 폭발적으로 증가시켰다. 작성자의 감정을 포함하고 있는 텍스트 데이터는 시장 조사, 주가 예측 등 다양한 분야에서 이용할 수 있으며, 이로 인해 긍부정의 이진 분류가 아닌 다중 감정 분석의 필요성 또한 높아지고 있다. 본 논문에서는 딥러닝 기반 감정 분류에 심리학 이론의 기반 감정 모델을 활용한 결합 모델과 단일 모델을 비교한다. 학습을 위해 AI Hub에서 제공하는 데이터와 노래 가사 데이터를 복합적으로 사용하였으며, 결과에서는 대부분의 경우에 결합 모델이 높은 결과를 보였다.

  • PDF

하둡 맵리듀스와 페이지 랭크를 이용한 서울시 대중 교통 인구 이동 분석 (Analysis of the population flow of public transportation in Seoul using Hadoop MapReduce and PageRank algorithm)

  • 백민석;오상윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.354-356
    • /
    • 2022
  • 소셜 네트워크 및 웹 데이터와 같은 대규모 그래프 데이터를 처리하기 위해 병렬 처리 기반의 기법들이 많이 사용되어 왔다. 본 연구에서는 그래프 형식의 대규모 교통 데이터를 하둡 맵리듀스를 이용하여 처리하는 효과적인 기법을 제안한다. 제안하는 방식에서는 도시의 유동 인구 흐름을 가중치로 고려할 수 있도록 Weighted PageRank 알고리즘을 기반으로 하는 병렬 그래프 알고리즘을 사용하며, 해당 알고리즘을 하둡 맵리듀스에 적용하여 주거 및 근무지 등의 지역을 분류하도록 결과를 분석하였다. 제안 기법을 통한 분석 결과를 기반으로 지역 간 유동 인구 그래프 데이터에서 각 도시의 영향력을 측정하는 페이지랭크, 하둡 맵리듀스 기반의 기법을 제시한다.

문화권 클러스터링 기반 SNS 빅데이터 및 사용자 선호도 분석 (Cultural Region-based Clustering of SNS Big Data and Users Preferences Analysis)

  • 노승민
    • 한국항행학회논문지
    • /
    • 제22권6호
    • /
    • pp.670-674
    • /
    • 2018
  • 최근 댓글 / 텍스트, 이미지, 비디오, 블로그 및 사용자 경험을 포함한 소셜네트워크서비스(SNS) 데이터에는 다양한 고객의 추천 시스템을 구축하고 비즈니스 분석가에게 통찰력 있는 데이터 / 결과를 제공하는데 사용할 수 있는 많은 정보가 포함되어 있다. 멀티미디어 데이터, 특히 이미지 및 비디오와 같은 시각적 데이터는 SNS 데이터 중에서도 특정(문화권) 지역을 반영할 수 있는 가장 풍부한 데이터이며, 문화적 가치 및 관심사는 전반적으로 데이터의 많은 부분을 차지하고 있다. 이러한 방대한 데이터로부터 원하는 데이터를 지능적으로 추출하고, 엄청난 양의 데이터를 마이닝 하려면 보다 효율적이고 지능적인 데이터 분석 방법이 필요하다. 따라서 본 논문의 목적은 이러한 데이터를 모델링하고, 색인하고, 검색하는 방법에 대해 제안하고자 한다.

소셜네트워크 실시간교통 방송 플랫폼 설계 및 구현 (Design and Implementation of Social Network Real-Time Traffic Broadcast Platform)

  • 한준우;이은진;김흥수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.337-339
    • /
    • 2015
  • 최근 들어 위치 기반 서비스(location based service)에 관심이 많아지면서 스마트 디바이스에 탑재된 GPS로부터 수집한 대용량 데이터로부터 사용자의 이동패턴을 분석하고 서비스에 적용하는 연구가 많아지고 있다. 또한 스마트폰, 블랙박스와 내비게이션의 발달로 다양한 개인의 일상이 컴퓨터의 로그파일 형태로 기록되고 있다. 이에 따라 수집되는 데이터는 교통 수단의 이용 기록, 소비이력 등 다양한 정보를 포함하며 이를 통해 다양한 사용자 맞춤형 서비스가 개발되고 있다. 이에 본 논문에서는 차량의 블랙박스와 같은 카메라를 이용하여 단순히 문자, 사진 정보를 주고 받는 것이 아니라 실시간 영상 정보를 활용한 소셜네트워크 실시간교통 방송과 같은 실시간 교통 영상, 문자, 개인의 생각, 의견 등을 공유하는 소셜네트워크 실시간교통 방송 플랫폼을 형성하고자 한다.

  • PDF

SNS 기반 여론 감성 분석 (Sentiment Analysis for Public Opinion in the Social Network Service)

  • 하상현;노태협
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.111-120
    • /
    • 2020
  • 본 연구는 소셜네트워크서비스(SNS)상의 빅데이터를 이용한 텍스트 분석기법의 응용으로서 설문 조사 기반의 여론 조사 방법론과 달리 비정형적 언어 기반의 감성 여론 조사 방법론을 제안한다. 기존의 설문 기반 여론 분석모형에 대한 대안적 방법으로 주관성에 기초한 감성 분류 모형을 이용하였다. 이를 위하여, 제20대 국회의원 선거운동 기간 중 선거 관련 실시간 트위터 자료를 수집하여 속성 기반 감성 분석을 이용한 여론의 극성과 강도에 대한 실증 분석을 수행하였다. 개별 SNS에서 사용된 단어의 극성을 분류하기 위해 Lasso 및 Ridge 회귀 모형을 이용하여 극성에 영향력이 큰 변수를 추출하였다. 추출된 변수가 극성에 미치는 긍정 및 부정에 대한 영향을 구분하고, 영향력의 강도를 분석하였다. 대중들이 소셜네트워크상에서 표현한 내용을 바탕으로 한 여론에 대한 긍정 및 부정의 감성 분석을 통해 여론의 향방을 예측하고 극성분석 모형의 정확도를 측정하여, 여론 조사 분야에서 감성 분석 방법론의 적용가능성을 확인하였다.

소셜 빅데이터를 활용한 한국관광 트렌드에 관한연구 -감성분석을 중심으로- (A study on Korean tourism trends using social big data -Focusing on sentiment analysis-)

  • 최연희;유경미
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.97-109
    • /
    • 2024
  • 국내관광 영역에서 관광 소비 주체인 외래관광객과 내국인에 대한 관광 트렌드 분석은 한국 관광시장 뿐 만 아니라 지역 및 정부의 관광정책을 수립하는 관계자에게도 필수적이라 할 수 있다. 이에 소셜미디어 상의 핵심키워드와 감성분석을 알아보고 향후 관광소비자의 커뮤니케이션과 정보를 통해 마케팅 전략 계획을 수립하고 국내 관광산업을 활성화시키고자 한다. 한국관광의 트렌드를 분석하기 위해 텍스톰(TEXTOM) 6.0을 활용하였다. 구글, 네이버, 다음이 제공하는 카페, 블로그, 뉴스 등을 대상으로 '한국관광', '국내관광'을 키워드로 하여 2022년 9월31일부터 2023년 8월31일까지 데이터를 수집하였다. 텍스트마이닝을 통하여 빈도순으로 핵심 키워드와 TF-IDF를 각각 100개씩 추출한 후, CONCOR 분석, 감성분석을 실시하였다. 한국관광 핵심 키워드는 관광지, 여행동반 및 행태, 관광동기 및 체험, 숙박형태, 관광정보, 감성 관련 등에 관한 단어들이 상위권에 노출되었다. CONCOR분석 결과는 관광지, 관광정보, 관광활동/체험, 관광동기/콘텐츠, 인바운드 관련 등과 관련된 5개의 클러스터로 구분되었다. 마지막으로 감성분석 결과 긍정에 대한 문서와 어휘가 높게 나타났다. 이 연구는 한국관광에 대한 텍스트 마이닝을 통하여 급변하는 한국관광 트렌드를 분석하여 내국인 뿐 만 아니라 방한 외국인에 대한 국내관광 활성화에 의미 있는 기초자료를 제공할 것으로 기대한다.

국내 마이데이터 활성화를 위한 미국, 유럽 마이데이터 비교 연구 (Comparison of MyData Use Among the U.S., Europe, and the Korean Governments)

  • 이명호
    • 한국비블리아학회지
    • /
    • 제31권2호
    • /
    • pp.183-201
    • /
    • 2020
  • 소셜 데이터, 공공 데이터, 개인정보 등을 이용한 다양한 서비스에 대한 요구가 증가하고 있다. 특히 개인정보를 활용하고 보호하기 위하여 미국, 유럽에서는 마이데이터에 대한 정책이 시도되고 있으며 2019년 국내에서도 마이데이터가 시행되었다. 본 연구는 우리나라 마이데이터 발전 방향을 제시하기 위하여 미국, 유럽의 마이데이터를 분석하였고 이를 기반으로 데이터 호환 및 데이터 품질 측면에서 발전 방향을 제안하였다.

협업 필터링 기반의 콘텐츠 추천 시스템과 빅데이터 처리 솔루션을 이용한 상용화 개발 방향 (Content recommendation system based on the collaborative filtering and big-data solutions for its commercialization)

  • 최성우;한성희;정병희
    • 방송과미디어
    • /
    • 제19권4호
    • /
    • pp.50-59
    • /
    • 2014
  • 사용자들이 미디어를 접하는 디바이스 환경이 다양화되고 그 속에서 접할 수 있는 콘텐츠의 양은 많아졌다. 특히 급속도로 발전한 모바일 환경에서 사용자들은 개인화된 기기를 사용하여 콘텐츠를 소비하고 주변 사용자들과 경험을 공유한다. 콘텐츠 제공 서비스에서는 이러한 개인의 콘텐츠 소비 이력 및 SNS 관계에서 발생한 데이터를 분석하여 활용함으로써 콘텐츠 소비를 활성화하고자 한다. KBS에서도 이러한 동향에 맞추어 방송콘텐츠 추천검색 연구와 실시간 TV캡처 및 소셜 공유 연구를 진행하였으며, 그 과정에서 많은 양의 데이터를 효율적으로 처리하기 위한 방법의 필요성을 절감하게 되었다. 데이터 분석이 필요한 두 과제에서 진행한 내용을 기술하고 대용량 데이터 처리기법을 활용하여 상용화 서비스를 구축할 계획을 소개한다.

데이터센터 네트워크의 지연시간 분석 (An Analysis of Network Latency on Datacenters)

  • 오상훈;심재균;이석한;안정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.6-9
    • /
    • 2015
  • 유무선 네트워크 기술의 급격한 발전 및 개인용 휴대 장치의 보급 증가와 그에 맞물린 소셜네트워크 서비스 등의 활성화로 인해 데이터의 전송량이 폭발적으로 늘어나고 있으며, 이러한 추세는 향후 지속될 것으로 전망된다. 이에 데이터센터의 수요가 증가하고 있으며, 확장 및 유지보수가 쉬우면서도 높은 성능을 갖는 시스템에 대한 요구가 높아지고 있다. 본 논문에서는 데이터센터 네트워크의 구성요소를 분석하고 각각의 지연시간을 알아보았으며, 그 중 확장 및 유지보수가 쉬우나 상대적으로 지연시간이 높은 이더넷을 데이터센터에 적용하였을 때 지연시간 개선을 위한 방법으로 Intel DPDK를 적용할 경우, 미적용시와 비교하여 약 86%의 지연시간 감소를 확인하였고, 추가 향상 방안을 조망하였다.