• 제목/요약/키워드: 소셜 데이터 분석

검색결과 735건 처리시간 0.024초

블로그 게시물에 나타난 수도권 보전지역 및 자연자원의 분포 및 특성 (The Distribution and Characteristics of Protected Areas and Natural Resources in the Metropolitan Area in Blog Posts)

  • 이성희;손용훈
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.30-39
    • /
    • 2022
  • 본 연구에서는 특정 장소 및 대상에 대하여 이용자들이 자유롭게 서술한 블로그 데이터의 누적 콘텐츠 발행량을 활용하여 보전지역 및 자연자원에 대한 사람들의 인지성을 평가하고 특성을 분석하는 것을 목적으로 하였다. 이에 수도권에 위치하고 있는 전체 보전지역 및 자원 중 평가 가능한 곳들을 구별하고, 각 장소에 대하여 사람들이 작성한 블로그 게시물 수를 토대로 종합하여 10단계 구분하여 평가하였다. 연구 결과, 산림에 대한 이용자들의 인지성이 가장 높은 것으로 나타났으며, 도시권에 있어서 보전지역 및 자연자원에 대한 인지성이 더 높게 나타났다. 이는 수도권 주변에 위치하는 보전지역과 자연자원이 이용자들에게 보전의 대상이면서도 자연 관광지로서의 역할을 수행하고 있는 것을 보여준다. 또한 이러한 결과는 국내외 연구에서 도시지역에 있어서 생태계 서비스가 중요하다는 연구결과들과 같은 맥락을 보인다. 본 연구는 기존의 연구방법과는 달리 소셜미디어 분석으로 이용자의 인지 정도를 파악하고, 이를 보전지역 및 자연자원 평가에 적용하였다는 점에서 의의가 있으며, 본 연구의 결과는 향후 도시녹지공간에 대한 대중의 관심 및 인지 정도를 고려하여 관리방안을 마련하거나, 인지성을 높이기 위하여 발전방안을 수립하는 데 기초 자료로 활용될 수 있다. 또한 연구에서 활용된 블로그 누적 콘텐츠 발행량은 공간에 대한 이용자의 관심을 파악하고 모니터링 할 수 있는 점에서 의의가 있다. 단, 본 연구에서는 소셜미디어 콘텐츠 발행량을 기반으로 평가하였기에 각 블로그에 담긴 내용을 세밀하게 살펴보지는 못했다. 또한 보전지역과 자연자원의 경우 개발 이슈와 함께 이용자의 순수한 관점이 아닌 내용이 혼재되어 있을 수 있기 때문에, 추후 평가 대상지에 대한 키워드 분석과 내용분석을 추가하여 평가 내용을 검토하고 보충할 필요가 있다.

그래프 스트림에서 슬라이딩 윈도우 기반의 점진적 빈발 패턴 검출 기법 (Incremental Frequent Pattern Detection Scheme Based on Sliding Windows in Graph Streams)

  • 정재윤;서인덕;송희섭;박재열;김민영;최도진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제18권2호
    • /
    • pp.147-157
    • /
    • 2018
  • 최근 네트워크 기술 발전과 함께 IoT 및 소셜 네트워크 서비스의 활성화로 인해 많은 그래프 스트림 데이터가 생성되고 있다. 이와 같은 그래프 스트림에서 객체들 사이의 관계가 동적으로 변화함에 따라 그래프의 변화를 탐지하거나 분석하기 위한 연구들이 진행되고 있다. 본 논문에서는 그래프 스트림에서 이전 슬라이딩 윈도우에서 검출한 빈발 패턴에 대한 정보를 이용해 빈발 패턴을 점진적으로 검출하는 기법을 제안한다. 제안하는 기법은 이전 슬라이딩 윈도우에서 검출된 패턴이 앞으로 몇 슬라이딩 윈도우동안 빈발할지 또는 빈발하지 않을지를 계산하여 빈발 패턴 관리 테이블에 저장한다. 그리고 이 값을 통해 다음 슬라이딩 윈도우에서는 필요한 계산만 수행함으로써 전체 연산량을 감소시킨다. 또한 패턴 간에 간선을 통해 연결되어있는 것만 하나의 패턴으로 인식함으로써 더 유의미한 패턴만을 검출한다. 본 논문에서는 제안하는 기법의 우수함을 보이기 위해 여러 성능 평가를 진행하였다. 그래프 데이터의 크기가 커지고 슬라이딩 윈도우의 크기가 커질수록 중복되는 데이터가 증가되기 때문에 기존 기법보다 빠른 처리 속도를 나타낸다.

CNN 기반 감성 변화 패턴을 이용한 가짜뉴스 탐지 (Fake News Detection Using CNN-based Sentiment Change Patterns)

  • 이태원;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.179-188
    • /
    • 2023
  • 최근 가짜뉴스는 뉴스 콘텐츠 형식을 가장하고 중요한 사건이 발생할 때마다 등장하여 사회적 혼란을 초래한다. 이에 가짜뉴스를 탐지하기 위한 연구로 인공지능 기술이 사용된다. 자연어 처리를 통해 가짜뉴스를 자동으로 인지 및 차단하거나, 네트워크 인과 추론과 결합함으로써 허위 정보를 확산시키는 소셜미디어 인플루언스 계정을 감지하는 등의 가짜뉴스 탐지 접근법이 딥러닝을 통해 구현될 수 있었다. 그러나 가짜뉴스 탐지는 여러 자연어 처리 분야 중에서도 해결이 어려운 문제로 분류된다. 가짜뉴스가 가지는 형식 및 표현의 다양성으로 특성 추출의 난도가 높고, 뉴스가 속한 범주에 따라 하나의 특성이 서로 다른 의미를 가질 수도 있는 등 다양한 한계점이 존재한다. 본 논문에서는 가짜뉴스를 탐지하기 위한 추가적인 식별 기준으로 감성 변화 패턴을 제시한다. 합성곱 신경망을 가짜뉴스 데이터 세트에 적용하여 콘텐츠 특성에 기반한 분석을 수행하고, 감성 변화 패턴을 추가로 분석함으로써 성능이 개선된 모델을 제안한다. 뉴스를 구성하는 문장에 대하여 감성 극성을 산출하고 장단기 메모리를 적용함으로써 문장 순서에 의존적인 결괏값을 얻을 수 있다. 이를 감성 변화의 패턴으로 정의하고 뉴스의 콘텐츠 특성과 결합하여 가짜뉴스 탐지를 위한 제안 모델의 독립변수로 활용한다. 제안 모델과 비교 모델을 딥러닝으로 학습시키고 가짜뉴스 데이터 세트를 이용한 실험을 진행하여 감성 변화 패턴이 가짜뉴스 탐지 성능을 개선할 수 있음을 확인한다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.

Non-volatile Memory Express 인터페이스 기반 저장장치의 성능 평가 및 분석 (Performance Evaluation and Analysis of NVMe SSD)

  • 손용석;염헌영;한혁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권7호
    • /
    • pp.428-433
    • /
    • 2017
  • 최근 데이터센터, 소셜 네트워크 서비스 등과 같은 고성능 컴퓨팅을 요구하는 환경에서는 기존 하드디스크를 대체할 수 있는 고성능 비휘발성 메모리 저장장치의 수요가 급증하고 있다. 이러한 비휘발성 메모리의 성능은 호스트와 저장장치를 연결해주는 인터페이스에 따라 크게 좌우될 수 있다. 저장장치의 인터페이스는 계속 발전해왔으며, 기존 하드디스크에 기반을 둔 SAS/SATA 인터페이스를 대체할 수 있는 NVMe 인터페이스가 최근에 등장하였다. NVMe 인터페이스는 높은 확장성을 가지며 기존 인터페이스에 비해 낮은 지연시간을 제공한다. 본 논문은 다양한 워크로드를 통해 NVMe 저장장치의 성능을 평가하고 분석한다. 또한 NVMe 저장장치와 기존 SATA 저장장치와의 가격 대비 성능비를 비교하고 평가한다.

트위터 기반의 실시간 이벤트 지역 탐지 시스템 (TRED : Twitter based Realtime Event-location Detector)

  • 임준엽;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권8호
    • /
    • pp.301-308
    • /
    • 2015
  • SNS는 사용자들의 관계 형성을 도와주는 웹 기반의 온라인 플랫폼 서비스이다. 기존의 SNS 사용자들은 이를 이용하기 위해 주로 데스크톱이나 노트북을 이용하였다. 그러나 최근 스마트폰의 보급으로 인해 웹 접근성이 확대되면서 SNS 사용자가 크게 증가하였다. SNS를 이용하는 사용자들은 주로 자신의 일상이나 경험한 일들을 다른 사용자들과 공유한다. 이때 사용자 개인을 하나의 센서로 가정하고 그들이 남긴 콘텐츠를 분석할 수 있다면, 이를 이용해 현실에서 발생한 이벤트를 탐지할 수 있다. 이러한 시도는 이미 많은 연구에서 진행되고 있다. 특히 트위터의 경우 이벤트 탐지에 적합한 구조적 특징들로 인해 관련 분야에서 다양하게 활용되고 있다. 그러나 대부분이 제한적인 이벤트 탐지 및 이벤트가 발생한 지역을 탐지하는 것에 있어 명확한 한계점을 지니고 있다. 이에 본 논문에서는 트위터에서 언급 빈도가 급증한 지역들을 기반으로 이벤트가 발생한 지역을 실시간으로 탐지하는 TRED(Twitter based Realtime Event-location Detector) 시스템을 제안하였다. 이후 성능평가를 통해 제안하는 시스템이 실시간으로 동작할 수 있는지를 확인하였고, 실제 발생한 이벤트를 탐지함으로써 효율성을 입증하였다. 또한 노이즈 제거를 통한 탐지율 향상을 언급하였으며 향후 보다 높은 성능의 시스템에 대한 가능성을 보였다.

재난안전 용어사전 구축을 위한 미디어별 어휘 사용 양상 비교 (Comparing the Usages of Vocabulary by Medias for Disaster Safety Terminology Construction)

  • 이정은;김태영;오효정
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권6호
    • /
    • pp.229-238
    • /
    • 2018
  • 재난사건의 신속한 대응은 다양한 분야의 재난안전 유관기관들이 유기적으로 관계함으로써 가능하며, 이 때 사용되는 재난용어의 표준화는 필수적이다. 따라서 재난안전 분야의 전문 용어사전 구축은 각 유관기관 간의 의사소통 및 국민에게 명확한 정보 전달을 위해 수반되는 핵심 요소이다. 더불어 효율적인 용어사전 구축을 위해서는 구축 대상 용어의 우선순위 선정이 필요하다. 본 연구에서는 구체적인 용어사전 구축방향의 설정을 위하여 용어 사용 주체로 대표되는 미디어를 각각 용어사전, 뉴스미디어, 소셜미디어로 선정하고 어휘의 사용 양상을 비교하였다. 이를 위해 각 미디어에서 수집된 어휘 자원을 바탕으로 미디어별 동시 출현 양상 및 빈도 가중치 분석을 통하여 어휘의 분포를 시각화하였다. 분석 결과를 통해 어휘의 사용 양상에 따라 용어사전의 구축대상이 될 수 있는 어휘의 유형을 4가지로 분류하고, 구축대상 기준별 용어사전 구축의 우선순위 방향성을 제안하였다.

온라인 리뷰에서 평점의 분류 (Classification of ratings in online reviews)

  • 최동준;최호식;박창이
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.845-854
    • /
    • 2016
  • 감성분석 (sentiment analysis) 혹은 오피니언 마이닝 (opinion mining)은 블로그, 리뷰, 신문기사나 소셜네트워크 등의 문서에서 개인의 주관적인 정보 혹은 의견을 알아보는데 사용되는 텍스트 마이닝의 기법이다. 평점이 있는 온라인 리뷰에서 리뷰 텍스트에 기반한 평점의 분류문제에 대한 선행연구에서는 이진 분류만을 고려하였다. 그러나 긍정과 부정 외에도 중립적인 의견도 있을 수 있기 때문에 이진 분류보다는 다범주 분류가 더 적합할 것이다. 본 연구에서는 리뷰 텍스트에 기반한 평점의 다범주 분류문제를 고려한다. 전처리에서는 카이제곱 통계량을 이용하여 평점과 연관된 단어들을 추출하고 이를 입력변수로 삼아 지지벡터기계 (support vector machines)와 비례오즈 모형 (proportional odds model) 등 다범주 분류기의 예측력을 비교한다.

IPTV를 통한 SNS 가능성에 관한 연구 (Research on Possibilies of Social Network Services through IPTV)

  • 김현석;김소현
    • 한국HCI학회논문지
    • /
    • 제4권1호
    • /
    • pp.11-15
    • /
    • 2009
  • 웹을 기반으로 하는 소셜네트워크서비스(SNS:Social Network Service)는 비약적인 발전을 거듭하며 다양한 형태로 사용자에게 제공되고 있다. 관계/관심에 기반 한 서비스로 사람들의 참여와 관계에 의해서 데이터가 쌓이고 이를 통해 다시 지속적인 참여와 관계를 유도하는 방식의 SNS는 웹을 기반으로 시작하여 모바일시장으로 확장되었다. 모바일 시장에서의 성공적인 SNS 사업모델의 개발은 모바일을 사용하는 사용자의 사용행태를 기반으로 한 서비스 창출에 그 요인이 있다고 볼 수 있다. 이러한 배경에서 TV를 활용한 SNS 개발이 IPTV 사업자를 중심으로 국내외에서 지속적으로 연구되고 있다. 하지만, SNS를 위해 필수적인 요소인 TV에서의 개인화는 연구는 TV의 공공적 성격에 의해 미진한 실정이다. 이 연구는 IPTV에서의 개인화 방안을 사용자 행태분석을 통해 연구하고자 한다. T의 개별 사용자를 위한 개인화는 PC나 모바일 기기와의 개인화와는 다른 방식의 개인화를 요구한다. 따라서 개별, 가족구성원 그룹별, 가족구성원 전체별로 개인화의 유형을 분리하고 이에 대한 행태분석을 실시한 결과 공공재 성격이 강한 TV에서의 개인화는 크게 개인화의 정도, 개인화의 유형, 개인화의 표현방식, 개인화의 구성방식에 있어서 PC나 모바일 기기와 다른 차이점이 있었다.

  • PDF