• 제목/요약/키워드: 소셜 데이터 분석

검색결과 735건 처리시간 0.026초

비정형데이터를 활용한 홍수 모니터링 및 예측 (Flood monitoring and prediction using online unstructured data)

  • 이정하;황석환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.118-118
    • /
    • 2019
  • 현재 홍수예보는 정형데이터인 유량 및 수위 등을 활용하여 이뤄지고 있다. 하지만 실제 사람들이 체감하는 홍수에 대한 위험도는 홍수예보 발령과는 달라 홍수예보가 이뤄지지 않은 지역에서 인명사고가 발생하기도 한다. 이는 수위 측정이 이뤄지지 않는 소규모 하천이나 사람들의 유동성이 큰 도심지역에서 빈번하게 발생한다. 이를 보완하기 위해서는 사람들의 체감 정도 및 인구의 유동성을 고려한 비정형데이터를 활용해야 한다. 특히 소셜 네트워크 서비스(Social Network Commuinty, SNS)를 사용하는 사람들이 많아지면서 기존에 사용되어 왔던 정형데이터 센서 이외의 데이터를 제공한다. 또한 개개인이 작성하는 글은 실시간으로 활용이 가능하여 인구의 유동성 및 시 공간적 데이터를 얻기에 유용하여 활용성이 매우 높은 비정형데이터이다. 따라서 본 연구에서는 SNS 데이터를 추출하고 이를 분석하여 2018년에 발생했던 강우사상과의 패턴을 비교하여 홍수예보에서의 활용성을 분석하였다. 홍수와 관련한 키워드를 중심으로 시 공간적 정보 및 추출이 가능한 웹 크롤러(Web Crawler) 프로그램을 작성하였으며 이를 토대로 데이터를 수집하였다. 수집한 데이터와 실제 홍수사상을 비교 분석을 한 결과 강우량 및 수위와 해당 지역에 대한 데이터의 양이 유사한 패턴을 보인 것으로 확인되었다. 실시간으로 데이터를 수집하고 이를 분석하여 리드타임을 충분히 확보한다면 홍수예측에 활용 가능할 것이라 생각된다. 본 연구는 한국건설기술연구원 19주요-대4-시드사업인 '커뮤니티 빅데이터 패턴 해석을 통한 수난(水難) 발생 및 규모 예측 기술 개발(20190126-001) '로 수행되었습니다.

  • PDF

LBSNS 기반 장소 추천 시스템 (Location Recommendation System based on LBSNS)

  • 정구임;안병익;김정준;한기준
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.277-287
    • /
    • 2014
  • 위치 기반 소셜 네트워크 서비스에서 사용자들은 체크인 데이터를 이용해 장소를 공유하고 커뮤니케이션을 한다. 체크인 데이터는 POI명, 카테고리, 장소 좌표/주소, 사용자 닉네임, 장소 평가 점수, 관련 글/사진/동영상 등으로 구성된다. 위치 기반 소셜 네트워크 서비스에서 이러한 체크인 데이터를 상황에 맞게 분석하면 다양한 맞춤형 서비스를 제공할 수 있다. 따라서, 본 논문에서는 사용자 체크인 데이터를 활용할 수 있는 LBSNS(Location-based Social Network Service) 기반 장소 추천 시스템을 개발하였다. LBSNS 기반 장소 추천 시스템은 체크인 데이터 중 장소 카테고리를 분석하여 가중치를 추출하고, 피어슨 상관계수를 이용해 사용자간의 유사도를 구한다. 그리고 협업적 필터링 알고리즘을 이용하여 추천 장소에 대한 선호도 점수를 구하고, 추천 대상 장소의 위치와 사용자의 현재 위치에 대해 유클라디안 알고리즘을 적용하여 거리 점수를 구한다. 마지막으로, 선호도 점수와 거리 점수에 대해 가중치 계수를 적용하여 상황에 맞게 장소를 추천한다. 또한, 본 논문에서는 실제 데이터를 이용한 실험을 통해 본 논문에서 제시한 시스템의 우수성도 입증하였다.

딥러닝 및 토픽모델링 기법을 활용한 소셜 미디어의 자살 경향 문헌 판별 및 분석 (Examining Suicide Tendency Social Media Texts by Deep Learning and Topic Modeling Techniques)

  • 고영수;이주희;송민
    • 한국비블리아학회지
    • /
    • 제32권3호
    • /
    • pp.247-264
    • /
    • 2021
  • 자살은 전 세계 사망 원인 중 4위이며 사회, 경제적 손실이 큰 난제이다. 본 연구는 자살 예방을 위하여 소셜미디어에 나타난 자살 관련 말뭉치를 구축하고 이를 통해 자살 경향 문헌을 분류할 수 있는 딥러닝 자동분류 모델을 만들고자 하였다. 또한, 자살 요인을 분석하기 위해 주제를 자동으로 추출하는 분석 기법인 토픽모델링을 활용하여 자살 관련 말뭉치를 세부 주제로 분류하고자 하였다. 이를 위해 소셜미디어 중 하나인 네이버 지식iN에 나타난 자살 관련 문헌 2,011개를 수집한 후 자살예방교육 매뉴얼을 기준으로 자살 경향 문헌 및 비경향 문헌 여부를 주석 처리하였으며, 이 데이터를 딥러닝 모델(LSTM, BERT, ELECTRA)로 학습시켜 자동분류 모델을 만들었다. 또한, 토픽모델링 기법의 하나인 LDA 기법으로 주제별 문헌을 분류하여 자살 요인을 발견하였고 이를 심층적으로 분석하기 위해 주제별로 동시출현 단어 분석 및 네트워크 시각화를 진행하였다.

코로나19 상황에서 지역사회 먹을거리 이슈에 관한 탐색적 연구: 지역별 이슈를 통한 소셜 빅데이터를 중심으로 (An Exploratory Study on Local Community Food Issues in the Context of COVID-19: Focusing on Social Big Data through Regional Issues)

  • 최홍규
    • 한국콘텐츠학회논문지
    • /
    • 제21권8호
    • /
    • pp.546-558
    • /
    • 2021
  • 본 연구는 코로나19 상황에서 지역사회 먹을거리 관련 이슈를 살펴보았으며, 온라인 공간에서 생산된 소셜 빅데이터의 내용을 분석하는 데 초점을 맞췄다. 우선, 코로나19로 사회적 거리두기가 시행된 후 지역별 홈페이지와 온라인 커뮤니티인 카페에서 확산한 먹을거리 관련 이슈를 분석했다. 다음으로는 언론 뉴스, SNS, 포털 등에서 확산하는 먹을거리 관련 이슈의 내용을 살펴봤다. 그 결과 서울과 경기 등 수도권에 비해 여타 지역 홈페이지에 먹을거리 관련 게시물이 더 많았지만, 온라인 커뮤니티의 경우에는 서울과 경기 지역에 등록된 온라인 커뮤니티에 먹을거리 관련 이슈가 더 많았다. 지역별 온라인 커뮤니티의 먹을거리 관련 키워드는 지역사회 경제와 관련한 내용을 주로 포함하고 있었다. 언론 기사, SNS, 검색포털 이슈에는 지역사회 먹을거리 관련 정책, 정보, 상품 등의 소비과정에서 논의될 수 있는 내용이 주로 나타났다. 연구결과를 통해 지역사회 단위로 특화한 정보 공유체계는 발견되지 않고, 온라인 커뮤니티가 현실적인 먹을거리 정보를 제공하는 데 기여할 수 있으며, 소셜미디어를 통해 지역별 먹을거리 정책의 성과검증이 가능할 것이라는 점을 발견할 수 있었다.

맵리듀스 기반 DFP-Tree를 이용한 클러스터링 알고리즘 (Clustering Algorithm using the DFP-Tree based on the MapReduce)

  • 서영원;김창수
    • 인터넷정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.23-30
    • /
    • 2015
  • 빅 데이터가 이슈화됨에 따라 데이터 분석의 결과를 기반으로 동작하는 많은 응용들이연구되고 왔고, 대표적인 응용들은 전자상거래 시스템의 상품 추천 서비스, 검색 엔진에서의 검색 서비스, 소셜 네트워크 서비스에서의 친구 추천 서비스 등이 있다. 본 논문은 기존의 데이터 마이닝 기법 중 데이터 집합에서 나타나는 유사한 패턴들을 마이닝하는 빈발 패턴 트리와 컴퓨터 과학의 이론에 기초한 결정트리를 결합하여 결정 빈발 트리 알고리즘을 제안한다. 이는 기존의 빈발 패턴 트리 알고리즘은 패튼 트리에서 패턴 생성에 대한 정확성은 보장되나 소셜 데이터처럼 다양한 패턴이 나타는 데이터에 대해서는 많은 수의 패턴들을 생성시켜 분석에 대한 어려움이 있어, 서브트리들과의 수렴 여부를 판단하는 모델로 변형시켜 문제를 개선한다. 또한 맵리듀스로 모델링하여 분산처리를 통한 고속 처리 알고리즘을 제시한다.

트위터 분석을 이용한 카테고리별 실시간 트렌드 추출 기법 (Real-time Category Trend Extraction Scheme based on Twitter Analysis)

  • 나병진;김용성;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1581-1584
    • /
    • 2015
  • 최근 소셜 네트워크 서비스상의 데이터를 실시간으로 분석하여 의미있는 정보를 찾아내기 위한 연구가 활발하게 진행되고 있다. 특히, 스마트폰과 같은 스마트 디바이스를 이용하는 많은 사용자들이 실시간으로 발생하는 이벤트를 소셜 네트워크상에 게재하고 서로 공유하면서, 대중들이 관심을 가지는 토픽의 경우 굉장히 빠르게 확산되는 경향을 보이고 있다. 본 논문에서는 이러한 SNS의 특성을 토대로 트위터상의 트윗을 분석하여 여러 분야의 토픽들을 카테고리별로 분류하고, 카테고리별 트렌드를 추출하여 실시간으로 시각화하는 기법을 제안한다. 이를 위해, 트위터를 기반으로 SVM 분류 알고리즘과 Twitter-LDA를 통하여 트윗을 분야별로 분류하고, 각각의 트렌드를 이루는 대표적인 키워드를 선출하여 이를 기반으로 실시간 트렌드를 추출한다. 제안하는 기법의 성능을 평가하기 위해, 분류 특징 선택의 신뢰도를 측정한다.

소셜미디어에서 약한 유대관계의 형성 (Formation of Weak Ties in Social Media)

  • 박차라;임성택;차상윤;이인성;김진우
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.97-109
    • /
    • 2014
  • 사용자들이 콘텐츠를 매개로 하여 의견이나 관점, 경험 등을 공유하고, 사용자들 간의 상호작용을 촉진시키는 온라인 서비스를 소셜미디어라고 한다. 본 연구는 소셜미디어 사용자들의 공유 행동과 사용자 간 상호작용을 이해하는데 중요하다고 판단되는 약한 유대관계에 초점을 맞추어 사회 연결망 이론과 불확실성 감소 이론을 기반으로 약한 유대관계의 형성에 영향을 미치는 주요 요인들을 탐색적으로 도출하고자 하였다. 이를 위하여 본 연구에서는 다이어리 조사와 심층 인터뷰 등의 정성적 연구를 실시하였으며, 수집된 데이터를 근거이론 방법론에 따라 분석하였다. 본 연구의 결과, 소셜미디어에서는 강한 유대관계 보다 약한 유대관계를 통한 공유와 상호작용이 활발히 이루어지는 것을 발견할 수 있었다. 또한 유사성과 자기개방, 그리고 관련성이 소셜미디어 사용자 간 심리적 거리감을 줄이고 이는 소셜미디어 사용자들이 느끼는 불확실성을 감소시킴으로써 약한 유대관계의 형성을 촉진시키는 것으로 나타났다.

인스타그램 게시물 데이터를 활용한 건강기능식품 브랜드 분석 및 평가 (Analysis and evaluation of Health Functional Food(HFF) brand using Instagram post data)

  • 윤현주;신재영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.533-534
    • /
    • 2021
  • 최근 소셜 네트워크 서비스(SNS)를 통한 건강기능식품 과대광고 적발이 증가하면서 SNS를 통해 브랜드를 선택함에 있어 신뢰도가 소비자에게 중요한 요소가 된다. 본 논문에서는 인스타그램의 해시태그를 이용해 게시글을 크롤링 하여 수집된 게시물 데이터를 가공 및 분석한다. 불용어 사전을 구축해 불용어를 제거해준 뒤 브랜드 추출을 진행하고, 건강기능식품 브랜드 5개에 대한 게시글 데이터를 수집한다. 5개 브랜드의 신뢰도 측정을 위해 게시글, 해시태그, 계정명을 분석기준으로 삼아 라벨링 처리를 한다. 라벨링 된 열을 통해 절대적 수치로 점수를 부여하여 백분율로 점수를 표현한다. 신뢰도 점수와 더불어 브랜드의 고객 참여도 건수를 같이 명시해 준다.

  • PDF

소셜 빅 데이터 분석을 통한 미용분야 대학생 창업지원 정책에 관한 연구 -탐색적 데이터 분석법을 기반으로- (Study on the Policy of Supporting University Students in the Beauty Field through Social Big Data Analysis: Based on exploratory data analytics)

  • 윤미연;박남훈
    • 한국응용과학기술학회지
    • /
    • 제39권6호
    • /
    • pp.853-863
    • /
    • 2022
  • 본 연구에서는 미용분야 창업 활성화를 위해 소셜 빅데이터 분석을 탐색적 데이터 분석(EDA)을 기반으로 하여 2019년부터 2021년 동안 각 년도별로 기간을 구분하여 '미용창업'에 대한 수요 변화와 감정 및 의미 차이의 특징적인 패턴을 도출하고자 하였다. '미용창업' 키워드를 주제로 연관된 검색어를 추출한 결과 창업에 필요한 전문적인 창업교육 보다는 미용관련 기술을 배울 수 있는 기관이나 자격증에 더 많은 관심을 보였으며, 이는 정부 및 지자체에서 여러 가지 창업지원 정책들이 마련되고 있음에도 불구하고 여전히 전문적인 창업교육의 중요성을 인식하지 못하고 있는 것으로 파악할 수 있으며, 이에 대한 대안으로 미용분야 창업을 성공적으로 이루기 위한 전공별 맞춤형 창업교육 프로그램을 개발하는 것이 필요할 것으로 사료된다. 탐색적 데이터 분석을 통해 가설을 설정하고 전통적인 확증적 데이터 분석(CDA)을 결합하여 가설을 검증한다. 미용 창업을 위한 탐색적 데이터 분석 방법이 존재한 적은 없으며, 정식 창업교육의 필요성을 언급하기보다는 미용창업에 대한 관심 변화와 예비창업자의 요구사항을 탐색적 데이터로 분석한다면 맞춤형 창업 프로그램 개발에 도움이 될 것이라고 확신한다.

4차 산업혁명에 대한 인식 변화 비교 분석: 소셜 미디어 데이터 분석을 중심으로 (A Comparative Analysis of the Changes in Perception of the Fourth Industrial Revolution: Focusing on Analyzing Social Media Data)

  • 유재은;최종우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권11호
    • /
    • pp.367-376
    • /
    • 2020
  • 4차 산업혁명은 빅데이터, 인공지능 등의 기술을 통해 사물들이 지능화 사회로 진입하는데 크게 기여한다. 혁명을 통해 인간의 행태와 인지를 파악할 수 있게 되었고, 인공지능의 활용을 통해 의료, 과학 등 다양한 분야에서 핵심 도구로서 자리매김하였다. 그러나 4차 산업혁명에는 긍정적인 미래와 함께 부정적인 이면이 자리 잡고 있다는 점에 주목하여, 본 연구에서는 소셜 미디어를 통해 수집된 비정형적인 빅데이터를 기반으로 텍스트 마이닝 기법을 활용한 분석을 실시하였다. 연도별(2016년, 2017년, 2018년) 4차 산업혁명과 관련된 키워드를 살펴보고, 각 키워드가 가지고 있는 의미에 대해 파악하고자 하였다. 또한, 연도의 변화에 따라 4차 산업혁명과 관련된 키워드가 어떻게 변화하는지 파악하였으며, R을 활용하여 키워드 연관 분석(Association Analysis)을 실시함으로써 4차 산업혁명과 연관된 키워드 흐름을 통해 4차 산업혁명과 밀접하게 연관된 인식 흐름을 알아보고자 하였다. 마지막으로 연도별 4차 산업혁명과 관련한 긍정적, 부정적인 감정을 살펴봄으로써 4차 산업혁명에 대한 사람들의 인식을 파악하였다. 분석결과, 부정적인 의견은 연마다 감소하고 있었으며 긍정적인 전망과 미래가 더 많아지는 것으로 나타났다.