• 제목/요약/키워드: SNS-빅데이터

검색결과 214건 처리시간 0.026초

빅데이터 분석을 통한 행정구역별 홍수 취약성 분석 (An Analysis of Flood Vulnerability by Administrative Region through Big Data Analysis)

  • 유영욱;성연정;박태경;정영훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.193-193
    • /
    • 2021
  • 전 세계적으로 기후변화가 지속되면서 그에 따른 자연재난의 강도와 발생 빈도가 증가하고 있다. 자연재난의 발생 유형 중 집중호우와 태풍으로 인한 수문학적 재난이 대부분을 차지하고 있으며, 홍수피해는 지역적 수문학적 특성에 따라 피해의 규모와 범위가 달라지는 경향을 보인다. 이러한 이질적인 피해를 관리하기 위해서는 많은 홍수피해 정보를 수집하는 것이 필연적이다. 정보화 시대인 요즘 방대한 양의 데이터가 발생하면서 '빅데이터', '머신러닝', '인공지능'과 같은 말들이 다양한 분야에서 주목을 받고 있다. 홍수피해 정보에 대해서도 과거 국가에서 발간하는 정보외에 인터넷에는 뉴스기사나 SNS 등 미디어를 통하여 수많은 정보들이 생성되고 있다. 이러한 방대한 규모의 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원이 될 것이며, 홍수대비책으로 활용될 소중한 정보가 될 수 있다. 본 연구는 인터넷기반으로 한 홍수피해 현상 조사를 통해 홍수피해 규모에 따라 발생하는 홍수피해 현상을 파악하고자 하였다. 이를 위해 과거에 발생한 홍수피해 사례를 조사하여 강우량, 홍수피해 현상 등 홍수피해 관련 정보를 조사하였다. 홍수피해 현상은 뉴스기사나 보고서 등 미디어 정보를 활용하여 수집하였으며, 수집된 비정형 형태의 텍스트 데이터를 '텍스트 마이닝(Text Mining)' 기법을 이용하여 데이터를 정형화 및 주요 홍수피해 현상 키워드를 추출하여 데이터를 수치화하여 표현하였다.

  • PDF

빅데이터 분석을 이용한 문단 내의 감정 예측 (Emotion Prediction of Paragraph using Big Data Analysis)

  • 김진수
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.267-273
    • /
    • 2016
  • 모바일의 확산과 더불어 정형화된 자료뿐만 아니라 다양한 형태의 비정형화된 자료로부터 정보가 생성되고 정보 전달 및 공유가 활발히 이루어지고 있다. 최근에는 다양한 SNS 매체들로부터 생산 및 배포되는 많은 자료들 중에서 유의미한 정보를 추출하는 기술로 빅데이터 기술을 많이 사용하며, 빅데이터 분석 기법 중 하나인 데이터 마이닝 기법을 사용한다. 특히, SNS로부터 수집된 방대하고 다양한 자료들을 이용하여 대중의 집단지성에 표출된 일반적인 감정을 분석하여 다양한 분야에 활용한다. 본 논문에서는 SNS를 통해 작성된 짧은 문단 내 함축된 키워드와 키워드들 간의 연관성을 이용하여 문단에 나타난 감정을 예측하고 사용자별 감정에 따른 적절한 답변이나 예측된 감정과 유사한 상품이나 영화 등 다양한 추천시스템에 사용될 수 있도록 형태소 분석과 변형된 n-gram방법을 혼합하여 효율적인 감정 예측 시스템을 제안한다. 제안된 시스템은 평균 82.25%의 재현율을 보여 기존의 시스템에 비해 더욱 향상된 성능을 보여 주었고, 형태소분석을 통해 의미 있는 키워드 추출에 도움이 될 것으로 기대한다.

페이스북 마케팅 활용 방안에 대한 연구: 페이스북 '좋아요' 기능과 인구통계학적 정보 추출 (The Study of Facebook Marketing Application Method: Facebook 'Likes' Feature and Predicting Demographic Information)

  • 유성종;안세은;이준기
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.61-66
    • /
    • 2016
  • 최근 기업들이 빅데이터를 활용하여 효과적인 마케팅 전략을 전개함에 있어서, 고객의 세부정보를 기반으로 하는 개인화된 마케팅 전략을 활용하고 있다. 하지만 프라이버시 및 개인정보 유출위협이 커짐에 따라 소셜 네트워크 사이트(Social Network Site, 이하 SNS)에서 계정의 개인정보 항목을 삭제하거나 정보공개수준을 통제하는 경향이 높아지고 있다. 이로인해 기업의 마케팅 담당자들은 고객의 세부정보를 파악하는 것에 어려움을 겪고 있다. 본 연구에서는 SNS 중에서 가장 많은 회원 수를 보유하고 있는 Facebook에서 제한된 정보를 바탕으로 성별을 예측하는 분석방법론을 도출하고자 하였다. 본 연구에는 측정도구로 Gaussian RBF, nFactors, randomForest, 그리고 5-fold cross-validation 사용하였다. 그 결과, 성별은 75%, 연령대는 97.85%로 '좋아요' 정보만을 가지고 성별과 연령을 예측할 수 있었다. 즉, 사용자들의 어떠한 세부정보 없이, Facebook의 '좋아요'의 정보를 가지고 인구통계학적인 정보를 추론할 수 있었다. 본 연구의 결과를 바탕으로 개인정보 수집에 어려움을 겪고 있는 기업 및 마케팅 담당자들에게 유용한 가이드 라인을 제시 할 수 있을 것으로 기대한다.

  • PDF

Travel Route Recommendation Utilizing Social Big Data

  • Yu, Yang Woo;Kim, Seong Hyuck;Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.117-125
    • /
    • 2022
  • 최근 여행에 대한 관심이 높아지면서, 번거로운 여행 일정을 대신 수립해주는 여행 일정 추천 서비스에 대한 연구가 활발히 진행되고 있다. 여행 일정 추천에 있어 가장 중요하면서도 공통적으로 제시되는 목표는 여행 목적지 근처의 인기 관광지를 포함한 최단 거리 여행 경로를 제공하는 것이다. 다수의 기존 연구에서는 개인 맞춤형 스케줄 제공에 초점을 맞추었으며, 사용자의 여행 이동 경로 이력이나 SNS 리뷰가 존재하지 않을 경우 설문 조사가 필요한 문제점이 있었다. 또한 최단 거리를 계산할 때 발생할 수 있는 현실적인 문제점도 명확히 지적되지 않았다. 이와 관련하여, 본 논문에서는 소셜 빅데이터를 활용하여 인기 관광지를 알아내기 위한 정량화된 방법을 소개하고, 최단 거리 알고리즘 적용시 발생할 수 있는 문제점과 이를 해결하기 위한 휴리스틱 알고리즘을 함께 제시한다. 제안 방법을 검증하기 위해, 경상남도를 대상으로 63,000여 개의 플레이스 정보를 수집하고 빅데이터 분석을 수행했으며, 실험을 통해 제안한 휴리스틱 스케줄링 알고리즘이 실제 데이터 상에서 실시간 처리가 가능함을 확인하였다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

빅데이터 기반 항공 수요예측 통합 플랫폼 설계 및 실증 (P-TAF: A Big Data-based Platform for Total Air Traffic Forecast)

  • 정주익;손석현;차희준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.281-282
    • /
    • 2021
  • 본 논문에서는 항공 수요예측을 위한 빅데이터 기반 플랫폼의 설계 및 실증 결과를 제시한다. 항공 수요예측 통합 플랫폼은 항공산업 관련 데이터를 Open API, RSS Feed, 웹크롤러(Web Crawler) 등을 이용하여 수집 및 분석하여 자체 개발한 항공 수요예측 알고리즘을 기반으로 결과를 시각화하여 보여주도록 구현되어 있다. 또한, 제안하는 플랫폼의 사용자 인터페이스를 통해 변수 설정을 하여 단위별(Global, National 등), 기간별(단기, 중장기 등), 유형별(여객, 화물 등) 예측 통계 자료를 도출할 수 있다. 플랫폼의 성능 검증을 위해 정형화된 데이터를 비롯하여 소셜네트워크서비스(SNS), 검색엔진 등에서 수집한 비정형 데이터까지 활용하여 특정 키워드의 빈도와 특정 노선에 대한 항공 수요간 상관관계를 분석하였다. 개발한 통합 플랫폼의 지능형 항공 수요예측 알고리즘을 통해 전반적인 공항 운영 및 공항 운영 정책 수립에 기여할 것으로 예상한다.

  • PDF

빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 (A Study on Structural Holes of Privacy Protection for Life Logging Service as analyzing/processing of Big-Data)

  • 강장묵;송유진
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.189-193
    • /
    • 2014
  • 네트워크 서비스는 로컬서비스와 결합하면서 생활밀착형 서비스로 발전하고 있다. 생활밀착형 서비스는 기존의 모바일 서비스와는 달리, 위치정보와 로컬정보 그리고 소셜 네트워크서비스 정보 등을 모아 개인화된 서비스를 제공할 것으로 예상된다. 여러 정보를 모아 처리하는 과정에서 빅데이터 기술, 클라우드 기술 등이 필요하다. 이미 이에 대한 효율성 높은 알고리즘이 연구되고 있으나 반면, 생활 밀착형 서비스 모델 또는 빅데이터 환경에서의 프라이버시 보호 모델에 대한 연구는 상대적으로 미흡한 편이다. 이 글은 생활밀착형 서비스에 활용될 빅데이터 기술이 야기하는 프라이버시 문제에 대하여 구조혈 중심으로 다룬다.

빅데이터 환경 분석과 글로벌 경쟁력 확보 방안에 대한 연구 (A Study on Securing Global Big Data Competitiveness based on its Environment Analysis)

  • 문승혁
    • 문화기술의 융합
    • /
    • 제5권2호
    • /
    • pp.361-366
    • /
    • 2019
  • 현대 지능정보사회에서 매일 새롭게 만들어지고 유통되는 데이터의 양은 상상을 초월한다. SNS나 인터넷을 통한 데이터로부터 정부나 기업으로부터 창출되는 정보에 이르기까지 다양하다. 이러한 다양한 데이터들이 가공되지 않은 원유와 같이 무한한 가치를 지닌 채 우리 곁에 있다. 축적된 데이터에서 유용한 상관관계를 찾아내고 미래의 불확실성에 대한 예측력을 강화하기 위하여 데이터 마이닝 등을 통한 빅데이터 분석 및 활용은 현대 산업사회에서 모든 영역에 걸쳐 그 중요성이 증대되고 있다. 본 논문에서는 복잡한 현대사회가 생산해 내는 빅데이터의 효율적 관리 및 활용에 대하여 연구한다. 또한 4차 산업혁명시대에 빅데이터를 기반으로 전반적인 산업 경쟁력을 확보하기 위한 전략, 산업 간 시너지 창출 및 비용의 절감과 효과적인 적용방안에 대하여 고찰한다.

SNS 데이터 분석을 통한 스마트 충북관광 구축 (Implementation of smart chungbuk tourism based on SNS data analysis)

  • 조완섭;조아;권가은;류관희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.409-418
    • /
    • 2015
  • SNS 등 온라인에 쏟아지는 고객의 감성분석을 활용하여 마케팅 등 다양한 분야에서 성과를 내고 있다. 고객의 제품사용 후기 데이터를 수집하여 신제품의 마케팅 전략과 제품개선 방안을 도출하고 있으며, 선거철에는 유권자들의 마음을 실시간으로 읽어서 선거 전략을 수립하고 있다. 본 연구에서는 온라인 상에서 충북관광에 관한 글들을 수집하여 텍스트 마이닝 기법을 활용하여 분석함으로써 충북관광을 위한 홍보전략과 관광진흥 정책을 수립하는 방안을 제시한다. 사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북전역의 관광지를 대상으로 한다. 분석결과 충청북도 북부지역의 관광지들이 주요 이슈 관광지로 나타났으며, 관광지별로 연관 관광지와 연관 키워드들이 분석되었다. 또한, 주요 관광지별 감성분석을 통하여 긍/부정 현황과 그 원인을 파악할 수 있도록 하였다. 특히 이들 분석에 다차원 분석 기법을 연계함으로써 관광관련 텍스트 정보를 다각도로 분석하여 전략을 수립하는데 활용할 수 있도록 하였다.

서비스 비즈니스의 빅데이터 모집단 산정방식 오류에 관한 사례연구 (Case Study on Big Data Sampling Population Collection Method Errors in Service Business)

  • 안진호;이정선
    • 서비스연구
    • /
    • 제10권2호
    • /
    • pp.1-15
    • /
    • 2020
  • 최근 빅데이터가 사회, 경제적으로 중요해지면서, 무분별한 적용으로 인해 많은 문제가 발생하고 있다. 빅데이터의 활용가치는 데이터 안에 숨어있는 가치 있는 정보의 의미를 알아내는 것이 중요하다. 특히 고객의 행동패턴이나 경험 등을 예측하기 위하여, 기업내의 CRM (Customer Relationship Management)에서 추출한 정형데이터나 SNS(Social Network Service) 등에서 추출한 비정형데이터를 모집단으로 규정하고, 해석하는 과정 등에서 수많은 오류가 발생할 수 있지만, 대부분 이를 간과하고 있는 것이 현실이다. 이는, 데이터 분석기술 외에 고려해야 할 사항이 유의미한 패턴으로 나타나야 할 데이터들이 모집단 안에 빠져있음을 나타내는 것이기도 한다. 이에 본 연구에서는 그 모집단 설정의 오류 발생의 원인이 사람과 사람, 사람과 사물간의 관계와 상호작용이 강한 경우에 발생하는 데이터의 측정과 해석은 그 강도가 강한 경우에는 User eXerience(UX)와 ethnography(민속지학) 관점으로 수집된 데이터를 모집단에 포함하는 것이 중요하다는 것을 Big data 적용의 다양한 사례를 비교하여 도출하였다. 그리고 도출된 의미를 파악하여 최적의 방향을 제안하였다.