• 제목/요약/키워드: SNS-빅데이터

검색결과 214건 처리시간 0.024초

공간지능화서비스 구현을 위한 공공데이터 분석 (An Analysis of the Public Data for Making the Ambient Intelligent Service)

  • 김미연;서동조
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.313-321
    • /
    • 2014
  • 현대 사회는 엄청난 양의 데이터를 만들어내는 디지털 시대에 접어들었고, 다변화되는 도시에서는 정보의 생성, 수집, 표현을 특징으로 하는 스마트 공간이 등장하고 있다. 2012년 이후 스마트기기의 확산과 초연결사회로 불리우는 소셜미디어 환경에서 공공데이터에 대한 관심이 더욱 고조되고, 보편화된 모바일 기기 사용 및 SNS 이용 확산에 따라 빅 데이터에 대한 이슈에 주목하고 있다. 초기에는 데이터의 플랫폼 구성에 연구개발이 집중되었으나 최근에는 공간지능화 서비스 구현을 위한 데이터의 분석과 활용방안에 대한 여러 분야의 아이디어가 제안되고 있다. 본 연구에서는 이러한 공공데이터의 활용성 측면에서 전문가보다는 일반인의 사용성 증대를 위한 시각화 과정에 집중하고자 기존의 공공데이터포털에서 제공하는 공개데이터 및 공공데이터 서비스 현황을 파악하여 그 활용가능성을 고찰하고자 한다. 연구의 결과로 일반 시민들에게 있어서 데이터의 분석 및 응용은 현재 종이문서의 이용을 감소시키고, 지능형 공간에서 공공정보서비스에 대한 개개인의 요구 및 행동에 맞추어 빠르고 신속한 대응할 수 있는 어플리케이션 개발에 도움이 될 것으로 기대한다.

빅데이터 분석기법을 통한 성주(星州) 세종대왕자태실(世宗大王子胎室)의 인식 및 활용방안 (A Recognition and Application Plan of Placenta Chamber of King Sejong's Princes by Big Data Analytical Technique)

  • 임진강;박지환
    • 한국전통조경학회지
    • /
    • 제36권1호
    • /
    • pp.78-88
    • /
    • 2018
  • 연구는 세종대왕자태실의 문화적 가치에 따른 활용방안을 수립하기 위한 것으로 대중이 가지는 다양한 인식과 의견을 종합 분석하고자 SNS를 통하여 데이터를 수집하고 분석에 활용하였다. 수집기간은 2007년 06월 01일-2017년 06월 30일까지(약 10년 동안)이며, '태실, 성주태실, 세종대왕자태실' 키워드를 포함하고 있는 블로그, 카페, 지식IN에서 자료를 수집하였다. 그리고 빅데이터 분석 기법인 텍스트 마이닝 기법을 활용하여 분석하였으며 주요 분석 결과에 따라 태실의 활용 방안을 도출하였다. 그 결과 세종대왕, 왕자, 성주, 풍수, 문화, 보존, 축복 등의 주요 키워드를 도출하였고, 키워드 '세계', '유산', '문화유산'의 연관성과 '태실', '경상북도', '문화재'의 연관성이 높아 세계문화유산으로서의 태실의 가치를 확인할 수 있었다. 그리고 태실 주변의 시설 재정비 및 환경개선을 통해 방문객들이 자극을 느끼거나 기분전환 할 수 있도록 유도할 수 있는 요인이 필요하다고 판단된다.

고등학생의 온라인 커뮤니티 지속사용의도에 대한 연구 (A Study on the Intention of Continuing Use of Online Community in High School Students)

  • 문재영;이새봄;최호성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.195-196
    • /
    • 2019
  • 온라인 커뮤니티는 사용자들의 상호작용을 기반으로 생성된 컨텐츠(member-generated content)를 그 핵심가치로 제시하고 있으며, 이용자들은 소통의 장으로써 온라인 커뮤니티 내에서 정보획득, 교육자료 공유 등 다양한 혜택을 누릴 수 있다. 최근 2년 페이스북과 카카오스토리, 밴드 등과 같은 대표적인 소셜 네트워크 서비스(SNS) 이용자 수가 감소한 반면, 온라인 커뮤니티만 상승세를 보이고 있다. 따라서 본 연구에서는 여자고등학생들을 대상으로 고등학생들의 온라인커뮤니티 이용 실태와 이용하는 의도를 살펴보고자 한다. 연구를 위해 정보품질, 커뮤니티 정보의 신뢰성, 학습 혜택, 사회적 혜택, 자아존중감 혜택, 쾌락적 혜택, 경제적 혜택, 신뢰, 몰입 그리고 지속사용의도와 관련된 설문을 실시하였다.

  • PDF

트위터 이용자의 언어권별 자기노출 및 경계 불투과성 (Self-Disclosure and Boundary Impermeability among Languages of Twitter Users)

  • 장필식
    • 한국콘텐츠학회논문지
    • /
    • 제16권4호
    • /
    • pp.434-441
    • /
    • 2016
  • 본 연구에서는 빅데이터 분석기법을 이용하여 트위터 이용자들을 대상으로 언어에 따른 자기노출과 경계불투과성에 대한 양상을 파악하였다. 6개월 동안 5천4백만 명의 트위터 이용자가 작성한 4억여 개의 트윗을 수집하였으며, 이들 중 트윗 수 상위 10개 언어권 이용자의 프로파일 및 관련 데이터를 조사하였다. 이를 통해 트위터 이용자의 언어가 이용자 프로파일, 프로파일 이미지, 지리정보, URL, 사용자 설명 등 자기정보 공개 항목의 공개비율과 경계불투과성에 미치는 영향을 분석하였다. 분석결과, 경계 불투과성과 자기노출 비율(프로파일, 프로파일 이미지, URL, 이용자 설명, 지리정보)은 언어권에 따라 각각 통계적으로 유의한(p<0.001) 차이가 있는 것으로 나타났다. 자기노출 비율과 평균 점수는 포르투갈어, 인도네시아어 및 스페인어 이용자가 아랍어, 일본어, 터키어, 한국어 이용자에 비해 높은 것으로 파악되었다. 또한 리트윗을 포함한 트윗 수가 많은 이용자일수록 경계 불투과성이 높아지는 것으로 나타났다.

빅데이터 기반 문서 토픽 추출 시스템 연구 (A Study on the Document Topic Extraction System Based on Big Data)

  • 황승연;안윤빈;신동진;오재곤;문진용;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권5호
    • /
    • pp.207-214
    • /
    • 2020
  • 요즘 스마트폰, 각종 전자기기 등의 사용이 늘고, 인터넷과 SNS가 활성화되며 우리는 정보의 홍수 속에 살고 있다. 정보의 양이 기하급수적으로 증가하며 많은 정보를 다 살펴보는 것이 어려워졌고, 문서에서 핵심 키워드만 보기를 원하는 사람이 늘어나며 정보의 핵심이 되는 토픽을 추출하는 연구의 중요성이 증가하고 있다. 또한, 토픽을 추출하여 과거와 비교 분석하여 현재의 트렌드를 유추해내는 것도 최근 중요한 이슈이다. 토픽 모델링 기법을 이용하여 대량의 문서에서 토픽을 추출해낼 수 있으며, 이렇게 추출된 토픽은 트렌드 예측, 데이터 분석 등 다양한 분야에서 쓰일 수 있다. 본 논문에서는 빠르게 변하는 트렌드를 분석하여 시대의 흐름에 맞춰가기 위해 확률적 토픽 모델 기법의 하나인 LDA 알고리즘을 활용하였으며, 문서에서 컴퓨팅 분야의 2016, 2017, 2018년도 3개년 논문의 주제를 알아보고, 연구의 동향과 흐름을 분석한다.

머신러닝 기반의 기업가치 예측 모형: 온라인 기업리뷰를 활용하여 (Machine Learning based Firm Value Prediction Model: using Online Firm Reviews)

  • 이한준;신동원;김희은
    • 인터넷정보학회논문지
    • /
    • 제22권5호
    • /
    • pp.79-86
    • /
    • 2021
  • 빅데이터 분석의 유용성이 주목을 받으면서 경영학 분야에서도 이를 활용하여 기업의 성과를 예측하고자 하는 다양한 연구들이 진행되고 있다. 이러한 선행연구들은 주로 뉴스 기사나 SNS 등 기업 외부의 자료에 의존하고 있다. 직원의 만족도나 기업에 대한 직원의 인식, 장단점 평가와 같은 기업 내부의 목소리는 기업가치에 대한 잠재적인 영향력에도 불구하고 상대적으로 확보가 어려워 관련 연구가 아직 충분치 못하다. 이에 본 연구에서는 국내 유가증권시장 상장 기업을 대상으로 임직원의 기업리뷰가 기업가치에 미치는 영향을 살펴보고, 이를 기반으로 기업가치를 예측하는 모형을 구축하고자 한다. 이를 위해 온라인 기업리뷰 사이트인 잡플래닛(Jobplanet)에 2014년부터 2019년까지 전·현직원이 남긴 97,216건의 기업리뷰를 수집하고 동 데이터에 근거하여 머신러닝 기반의 예측 모형을 제안하였다. 제안한 모형 중 LSTM 기반 모형의 정확도가 73.2%로 가장 높았고 MAE 또한 0.359로 가장 낮은 오차를 보였다. 본 연구는 국내에서 머신러닝을 활용한 기업가치 연구 분야에 유용한 사례가 될 것으로 기대한다.

대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘 (A MapReduce-based kNN Join Query Processing Algorithm for Analyzing Large-scale Data)

  • 이현조;김태훈;장재우
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.504-511
    • /
    • 2015
  • 최근 모바일 기술의 발달 및 소셜 네트워크 서비스의 활성화를 통해 사용자 데이터가 급격히 증대되고 있다. 이에 따라 대용량 데이터에 대한 효율적인 데이터 분석 기법에 대한 연구가 활발히 이루어지고 있다. 대표적인 대용량 데이터 분석 기법으로는 맵리듀스 환경에서 보로노이 다이어그램을 이용한 k 최근접점 조인(VkNN-join) 알고리즘이 존재한다. 데이터집합 R, S에 대해, VkNN-join 알고리즘은 부분집합 Ri에 연관된 부분집합 Sj만을 후보탐색 영역으로 선정하여 질의처리를 수행하기 때문에, 대용량 데이터에 대한 join 질의처리 시간을 감소시키는 장점이 존재한다. 그러나 VkNN-join은 보로노이 다이어그램을 사용하기 때문에, 색인 구축 비용이 높은 단점이 존재한다. 아울러 kNN 질의처리를 위한 후보 영역 선정 시 k값에 비례하여 후보영역의 크기가 증가하기 때문에, kNN 연산 오버헤드가 증가하는 문제점이 존재한다. 이를 해결하기 위해 본 논문에서는 대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘을 제안한다. 제안하는 질의처리 알고리즘은 시드 기반의 동적 분할을 통해 색인구조 구축비용을 절감한다. 또한 시드 간 평균 거리를 기반으로 질의 처리 후보 영역을 선정함으로써, kNN-join 질의를 위한 연산 오버헤드를 감소시킨다. 아울러, 성능 평가를 통해 제안하는 기법이 질의처리 시간 측면에서 기존 기법에 비해 우수함을 보인다.

K-Beauty 구전효과가 온라인 매출액에 미치는 영향: 중국 SINA Weibo와 Meipai 중심으로 (Word-of-Mouth Effect for Online Sales of K-Beauty Products: Centered on China SINA Weibo and Meipai)

  • 류미나;임규건
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.197-218
    • /
    • 2019
  • 중국 화장품 전체 교역중 약 67% 정도가 전자상거래로 이루어지고 있는데 특히 한국 화장품인 K-Beauty 제품의 인기가 높다. 기존 연구에 의하면 화장품 같은 소비재의 경우 소비자의 80%는 제품 구매 전 제품정보를 인터넷으로 검색하며 구전정보에 영향을 받는다. 대부분의 중국 소비자들은 화장품과 관련된 정보를 주요 SNS에 다른 소비자들이 올린 댓글을 통해 획득하며 최근에는 뷰티 관련 동영상 채널 정보를 이용하기도 한다. 기존의 온라인 구전 관련 연구는 대부분 Facebook, Twitter, 블로그 등의 매체 자체가 중심이었다. 본 연구에서는 온라인 구전정보의 전달 형태와 정보의 형태를 고려하여 정보유형을 동영상과 사진 및 텍스트로 나누어 연구하고자 한다. 중국의 SNS대표 플랫폼인 SINA Weibo와 동영상 플랫폼 Meipai의 비정형 데이터를 분석하고 온라인 구전정보를 양과 방향성으로 나누어 K-Beauty브랜드 매출액에 미치는 영향을 분석하고자 한다. Meipai에서는 총 약 33만개의 데이터를 수집하였고 SINA Weibo에서는 총 약 11만개의 데이터를 수집하여 화장품의 기본 속성도 고려하여 분석하였다. 본 연구의 의의는 온라인 매출은 K-Beauty화장품에 대해서도 구전에 영향을 받는다는 것을 기본적으로 입증함과 동시에 특히 정보 유형에 대한 구분을 시도 했다는 것이다. 두가지 매체 모두 기존 연구와 같이 양이 매출에 영향을 미치고 있으나 매체풍부성으로 인해 텍스트보다 동영상이 정보를 더 주고 영향이 크다는 것을 입증하였다. 또한, 정보 방향성 측면에서는 색조화장품의 경우 부정 댓글의 영향이 크게 나타났다. 실무적으로는 화장품 판매 전략 및 광고 전략에 기초 및 색조 화장품을 구분하여 중국 K-Beauty화장품 매출증대를 위한 마케팅전략을 구사하는데 도움이 될 것으로 기대된다.

빅데이터 시대의 개인정보 과잉이 사용자 저항에 미치는 영향 (Personal Information Overload and User Resistance in the Big Data Age)

  • 이환수;임동원;조항정
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.125-139
    • /
    • 2013
  • 최근 주목 받기 시작한 빅데이터 기술은 대량의 개인 정보에 대한 접근, 수집, 저장을 용이하게 할 뿐만 아니라 개인의 원하지 않는 민감한 정보까지 분석할 수 있게 한다. 이러한 기술이나 서비스를 이용하는 사람들은 어느 정도의 프라이버시 염려를 가지고 있으며, 이것은 해당 기술의 사용을 저해하는 요인으로 작용할 수 있다. 대표적 예로 소셜 네트워크 서비스의 경우, 다양한 이점이 존재하는 서비스이지만, 사용자들은 자신이 올린 수많은 개인 정보로 인해 오히려 프라이버시 침해 위험에 노출될 수 있다. 온라인 상에서 자신이 생성하거나 공개한 정보일 경우에도 이러한 정보가 의도하지 않은 방향으로 활용되거나 제3자를 의해 악용되면서 프라이버시 문제를 일으킬 수 있다. 따라서 본 연구는 사용자들이 이러한 환경에서 인지할 수 있는 개인정보의 과잉이 프라이버시 위험과 염려에 어떠한 영향을 주는지를 살펴보고, 사용자 저항과 어떠한 관계가 있는지 분석한다. 데이터 분석을 위해 설문과 구조방정식 방법론을 활용했다. 연구결과는 소셜 네트워크 상의 개인정보 과잉 현상은 사용자들의 프라이버시 위험 인식에 영향을 주어 개인의 프라이버시 염려 수준을 증가 시키는 요인으로 작용할 수 있음을 보여준다.

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.