• 제목/요약/키워드: 소셜 데이터 분석

검색결과 737건 처리시간 0.03초

디지털화된 족보 빅데이터 및 네트워크 연구 - 김해김씨와 혼인한 본관을 중심으로 (Big data and network analysis on genealogy focusing on marital relationships of Kimhae Kim's family)

  • 남윤재;박진홍
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.39-51
    • /
    • 2019
  • 본 연구는 혼맥 관계 네트워크를 활용하여 조선시대 집안과 집안간의 연결관계를 시계열적으로 분석하려는 목적을 갖는다. 이에 김해김씨 족보자료를 중심으로 1500년대부터 1800년대까지 김해김씨와 혼인을 맺은 집안들의 혼맥 관계를 네트워크화 하고, 각 집안들의 네트워크 중심성을 산출하였다. 또한, 50년 간격으로 8개의 네트워크를 도출하여 김해김씨와 혼맥 관계를 맺은 집안들의 네트워크 밀도와 네트워크 집중화 경향, 그리고 네트워크효과를 분석하였다. 연구 결과로는 전체 네트워크의 크기는 시대가 지남에 따라 증가하였으며, 네트워크집중화 경향성은 점차 감소하는 추세를 보여주었으나, 네트워크상의 혼맥 관계 상위 집안들은 큰 변화가 없는 것으로 나타났지만, 네트워크효과는 시간이 지남에 따라 크게 증대되었다. 본 연구는 기존의 족보연구가 한 집안에 집중되거나 정보 기재 방식에 집중되었지만, 디지털화된 빅데이터 족보자료를 활용하여 더욱 다양한 함의를 도출할 수 있음을 보여주며, 이에 족보의 디지털 데이터화 추진을 제안한다.

편향된 의견 문서 검출을 위한 이상치 탐지 기법 (Outlier Detection Techniques for Biased Opinion Discovery)

  • 연종흠;심준호;이상구
    • 한국전자거래학회지
    • /
    • 제18권4호
    • /
    • pp.315-326
    • /
    • 2013
  • 소셜 미디어에서는 상품평, 영화평 등의 다양한 종류의 의견이 표현되고 있으며, 사용자들이 물품 구매 등에 있어 이러한 의견을 참고로 하여 결정을 내리는 것은 일반적이 되었다. 하지만 의견 정보의 활용도가 높아질수록 이를 부적절하게 왜곡하는 사례 또한 증가하고 있다. 예를 들어, 홍보를 목적으로 과도하게 긍정적인 의견이 포함된 리뷰를 작성하거나, 반대로 일반적인 평가에서 벗어나 과도하게 부정적인 의견을 게시하는 경우 등이다. 편향된 의견은 소셜 미디어의 신뢰성과 연결 되기 때문에 이를 검출하는 것은 점차 중요한 문제로 대두되고 있다. 기존의 오피니언 마이닝 혹은 감성 분석은 문서를 분석하여 그 문서가 가지고 있는 의견의 성향을 판단하는 기법이다. 하지만 기존의 연구는 의견을 단순히 긍정/부정으로만 분류하는 방향으로 연구가 이루어져 왔으며, 특히 사전에 의견 성향에 따라 분류된 충분한 양의 학습 데이터가 필요하다는 단점이 있다. 본 논문에서는 학습데이터가 없는 경우에, 전체 문서의 의견 성향 분포에서 벗어난 의견 문서를 검출하는 기법을 제안한다. 여기에는 각도기반 이상치 탐지와, 개인화된 페이지랭크 방법을 활용한다. 또한 영화 리뷰 문서를 대상으로 실험을 수행하여 제안한 방법들의 성능을 분석하였다.

주요 단기소득임산물(표고버섯, 밤, 떫은감)에 대한 소비 의향 분석: 소셜 빅데이터 분석을 이용하여 (Analysis on Consumer's Preference for Non-Timber Forest Product (Shiitake, Chest nut, Persimmon): Social Big-data Analysis)

  • 석현덕;최준영;변승연;민선형
    • 한국산림과학회지
    • /
    • 제108권1호
    • /
    • pp.97-108
    • /
    • 2019
  • 최근 단기소득임산물 생산량 증가에 따라 정부나 관련 기관에서 단기소득임산물에 대한 소비를 촉진하기 위한 다양한 노력을 하고 있다. 소비 촉진 노력의 일환으로 단기소득임산물에 대한 소비자 의향 연구가 진행되고 있지만 대부분의 연구는 설문조사에만 의존하는 상황이다. 정보화 시대에서 소비재에 대한 소비자 의향은 인터넷 확산에 따라 SNS에 크게 반영되고 있다. 기존 연구에서 설문에만 의존하는 것을 탈피하여 소비자의 의향이 직접 반영되어 있는 SNS를 직접 분석하는 것이 필요하다. 이에 본 연구는 소셜 빅테이터 분석을 통해 주요 단기소득임산물에 대한 소비자 의향을 파악하였으며, 이 결과를 이용해 해당 단기소득임산물의 판매 촉진 전략을 수립하였다. 본 논문은 설문조사만을 이용한 기존의 단기임산물 관련 연구들과는 다르게 적은 비용으로 많은 표본들의 즉각적인 반응을 파악할 수 있는 SNS 빅데이터를 활용하여 소비자 의향을 파악하였다는 것에 차별성이 있다. 본 연구의 결과는 정부나 관련 기관의 단기소득임산물의 소비 촉진 정책에 직접적으로 도움이 되고 궁극적으로는 임가 소득 향상과 건강한 산림관리에 도움이 될 수 있을 것이라 기대된다.

A study on the perception of 3D virtual fashion before and after COVID-19 using textmining

  • Cho, Hyun-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.111-119
    • /
    • 2022
  • 본 연구는 빅데이터 분석을 이용하여 코로나19 전후의 3D가상패션에 대한 인식의 변화를 알아보기 위하여 코로나19 발생 전인 2017년 1월1일부터 발생 이후인 2022년 10월30일까지 소셜미디어 네이버, 다음, 구글, 유튜브에서 추출한 3D 가상패션 관련 주요 단어들을 대상으로 텍스톰을 이용하여 빅데이터 자료를 수집하였다. 수집된 단어는 정제 과정을 거친 후 워드클라우드, 단어의 빈도, 연결중심성, 네트워크 시각화와 CONCOR 분석을 실시하였다. 3D 가상패션을 키워드로 32,461개의 단어를 추출하여 분석한 결과 패션, 가상, 기술의 출현빈도와 중심성이 가장 높게 나타났으며 디지털, 디자인, 의상, 활용, 제조의 출현빈도도 높게 나타났다. 이를 통해 3D 가상패션이 기술의 발달과 더불어 산업 전반에 활용되고 있음을 알 수 있었다. 특히 코로나19 이후 가장 부각되는 주요 단어는 메타버스와 3D 교육으로서 패션산업에서의 요구도가 높게 나타나고 있다.

인지된 정보 통제가 소셜 네트워크 이용자의 정보 제공 의도에 미치는 영향 (The Effect of Perceived Information Control on the Knowledge Sharing Intention of the Social Network Service Users)

  • 이은곤;김경규;송호현
    • 한국전자거래학회지
    • /
    • 제18권1호
    • /
    • pp.107-127
    • /
    • 2013
  • 정보통신 기술의 발전에 따라 사람들은 소셜 네트워크 서비스(SNS)를 통해 다른 사람과 소통하고 자신의 정보를 공유하고 있다. 그러나 이 과정에서 SNS 이용자들의 개인정보가 의도하지 않게 노출되거나 악용되는 사례가 나타났다. 이러한 문제를 해결하기 위해 본 연구에서는 데이터 관리에 관한 선행 연구를 바탕으로 정보 통제 요소가 SNS 이용자들의 보안 우려와 SNS 사업자에 대한 신뢰에 미치는 효과를 살펴보고자 하였다. 본 연구에서는 이를 통해 접근 통제, 열람 통제 및 확산 통제의 세 가지 정보 통제 요소를 추출하였다. 가장 널리 알려져 있는 SNS 서비스로서 페이스북 이용자를 대상으로 설문 조사를 진행하였다. 총 459개의 자료를 수집하였으며 PLS 알고리즘을 이용하여 분석한 결과, 열람 통제와 확산 통제는 유의하게 SNS 이용자들의 보안 우려를 감소시키고 SNS 서비스 제공자에 대한 신뢰를 증진시킴으로써 SNS 서비스에 대한 만족도와 지속적인 정보 공유 의도를 증가시키는 것으로 조사되었다. 본 연구는 소셜 네트워크 서비스에서 보안 문제를 제기한 선도적인 연구일 뿐 아니라, 실제 구현이 용이한 보안 통제 기법을 소개함으로써 실무적인 측면에서도 가치가 높을 것으로 기대한다.

빅데이터를 활용한 젠트리피케이션 상권의 장소성 분류와 특성 분석 -서울시 14개 주요상권을 중심으로- (Classifying and Characterizing the Types of Gentrified Commercial Districts Based on Sense of Place Using Big Data: Focusing on 14 Districts in Seoul)

  • 김영재;박인권
    • 지역연구
    • /
    • 제39권1호
    • /
    • pp.3-20
    • /
    • 2023
  • 본 연구는 젠트리피케이션이 발생한 상권의 장소성을 파악하여 상권의 확장과 쇠퇴 속에서 장소성의 구체적인 모습을 유형화하고 유형별 특징을 분석하는 것을 목적으로 한다. 소셜 미디어를 통해 수집된 대용량 문서를 활용하여 위계적 군집분석을 시행하였으며, 지역별 장소성을 인지적 차원의 <경험>과 실재적 차원의 <상권특성>으로 구분하여 상권 군집별 특성을 확인하였다. 이를 위해 잠재 디리클레 할당(Latent Dirichlet Allocation: LDA) 토픽모델링 기법과 서울시 우리마을가게 상권분석서비스를 통해 수집된 상권별 매출액 통계자료를 활용하였다. 분석 결과 서울시 젠트리피케이션 상권은 고유한 특성을 가진 '연극 상권', '전통문화 상권', '여성 미용 상권', '고급음식점 및 의료서비스 상권', '트렌디 상권'으로 분류되는 것으로 나타났다. 연구의 결과를 바탕으로 보다 효율적이고 지역별 특색에 맞는 상업정책들을 시행할 수 있을 것으로 기대한다.

커뮤니티 기반 Q&A서비스에서의 질의 할당을 위한 이용자의 관심 토픽 분석에 관한 연구 (A Study on Mapping Users' Topic Interest for Question Routing for Community-based Q&A Service)

  • 박종도
    • 정보관리학회지
    • /
    • 제32권3호
    • /
    • pp.397-412
    • /
    • 2015
  • 본 연구에서는 커뮤니티 기반 질의응답 서비스에서의 질의할당을 위하여, 해당 커뮤니티에 축적된 질의응답 데이터 세트를 이용하여 해당 카테고리내의 토픽을 분석하고 이를 바탕으로 해당 토픽에 관심을 가지는 이용자의 관심 토픽을 분석하고자 하였다. 특정 카테고리 내의 토픽을 분석하기 위해서 LDA기법을 사용하였고 이를 이용하여 이용자의 관심 토픽을 모델링하였다. 나아가, 커뮤니티에 새롭게 유입되는 질의에 대한 토픽을 분석한 후, 이를 바탕으로 해당 토픽에 대해 관심을 가지고 있는 이용자를 추천하기 위한 일련의 방법들을 실험하였다.

그래프 데이터에 대한 비-중복적 키워드 검색 방법 (A Method for Non-redundant Keyword Search over Graph Data)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제16권6호
    • /
    • pp.205-214
    • /
    • 2016
  • 최근 소셜 네트워크, 시맨틱 웹, 바이오 인포매틱스 등 여러 응용 분야에서 그래프 구조를 갖는 대용량 데이터들에 활용됨에 따라 이런 데이터들에 대한 키워드 기반 검색 방법이 많은 관심을 받고 있다. 본 논문에서는 그래프 구조 데이터에 대한 키워드 질의에 대해 질의와 연관성이 높으면서 구조적인 중복성을 갖지 않는 top-k 결과 집합을 효율적으로 검색하는 방법을 제안한다. 키워드 질의에 대한 비-중복적인 결과 트리 구조와 그것의 연관도 척도를 정의하고, 그래프 내에 포함된 유용한 경로 정보들에 대한 효과적인 인덱싱 방법을 제안한다. 그리고 기 생성된 인덱스를 활용하여 주어진 키워드 질의에 대해 비-중복적이면서 연관도가 큰 top-k 결과 집합을 생성하는 효율적인 질의 처리 알고리즘을 제시한다. 실 데이터를 이용한 실험을 통해 제안한 방법의 효과와 성능을 기존 방법과 비교 분석한다.

Kerberos 기반 하둡 분산 파일 시스템의 안전성 향상방안 (A Study on Security Improvement in Hadoop Distributed File System Based on Kerberos)

  • 박소현;정익래
    • 정보보호학회논문지
    • /
    • 제23권5호
    • /
    • pp.803-813
    • /
    • 2013
  • 최근 스마트 기기 및 소셜 네트워크 서비스의 발달로 인해 데이터가 폭증하며 세계는 이른바 빅데이터 시대를 맞고 있다. 이에 이러한 데이터를 처리할 수 있는 새로운 기술인 빅데이터 처리기술은 클라우드 컴퓨팅 기술과 함께 주목받고 있으며, 가장 대표적인 기술이 바로 하둡이다. 하둡 분산 파일 시스템은 상용 리눅스 서버에서 실행되도록 설계된 오픈소스 프레임워크로서 수백 테라바이트 크기의 파일을 저장할 수 있다. 초기 하둡은 빅데이터 처리에 초점을 맞추어 보안이 거의 도입되지 않은 상태였으나 사용자가 빠르게 늘어남에 따라 하둡 분산 파일 시스템에 개인정보를 포함한 민감한 데이터가 많이 저장되면서, 2009년 커버로스와 토큰 시스템을 도입한 새로운 버전을 발표하였다. 그러나 이 시스템은 재전송 공격, 가장 공격 등이 가능하다는 취약점을 가진다. 따라서 본 논문에서는 하둡 분산 파일 시스템 보안 취약점을 분석하고, 이러한 취약점을 보완하면서 하둡의 성능을 유지할 수 있는 새로운 프로토콜을 제안한다.

의료 빅데이터를 활용한 CRM 기반 건강예보모형 설계 (Design of Health Warning Model on the Basis of CRM by use of Health Big Data)

  • 이상원;신성윤
    • 한국정보통신학회논문지
    • /
    • 제20권8호
    • /
    • pp.1460-1465
    • /
    • 2016
  • 오늘날 많은 비용이 국가 의료보장체계의 유지를 위협하고 있다. 국가 질병 통제 및 방지 센터의 감사체계를 동반한 건강관리 역학성에 대한 연구에도 불구하고, 시간 한계, 표본 한계, 대상 질병 한계에 대한 제약이 여전히 존재하고 있다. 이러한 배경에서, 방대한 양의 전수 데이터를 활용하여, 많은 기술들이 건강의 선제적 예측이나 그 대상 질병을 확장하는 분야에 충분하게 적용되고 있다. 우리는 국민건강보험의 구조적 데이터와 소셜네트워크서비스의 비구조적 데이터를 활용하여 질병을 예측하는 모형을 설계하였다. 이 모형은 건강예보서비스를 제공함으로써, 국민건강을 증진시키고 사회적 혜택을 극대화할 수 있다. 또한, 빅데이터 분석에 근거하여, 건강보험비용의 갑작스러운 증가를 감소시키거나 적시적인 질병발생을 예측할 수도 있다. 관련된 의료 예측 사례를 살펴보았고, 제안된 모형의 검증을 위하여 시범과제를 통한 실험을 수행하였다.