• 제목/요약/키워드: 소셜 데이터 분석

검색결과 740건 처리시간 0.026초

그래프 데이터에 대한 비-중복적 키워드 검색 방법 (A Method for Non-redundant Keyword Search over Graph Data)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제16권6호
    • /
    • pp.205-214
    • /
    • 2016
  • 최근 소셜 네트워크, 시맨틱 웹, 바이오 인포매틱스 등 여러 응용 분야에서 그래프 구조를 갖는 대용량 데이터들에 활용됨에 따라 이런 데이터들에 대한 키워드 기반 검색 방법이 많은 관심을 받고 있다. 본 논문에서는 그래프 구조 데이터에 대한 키워드 질의에 대해 질의와 연관성이 높으면서 구조적인 중복성을 갖지 않는 top-k 결과 집합을 효율적으로 검색하는 방법을 제안한다. 키워드 질의에 대한 비-중복적인 결과 트리 구조와 그것의 연관도 척도를 정의하고, 그래프 내에 포함된 유용한 경로 정보들에 대한 효과적인 인덱싱 방법을 제안한다. 그리고 기 생성된 인덱스를 활용하여 주어진 키워드 질의에 대해 비-중복적이면서 연관도가 큰 top-k 결과 집합을 생성하는 효율적인 질의 처리 알고리즘을 제시한다. 실 데이터를 이용한 실험을 통해 제안한 방법의 효과와 성능을 기존 방법과 비교 분석한다.

Kerberos 기반 하둡 분산 파일 시스템의 안전성 향상방안 (A Study on Security Improvement in Hadoop Distributed File System Based on Kerberos)

  • 박소현;정익래
    • 정보보호학회논문지
    • /
    • 제23권5호
    • /
    • pp.803-813
    • /
    • 2013
  • 최근 스마트 기기 및 소셜 네트워크 서비스의 발달로 인해 데이터가 폭증하며 세계는 이른바 빅데이터 시대를 맞고 있다. 이에 이러한 데이터를 처리할 수 있는 새로운 기술인 빅데이터 처리기술은 클라우드 컴퓨팅 기술과 함께 주목받고 있으며, 가장 대표적인 기술이 바로 하둡이다. 하둡 분산 파일 시스템은 상용 리눅스 서버에서 실행되도록 설계된 오픈소스 프레임워크로서 수백 테라바이트 크기의 파일을 저장할 수 있다. 초기 하둡은 빅데이터 처리에 초점을 맞추어 보안이 거의 도입되지 않은 상태였으나 사용자가 빠르게 늘어남에 따라 하둡 분산 파일 시스템에 개인정보를 포함한 민감한 데이터가 많이 저장되면서, 2009년 커버로스와 토큰 시스템을 도입한 새로운 버전을 발표하였다. 그러나 이 시스템은 재전송 공격, 가장 공격 등이 가능하다는 취약점을 가진다. 따라서 본 논문에서는 하둡 분산 파일 시스템 보안 취약점을 분석하고, 이러한 취약점을 보완하면서 하둡의 성능을 유지할 수 있는 새로운 프로토콜을 제안한다.

의료 빅데이터를 활용한 CRM 기반 건강예보모형 설계 (Design of Health Warning Model on the Basis of CRM by use of Health Big Data)

  • 이상원;신성윤
    • 한국정보통신학회논문지
    • /
    • 제20권8호
    • /
    • pp.1460-1465
    • /
    • 2016
  • 오늘날 많은 비용이 국가 의료보장체계의 유지를 위협하고 있다. 국가 질병 통제 및 방지 센터의 감사체계를 동반한 건강관리 역학성에 대한 연구에도 불구하고, 시간 한계, 표본 한계, 대상 질병 한계에 대한 제약이 여전히 존재하고 있다. 이러한 배경에서, 방대한 양의 전수 데이터를 활용하여, 많은 기술들이 건강의 선제적 예측이나 그 대상 질병을 확장하는 분야에 충분하게 적용되고 있다. 우리는 국민건강보험의 구조적 데이터와 소셜네트워크서비스의 비구조적 데이터를 활용하여 질병을 예측하는 모형을 설계하였다. 이 모형은 건강예보서비스를 제공함으로써, 국민건강을 증진시키고 사회적 혜택을 극대화할 수 있다. 또한, 빅데이터 분석에 근거하여, 건강보험비용의 갑작스러운 증가를 감소시키거나 적시적인 질병발생을 예측할 수도 있다. 관련된 의료 예측 사례를 살펴보았고, 제안된 모형의 검증을 위하여 시범과제를 통한 실험을 수행하였다.

SNS(Facebook) 서비스 분석을 통한 지역광고 어플(App) 설계 및 구현 (Design and Implementation of local advertising application(App) through SNS service analysis)

  • 조영식
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.325-334
    • /
    • 2015
  • 본 논문은 SNS(Social Network Service)와 연계된 지역광고 방법에 대하여 연구하고자 하였다. 특히, Facebook Page을 분석하여 지역광고에 활용 할 수 있는 방법을 찾고자 하였다. FaceBook Page 분석을 위해 2014년 7월부터 3개의 FaceBook Page(홍대앞, 강원대앞, 춘천뭐먹지?)를 직접 운영하였다. 각 Facebook Page들의 활동 결과에 대한 정량적인 결과 값들을 분석하였고, 또한, 각 Page의 네트워크 분석을 위해 NodeXL을 이용하였다. Facebook Page의 데이터를 분석한 결과, SNS와 연계된 지역광고에 대한 가능성을 확인 할 수 있었다. 향후 계속적인 연구와 실증을 위해, SNS와 연계된 실시간 지역광고 어플(App)을 설계하였고, Java 기반의 Android App과 php 기반의 Server 프로그램을 구현하였다. 향후, Facebook Page와 개발된 App의 운영된 데이터를 활용하여, 다양한 지역광고 방법에 대하여 연구가 가능할 것으로 기대한다.

엔트로피 점수를 이용한 감성분석 분류알고리즘의 수행도 평가 (Evaluation of Classification Algorithm Performance of Sentiment Analysis Using Entropy Score)

  • 박만희
    • 한국정보통신학회논문지
    • /
    • 제22권9호
    • /
    • pp.1153-1158
    • /
    • 2018
  • 다양한 온라인 고객 평가 및 소셜 미디어 정보는 고객의 의사결정에 영향을 미치기 때문에 기업에게 매우 중요한 정보 출처라고 할 수 있다. 설문 조사를 통해 고객의 다양한 요구와 불만 사항을 파악하는 데는 많은 비용과 시간적인 제약이 발생하고 있다. 온라인 쇼핑몰의 고객 후기 데이터는 제품에 대한 고객들의 감성을 분석할 수 있는 이상적인 자료를 제공하고 있다. 본 연구에서는 삼성과 애플 스마폰에 대한 감성분석을 위해 아마존 쇼핑몰로부터 고객 리뷰 데이터를 수집하였다. 선행 연구에서 대표적인 감성분석 기법으로 사용된 5가지 분류 알고리즘을 적용하였다. 5가지 분류알고리즘은 support vector machines, bagging, random forest, classification or regression tree, maximum entropy 등이다. 본 연구에서는 분류 알고리즘의 수행도를 종합적으로 평가할 수 있는 entropy score를 제안하였다. Entropy score를 이용하여 5가지 알고리즘을 평가한 결과에 따르면 support vector machines 알고리즘의 entropy score가 가장 높은 것으로 분석되었다.

모바일 포렌식 연구를 위한 서드 파티 어플리케이션 분석 (Third Party Application Analysis For Mobile Forensics Study)

  • 류정현;박종혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.336-339
    • /
    • 2017
  • 스마트폰 서드 파티 애플리케이션에 대한 포렌식 분석은 최근 수 년 간 탐구되어야 할 새로운 영역으로 떠올랐다. 현재 스마트폰 시장은 그 규모를 측정하는 것이 무의미할 만큼 커졌으며 각 스마트폰 플랫폼의 앱(App)마켓에는 셀 수 없이 많은 서드 파티 애플리케이션이 존재한다. 모바일 포렌식 소프트웨어 도구들은 일반적으로 연락처, 문자메시지, 통화기록 등의 전형적인 데이터를 수집한다. 이러한 도구들은 서드 파티 애플리케이션이 기기 내부에 저장하는 정보들을 간과하기 쉽다. 여러 제조사 중, 애플사의 모바일 기기에 설치된 많은 서드 파티 애플리케이션은 수사에 도움이 되는 많은 정보와 관련있는 디지털 증거를 남긴다. 이런 잠재적 증거들은 기기 내부에 저장되기도 하며, 비교적 손쉬운 방법으로 법정에 제출 가능하다. 스마트폰으로 이루어지는 많은 활동은 상당 부분 서드 파티 애플리케이션으로 이루어지며, 사이버 범죄 사건의 중심에 스마트폰이 있다면 서드 파티 애플리케이션 분석을 통한 핵심 증거 획득이 사건을 해결할 가능성이 높아진다. 본 논문에서는 스마트폰에서 널리 쓰이고 있는 소셜네트워크 애플리케이션인 '인스타그램(Instagram)'에서 행해진 포렌식 분석에 초점을 맞추고, 기기는 전 세계 적으로 가장 사용자 점유율이 높은 스마트폰인 아이폰에서 이루어졌다.

인적 자원 소속성 분석을 위한 역할-수행자 이분 행렬 생성 알고리즘 (A Role-Performer Bipartite Matrix Generation Algorithm for Human Resource Affiliations)

  • 김학성
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.149-155
    • /
    • 2018
  • 본 논문에서는 BPM기반 인적 자원 소속성 분석을 위한 역할-수행자 이분 행렬 생성 알고리즘을 제안한다. 제안된 알고리즘은 정보제어넷 기반의 비즈니스 프로세스 모델로부터 역할-수행자 소속 관계를 추출하는 단계와 이로부터 역할-수행자 이분 행렬을 생성하는 단계로 구성된다. 결론적으로 생성된 행렬은 역할-수행자 소속성 네트워킹 지식을 발견하기 위한 데이터 구조로서 활용될 뿐 아니라 소셜 네트워크 분석 기법을 적용하여 BPM 기반 인적 자원 소속성 분석 결과를 도출할 수 있다.

브랜드 개성 효과: 트위터 상의 브랜드 개성 전달이 온라인 커뮤니티 참여에 미치는 영향 (The Brand Personality Effect: Communicating Brand Personality on Twitter and its Influence on Online Community Engagement)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.67-101
    • /
    • 2014
  • 새로운 기술의 활용은 고객과의 관계를 맺기위한 기업들의 마케팅 전략을 변모시켜왔다. 새로운 기술 중에서 소셜 미디어는 기업들이 온라인 고객들에게 다가가기 위한 도구이며, 유명한 소셜 미디어 사이트 중의 하나는 마이크로 블로깅 플랫폼인 트위터이다. 매일 5억건이상의 트윗이 발생하기때문에 연구자들에게는 풍부한 데이터의 원천이며, 기업들에겐 매력적인 마케팅 채널이다. 그럼에도 불구하고 효과적인 트위터 활용전략을 수립하는 것이 어려우며, 이는 적절한 트위터 활용에 대한 이론적인 또는 실증적인 검증이 이루어지지 않았기 때문이다. 본 연구는 기업들이 마케팅 채널로서의 트위터를 어떻게 효과적으로 활용할 수 있는지에 대한 실증적인 근거를 브랜드 개성과 브랜드 관여를 중심으로 연구하여 제공하고자 한다. 본 연구는 Aaker의 브랜드 개성에 대한 연구에서 제시한 브랜드 개성 척도를 활용하여 트위터 메시지가 브랜드 개성을 띄고 있는지와 이에 따른 고객들의 참여와 반응을 분석하고자 한다. 또한, 제품의 관여도에 따라서 조절효과가 존재하는지도 분석하였다. 23개 브랜드의 8주간의 트위터 계정의 포스팅을 수집하였으며, 오피니언 마이닝을 통하여 연구 가설을 검증하였다. 구체적인 본 연구의 목적은 첫째로 마케팅 연구에서 제시된 브랜드 개성의 개념이 소셜 미디어인 트위터에도 적용이 가능한지 분석하는 것이다. 둘째는 오프라인 브랜드 개성과 온라인 브랜드 개성간의 일치여부와 소셜 미디어 브랜드 커뮤니티의 활성화간의 관계를 밝히고자 한다. 마지막으로, 제품의 관여도에 따라 온라인/오프라인 브랜드 개성의 일치도가 조절효과를 갖는지를 분석하고자 한다.

Development of big data based Skin Care Information System SCIS for skin condition diagnosis and management

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.137-147
    • /
    • 2022
  • 피부상태의 진단과 관리는 뷰티산업종사자와 화장품산업종사자에게 그 역할을 수행함에 있어서 매우 기초적이며 중요한 기능이다. 정확한 피부상태 진단과 관리를 위해서는 고객의 피부상태와 요구사항을 잘 파악하는 것이 필요하다. 본 논문에서는 피부상태 진단 및 관리를 위해 소셜미디어의 빅데이터를 사용하여 피부상태 진단 및 관리를 지원하는 빅데이터기반 피부관리정보시스템 SCIS를 개발하였다. 개발된 시스템을 사용하여 텍스트 정보 중심의 피부상태 진단과 관리를 위한 핵심 정보를 분석하고 추출할 수 있다. 본 논문에서 개발된 피부관리정보시스템 SCIS는 빅데이터 수집단계, 텍스트전처리단계, 이미지전처리단계, 텍스트단어분석단계로 구성되어 있다. SCIS는 피부진단 및 관리에 필요한 빅데이터를 수집하고, 텍스트 정보를 대상으로 핵심단어의 단순빈도분석, 상대빈도분석, 동시출현분석, 상관성분석을 통해 핵심단어 및 주제를 추출하였다. 또한 추출된 핵심단어 및 정보를 분석하고 산포도, NetworkX, t-SNE 및 클러스터링 등의 다양한 시각화 처리를 함으로써 피부상태 진단 및 관리에 있어 이를 효율적으로 사용할 수 있도록 하였다.

패션 트렌드의 주기적 순환성에 관한 빅데이터 융합 분석 (The Analysis of Fashion Trend Cycle using Big Data)

  • 김기현;변혜원
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.113-123
    • /
    • 2020
  • 본 논문은 과거와 현재의 패션 트렌드와 패션 유행 주기에 관한 빅데이터 분석을 실시하였다. 패션 전문가나 패션쇼가 아닌 일반 사람들의 데일리룩을 위한 패션 트렌드를 분석하는데 집중하였다. 소셜 매트릭스 도구인 텍스톰을 활용하여 빈도수 분석, N-gram 분석, 네트워크 분석 및 구조적 등위성 분석을 수행하였다. 분석 결과, 첫째, 패션 전문가가 아닌 일반 사람들의 데일리 룩을 대상으로 과거(1980년대, 1990년대)와 현재(2019년, 2020년)의 패션 키워드를 도출하였다. 둘째, 과거의 패션이 현재의 패션으로 재현되는 순환성과 순환 주기가 30-40년 정도로 짧아졌음을 빅데이터 분석을 통해 과학적으로 검증하였다. 셋째, 도출된 패션 키워드들의 구조적 등위성 분석을 수행한 결과, 과거 패션에서는 청바지 패션, 레트로 코디, 애슬레저룩, 연예인 복고패션의 4개의 군집으로, 현재 패션에서는 레트로 청바지, 뉴트로, 레이디 쉬크, 레트로 퓨처리즘의 4개의 군집을 확인하였다. 넷째, 과거의 패션이 현재의 패션으로 재현되고 진화하는 네트워크 연결 관계를 확인하고 그 배경에 관한 이슈를 고찰하였다. 이와 같은 연구결과는 과거와 현재의 패션 키워드를 도출하고 이로부터 패션 유행의 순환 주기를 확인함으로써 과거를 통해 미래 패션을 예측하도록 하는데 의의가 있다.