• 제목/요약/키워드: 소셜 데이터 분석

검색결과 739건 처리시간 0.026초

분기한정 동적 스카이라인 질의 기법의 I/O 최적성 분석 및 실험 평가 (I/O Optimality and Performance Analysis of Branch and Bound Dynamic Skyline Query)

  • 최우성;현경석;김자연;정순영;김종완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.741-744
    • /
    • 2015
  • 최근 소셜 미디어를 이용한 대량의 데이터로부터 사용자의 의사결정을 지원하기위한 맞춤형 데이터 추천 서비스가 관심을 받고 있으며 사용자의 선호도에 근접한 데이터 추천기법으로 스카이라인 질의가 연구되어왔다. 그러나 기존의 스카이라인 질의는 데이터의 정적속성(위도, 경도, 가격 등)만을 기준으로 모든 사용자에게 동일한 데이터를 반환하기 때문에 맞춤형 데이터를 추천하기 어렵다. 본 논문에서는 사용자의 기호에 대한 정밀도를 높이기 위해 정적속성에서 동적속성(계산속성)을 유도하는 분기한정 동적 스카이라인 질의 기법(Branch and Bound Dynamic Skyline, BBDS)을 구현하였다. 시뮬레이션에서는 대규모 데이터 및 다양한 분포에 따른 실험을 수행한 결과 BBDS가 기존 기법에 비해 데이터 탐색과 추천에 있어서 향상된 성능을 나타내는 것으로 평가되었다.

FOAF와 SNA를 이용한 개선된 인터넷 자원 추천 방법 (Improved Internet Resource Recommendation Method using FOAF and SNA)

  • ;손종수;정인정
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.165-176
    • /
    • 2012
  • 최근 사용자들이 생성한 콘텐츠들이 크게 늘어나고 커뮤니티 기반 웹 사이트가 발전함으로 인하여 사용자들에게 인터넷 자원을 추천하는 시스템이 큰 각광을 받고 있다. 그러나 대부분의 인터넷 자원 추천 시스템들은 사용자의 특징을 충분하게 반영하지 못하는 한계를 가지고 있다. 이에 따라 본 논문에서는 사용자의 특징이 충분히 반영되는 자원의 추천을 위하여 FOAF와 SNA를 사용한 추천 방법을 제안한다. 제안하는 방법은 1) FOAF를 통해 사용자의 특징 데이터와 태그 데이터를 취득한다. 2) 취득한 데이터를 세 종류의 행렬에 삽입하고 통합한 후 사용자, 사용자의 특징, 태그를 나타내는 그래프를 생성한다. 3) 소셜 네트워크 분석을 통해 추천 항목의 일반 특징과 핫태그(Hot tag)를 선정하여 인터넷 자원을 추천한다. 본 논문의 검증을 위하여 우리는 실험을 통해 본 논문에서 제안한 방법과 아이템 기반 추천 방법을 비교하였다. 이를 통해 보다 많은 사용자가 참여할수록 아이템 기반 추천 방법보다 본 논문에서 제안한 방법에 의한 추천 결과의 품질이 우수함을 확인하였다. 본 논문에서 제안하는 방법을 활용하면 사용자들에게 보다 적합한 자원을 추천하는 것이 가능하다. 그리고 제안하는 방법은 폭발적으로 늘어나는 인터넷 자원을 검색하는데 있어 효율적으로 활용될 수 있다.

소셜 네트워크 분석을 통한 무형문화유산 공동체 지식연결망 연구 - 정선아리랑을 중심으로 - (A Study of Intangible Cultural Heritage Communities through a Social Network Analysis - Focused on the Item of Jeongseon Arirang -)

  • 오정심
    • 헤리티지:역사와 과학
    • /
    • 제52권3호
    • /
    • pp.172-187
    • /
    • 2019
  • 본 논문의 목적은 무형문화유산 일반전승자의 역할을 주목하면서, 소셜 네트워크 분석을 활용해 무형문화유산 전승공동체의 연결망과 전승활동에서 발생하는 지식 흐름의 구조적 특징을 분석하는 데 있다. 이러한 연구 목적을 이루기 위해 본 논문에서는 연구 대상을 국가무형문화재 종목들 중에서 일반인의 전승활동이 활발한 '아리랑'으로 선정하였다. 아리랑은 오랜 기간 제도권 밖에서 일반대중 활동을 중심으로 자생적으로 전승되었으며, 2015년에 전문전승자 지정 없이 국가무형문화재로 지정된 최초의 사례이다. 현재 아리랑은 약 60여 종, 3,600여 곡에 이르는 것으로 추정된다. 본 논문에서는 이 중에서 전문전승자와 일반전승자의 상호교류가 활발한 향토민요 '정선아리랑'을 중심으로 연구하였다. 소셜 네트워크 분석은 사람과 사람 사이의 관계를 노드(Node)와 링크(Link)로 모델링하여 수치화 통계화 시각화하여 해석하는 방법을 말한다. 이 방법은 전통적으로 사회학에서 사회조직 및 취약계층을 연구하는 데 꾸준히 활용되었다. 최근에는 문헌정보학, 문화콘텐츠학, 경영학 등과 같은 분야에서 연구경향, 시장동향, 조직관리 등을 연구하는 데 이 방법이 활용되고 있다. 이처럼 여러 학문 분야에서 소셜 네트워크 분석을 이용한 연구가 증가하는 추세지만 문화재 분야에서는 관련 연구를 찾아보기가 어렵다. 소셜 네트워크 분석은 크게 3단계, '연결망 모델링', '데이터 수집', '데이터 분석 및 시각화'로 진행된다. 본 논문에서는 첫 번째, 2017년 기준으로 정선아리랑보존회 회원 전체를 조사 대상으로 선정하여 완전한 연결망으로 모델링하였다. 두 번째, 데이터 수집은 보존회 회원 명부를 확보해 2017년 10월 17일 면대면 조사와 2017년 12월 15일 전화 설문조사를 통해 하였다. 세 번째, 데이터 분석은 Netminer 4.0 프로그램을 이용해 중심성 분석, 구조적 등위성 분석, 커뮤니티 분석 등을 주요 지표로 하였다. 본 논문은 기존에 무형문화유산 계보조사에서 소수 사람들의 구술자료에 의존해 파악하던 방식에서 벗어나 객관적이고 계량적인 방법으로 조사할 수 있는 기반을 제공하였다는 점에서 연구 의의가 있다. 그리고 무형문화유산 전승공동체 구성원들의 관계 및 지식 흐름의 구조를 지식지도(2D Spring Map) 형태로 시각화함으로써 추상적인 내용을 직관적으로 파악할 수 있게 했다는 점에서 의미가 있다.

추천시스템에 활용되는 Matrix Factorization 중 FM과 HOFM의 비교 (Compare to Factorization Machines Learning and High-order Factorization Machines Learning for Recommend system)

  • 조성은
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.731-737
    • /
    • 2018
  • 추천 시스템은 컨텐츠, 온라인 커머스, 소셜 네트워크, 광고 시스템 등 많은 분야에서 사용자가 관심 있을 만한 정보를 선별 제안함을 목적으로 활발하게 연구되고 있다. 그러나 과거 선호도 데이터를 기반으로 제안하는 추천시스템이 많고 과거 데이터가 적거나 없는 사용자를 대상으로는 제공하기 어려우므로 낮은 성능을 보인다는 부문에서 문제점이 있다. 따라서 더욱 고차원적인 데이터 분석에 관한 관심이 증가하고 있고 Matrix Factorization이 주목받고 있다. 이 논문은 그 중 추천시스템에서 주목받는 Factorization Machines Learning(FM)모델과 고차원 데이터 분석인 High-order Factorization Machines Learning(HOFM)의 비교와 재연을 연구하고 제안 한다.

노인 인지능력 개선을 위한 헬스케어 서비스디자인 연구: 비정형 데이터 분석을 중심으로 (A Study on Health Care Service Design for the Improvement of Cognitive Abilities of the Senior Citizens: Focusing on Unstructured Data Analysis)

  • 김성호;김협
    • 지식경영연구
    • /
    • 제23권4호
    • /
    • pp.69-89
    • /
    • 2022
  • 초고령사회로 접어들면서 노인의 건강 문제는 의료분야를 포함해 경제, 사회, 문화 등 다양한 분야에 영향을 미치고 있다. 본 연구에서는 노인의 인지능력 개선을 위한 디지털 헬스케어 서비스디자인을 적용하기 위하여 텍스트마이닝, 사회연결망 분석 등 비정형 데이터를 분석하여 시사점을 도출하고자 한다. 본 연구의 연구 절차는 서비스디자인 방법론을 비정형 데이터 분석에 적합한 프로세스로 개선하여 6단계로 적용하였다. 소셜미디어에 존재하는 노인인지 개선, 헬스케어를 중심으로 관련 키워드를 수집 및 분석하였고, 이 결과를 바탕으로 노인 인지능력 개선을 위한 헬스케어 서비스디자인의 방향성을 도출하였다. 본 연구의 결과는 빅데이터 분석 방법의 활용 범위 확장 및 기존 헬스케어 서비스 개발 방법론 개선에 도움을 줄 수 있는 학술적, 실무적 시사점을 제공할 것으로 사료된다.

하둡 상에서 ARIA 알고리즘을 이용한 HDFS 데이터 암호화 기법의 설계 및 구현 (Design and Implementation of HDFS data encryption scheme using ARIA algorithms on Hadoop)

  • 송영호;신영성;윤민;장미영;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.613-616
    • /
    • 2015
  • 최근 스마트폰 기기의 보급 및 소셜 서비스 산업의 고도화로 인해, 빅데이터가 등장하였다. 한편 빅데이터에서 효율적으로 정보를 분석하는 대표적인 플랫폼으로 하둡이 존재한다. 하둡은 클러스터 환경에 기반한 우수한 확장성, 장애 복구 기능 및 사용자가 기능을 정의할 수 있는 맵리듀스 프레임워크 등을 지원한다. 아울러 하둡은 개인정보나 위치 데이터 등의 민감한 정보를 보호하기 위해 Kerberos를 통한 사용자 인증 기법을 제공하고, HDFS 압축 코덱을 활용한 AES 코덱 기반 데이터 암호화를 지원하고 있다. 그러나 하둡 기반 소프트웨어를 사용하고 있는 국내 기관 및 기업은 국내 ARIA 데이터 암호화를 적용하지 못하고 있다. 이를 해결하기 위해 본 논문에서는 하둡을 기반으로 ARIA 암호화를 지원하는 HDFS 데이터 암호화 기법을 제안한다.

국내 공공도서관의 트위터 이용에 관한 내용분석 (A Content Analysis on the Domestic Public Libraries' Use of Twitter)

  • 심지영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.241-262
    • /
    • 2017
  • 본 연구에서는 국내 공공도서관의 트위터 이용을 파악하고 분석하고자 한다. 도서관 정보서비스 환경에서 트위터 이용의 구체적인 패턴을 파악하기 위해, 트위터 이용이 활발한 14개 공공도서관 계정으로부터 3,038개의 트윗 데이터를 수집하여 내용분석을 수행하였다. 귀납적 방식으로 코딩 체계를 수립하였으며, 오픈 코딩 방식을 통해 공공도서관 트윗 데이터를 분석하였다. 또한 도서관별로 활성화된 유형을 파악하기 위해 대응일치분석을 수행하였다. 그 결과, 공공도서관 트위터 이용에 관한 상위 범주 3개와 9개의 하위 범주, 37개의 세부 항목을 파악하였다. 본 연구의 내용분석 결과는 향후 트위터 이용을 계획하는 도서관에게 참고자료로 제시될 수 있으리라 본다.

학술 소셜 네트워킹 서비스에서의 학문 분야별 연구자의 셀프 아카이빙 동기 분석 (Self-archiving Motivations across Academic Disciplines on an Academic Social Networking Service)

  • 이종욱;오상희
    • 한국도서관정보학회지
    • /
    • 제51권4호
    • /
    • pp.313-332
    • /
    • 2020
  • 본 연구에서는 학술 소셜 네트워킹 서비스에서의 연구자 셀프 아카이빙 동기를 학문 분야별로 비교하였다. 대표적인 학술 소셜 네트워킹 서비스인 ResearchGate 이용자를 대상으로 선행연구에서는 온라인 설문조사 결과를 실시하여 연구자의 18가지 셀프 아카이빙 동기 요인(흥미, 개인적/직업적 이익, 평판, 학습, 자기효능감, 이타심, 호혜성, 신용, 공동체 이익, 사회 참여, 홍보, 접근성, 문화, 외부적 요인, 신뢰, 시스템 안정성, 저작권 문제, 부가적인 시간 및 노력)을 도출하였다. 후속 연구인 본 연구에서는 Biglan의 학문 분류 기준을 적용하여 연구자의 학문 분야를 구분하고, 이들 분야별 셀프 아카이빙 동기를 비교하였다. 먼저 연구자들의 학문 분야를 경성-순수, 경성-응용, 연성-순수, 연성-응용으로 구분하여 동기를 분석하였으며, 그 다음 단계에서는 경성-연성과 순수-응용으로 구분하여 비교하였다. 나아가 연구자의 인구통계학적 특성과 ResearchGate 이용 현황에 따른 동기의 차이도 살펴보았다. 연구 결과, 학문 분야에 따라 흥미, 접근성, 외부적 요인, 부가적인 시간 및 노력에 대한 동기에 차이가 있는 것으로 밝혀졌다. 예를 들어 경성-순수 분야의 이용자들은 다른 분야의 이용자들에 비해 흥미에 대한 높은 동기를 가지고 있었으며, 연성-순수 분야의 이용자들은 다른 분야 이용자들과 비교하여 개인적/직업적 이익에 대해 높은 동기를 가지고 있었다. 이러한 다양한 학문분야의 연구자들의 동기에 대해 살펴본 연구 결과는 학술 소셜 네트워킹 서비스에서의 연구 데이터와 결과물 공유 활성화를 위한 전략 개발에 도움이 될 것으로 기대한다.

SNS에서의 개선된 소셜 네트워크 분석 방법 (Improved Social Network Analysis Method in SNS)

  • 손종수;조수환;권경락;정인정
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.117-127
    • /
    • 2012
  • 최근 온라인 소셜 네트워크 서비스(SNS)의 사용자가 크게 늘어나고 있으며 다양한 분야에서 SNS의 사용자 관계 구조 및 메시지를 분석하기 위한 연구를 진행하고 있다. 그러나 대부분의 소셜 네트워크 분석 방법들은 노드 사이의 최단 거리를 기초로 하고 있으므로 계산 시간이 오래 걸린다. 이는 점차 대형화 되어가는 SNS의 데이터를 여러 분야에서 활용하는데 걸림돌이 되고 있다. 이에 따라 본 논문에서는 SNS의 사용자 그래프에서 사용자간 최단거리를 빠르게 찾기 위한 휴리스틱 기반의 최단 경로 탐색 방법을 제안한다. 제안하는 방법은 1) 트리로 표현된 소셜 네트워크에서 시작 노드와 목표 노드를 설정한다. 그리고 2) 만약 목표 노드가 경사 트리의 단말에 있다면 경사 트리가 시작하는 노드를 임시 골 노드로 설정한다. 마지막으로 3) 연결의 차수를 평가값으로 하는 휴리스틱 기반 최단거리 탐색을 수행한다. 이렇게 최단거리를 탐색한 후 매개 중심성 분석(Betweenness Centrality) 및 근접 중심성(Closeness Centrality)를 계산한다. 제안하는 방법을 사용하면 소셜 네트워크 분석에서 가장 많은 시간이 필요한 최단거리 탐색을 빠르게 수행할 수 있으므로 소셜 네트워크 분석의 효율성을 기대할 수 있다. 본 논문에서 제안하는 방법을 검증하기 위하여 약 16만 명으로 구성된 SNS에서의 실제 데이터를 이용하여 매개 중심성 분석과 근접 중심성 분석을 수행하였다. 실험 결과, 제안하는 방법은 전통적 방식에 비하여 매개 중심성, 근접 중심성의 계산 시간이 각각 6.8배, 1.8배 더 빠른 결과를 보였다. 본 논문에서 제안한 방법은 소셜 네트워크 분석의 시간을 향상시켜 여러 분야에서 사회 현상 및 동향을 분석하는데 유용하게 활용될 수 있다.

SNS에서의 문장 분석을 통한 친밀도 분별 (Closeness Discrimination through Sentence Analysis in SNS)

  • 고용석;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.219-223
    • /
    • 2012
  • 인간관계 유지와 새로운 관계 형성을 지원하는 다양한 소셜 네트워크가 각광을 받으면서 사용자간 친밀도 분석에 대한 연구가 활발히 진행되고 있다. SNS에서 구성되는 사용자 개인 정보와 컨텐츠 공유 및 기타 활동에 대한 정보는 사용자의 특징을 파악할 수 있는 유용한 정보가 된다. 이러한 정보는 추천과 같은 여러 가지 서비스에서 사용될 수 있으며, 특히 사용자간 친밀도 분석을 통한 친구 추천에서 유용하게 사용된다. 기존 친밀도 분석 연구에서는 사용자간 프로필 유사도와 메시지 교환수 같은 양적 정보를 사용해 왔다. 본 논문에서는 사용자간 대화 내용을 분석한 내용적 정보를 친밀도 분석에 반영하기 위한 방법을 제안한다. 학습 데이터를 활용하여 구축된 친밀도 분별 시스템에서는 감탄사, 종결어미, 선어말어미, 이모티콘, 문장 길이의 내용적 자질 정보의 사용으로 기존 양적 정보 사용과 유사한 수준의 친밀도 분별 성능을 얻을 수 있었으며, 양적 정보와 내용적 정보를 동시 사용한 경우 소폭의 성능 향상을 얻었다.

  • PDF