• 제목/요약/키워드: 소셜 데이터 분석

검색결과 735건 처리시간 0.025초

A Study on Intelligent Skin Image Identification From Social media big data

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.191-203
    • /
    • 2022
  • 화장품 및 뷰티산업에서 고객 맞춤형 제품과 서비스를 제공하는 것은 주요 기술 트렌드이고, 피부상태 진단과 관리는 중요한 필수기능이다. 고객의 요구 수준은 더욱더 높아지고 있으며 이에 대한 다양하고 섬세한 고민과 요구 사항이 소셜미디어 커뮤니티에서 활발하게 다루어지고 있다. 소셜미디어 상의 이미지는 매우 다양하고 비정형적이므로 피부상태 진단 및 관리에 필요한 체계적인 피부 이미지 식별을 위한 시스템이 필요하다. 본 논문에서는 소셜미디어 인스타그램에서 수집한 빅데이터로부터 피부 이미지 데이터를 지능적으로 식별하고, 피부상태 진단 및 관리를 위한 정형화된 피부 샘플 데이터를 추출하는 시스템을 개발하였다. 본 논문에서 제안한 시스템은 빅데이터수집분석단계, 피부이미지분석단계, 훈련데이터준비단계, 인공신경망훈련단계, 피부이미지식별단계로 구성된다. 빅데이터수집분석단계에서는 인스타그램으로부터 빅데이터를 수집하고 피부 상태 진단 및 관리를 위한 이미지 정보를 분석결과로 저장한다. 피부이미지분석단계에서는 전통적인 이미지 처리 기법을 사용하여 피부 이미지의 평가 및 분석 결과를 획득한다. 훈련데이터준비단계에서는 피부이미지 분석결과로부터 피부 샘플데이터를 추출하여 훈련데이터를 준비하였다. 그리고 인공신경망훈련단계에서는 이 훈련데이터를 사용하여 지능적으로 피부 이미지 유형을 예측하는 인공신경망 AnnSampleSkin을 단계별 고도화와 훈련을 통해 모델을 완성하였다. 피부이미지식별단계에서는 소셜미디어로부터 수집된 이미지에 대해 피부샘플을 추출하고, 훈련된 인공신경망 AnnSampleSkin의 이미지 유형 예측 결과들을 통합하여 최종 피부 이미지 유형을 지능적으로 식별한다. 본 논문에서 제안된 피부이미지식별 방법은 약 92% 이상의 높은 피부 이미지 식별 정확도를 나타내고 있고, 정형화된 피부 샘플 이미지 빅데이터를 제공할 수 있게 되었다. 추출된 피부샘플 세트는 피부 상태를 진단하고 관리하는데 매우 효율적이고 유용한 정형화된 피부 이미지 데이터로 사용될 것으로 기대된다.

초연결사회에서 IoT 기반의 라이프로그 데이터를 활용한 사용자 맞춤형 디바이스 지능형 캐릭터 개발 (Development of User-customized Device Intelligent Character using IoT-based Lifelog data in Hyper-Connected Society)

  • 성기훈;김정우;설상훈;강성필;최재붕
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.21-31
    • /
    • 2018
  • 초연결사회에서 IoT 기반의 라이프로그 데이터는 사물인터넷 기술 전반에 활용되며 사용자의 요구사항을 반영한 맞춤형 서비스의 중요 요소로 자리 잡고 있다. 또한 사용자들은 소셜네트워크서비스를 활용하여 관심사 및 감정들을 쉽게 표현하면서 다양한 라이프로그 데이터가 축척되고 있다. 본 논문에서는 IoT 기반의 라이프로그 데이터를 활용한 지능형 캐릭터를 개발하여 사용자들의 감성을 체계적으로 파악하기 위해 정성적/정량적 데이터를 수집 및 분석한다. 이를 위해 사용자가 이용하는 소셜네트워크서비스를 통한 정성적 데이터와 웨어러블 디바이스를 통한 정량적 데이터를 수집한다. 수집한 데이터는 에스노그라피를 통한 페르소나와 비교하여 신뢰성을 검증한다. 추후에는 더 많은 사용자 라이프로그 데이터를 수집하여 데이터의 신뢰성을 확보하고 분석 과정에서 오차를 줄여 개인맞춤형 서비스를 제공할 수 있도록 지능형 캐릭터를 개발할 예정이다.

텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 소비자의 의복 맞음새(Fit)평가에 영향을 미치는 특성 (Using Text Mining and Social Network Analysis to Identify Determinant Characteristics Affecting Consumers' Evaluation of Clothing Fit)

  • 황수현;박주연
    • 감성과학
    • /
    • 제26권1호
    • /
    • pp.101-114
    • /
    • 2023
  • 본 연구의 목적은 텍스트 마이닝과 소셜 네트워크 분석을 활용한 소비자 맞음새 평가의 주요 특징을 규명하는 것이다. 이를 위해 SNS에서 수집된 소비자의 2,000여건의 의복 맞음새 평가 후기로부터 의복 맞음새 관련된 텍스트 데이터를 추출하고 의미연결망 분석과 CONCOR 분석을 수행하였다. 연구 결과, '팬츠'와 '스커트'가 많은 맞음새평가어를 공유하며 다양한 형태로 평가되는 것을 확인하였고 의복의 길이가 가장 많이 평가되었다. 인체부위 중 '허리'는 다양한 의복의 맞음새를 평가하는 가장 중요한 부분이며 의복 맞음새평가어 중 '넓은', '큰', '와이드한', '긴' 등이 가장 많이 사용되는 것으로 나타났다. 본 연구는 소비자 맞음새 평가에 사용된 언어의 구조적 관계와 의미를 구체적으로 규명하고 의복 맞음새의 향상을 위한 실증적 기초 자료를 제공하는데 의의가 있다.

인구절벽사회에서 노인과 일자리 감성분석 (Sentiment Analysis of Elderly and Job in the Demographic Cliff)

  • 김양우
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.110-118
    • /
    • 2020
  • 소셜미디어 데이터는 우리사회의 문제점과 여론의 향방을 알 수 있는 대리지표로서의 역할을 하고 있다. 이 연구는 2016년부터 2018년 까지 뉴스데이터 109,015건 건의 자료를 활용하여 우리사회 노인과 일자리 감성분석을 실시함으로써, 고령사회와 인구절벽에 직면한 한국 사회에서, 가용노동력 확대 가능성을 알아보았다. 노인 일자리 토픽키워드로 '노인*일자리', '노인*고용', '노인*임금' 등을 사용하였다. 감성분석결과, 대부분의 기간에서는 긍정적 감성이 우세하여 생산연령인구 확충가능성을 알 수 있었다. 노인 일자리확대관련 긍정 감성과 저임금관련 부정감성으로, 일은 하지만 여전히 빈곤한 노인의 실태가 나타났다. 본 연구에서는 소셜 빅데이터를 활용하여 계층적 군집분석과 연관 텍스트분석으로 노인과 일자리 관련 우리사회의 인식과 감성을 분석하였다.

하둡을 이용한 소셜네트워킹의 TV광고효과 분석 시스템 설계 (A Design of Analysis System on TV Advertising Effect of Social Networking Using Hadoop)

  • 허서연;김윤희
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.49-57
    • /
    • 2013
  • 빅데이터가 화두가 되면서, 그 대표적인 예인 SNS을 이용한 서비스 개발도 활기를 띠고 있다. SNS는 기존 매체와는 다르게 실시간으로 의견을주고받는 하나의 장으로 확장되었고, 다양하고 많은 개인들의 의견을 분석하고자 하는 서비스들도 늘어나고 있다. 한편, 매체가 다양화되면서, TV광고계에서도 광고에 대한 의견의 확보와 분석에 새로운 접근방법이 필요해졌다. 이에 본 연구에서는 TV광고의 효과를 트위터 데이터를 기반으로 분석하며 특히 하둡을 이용하여 트위터 데이터와 같은 빅데이터를 저장 및 분석하도록 하는 LiveAD라는 시스템을 설계 및 구축하여, 트위터를 대상으로 TV광고 분석을 빠르게 수행할 수 있음을 보여주었다.

소셜데이터 분석 및 인공지능 알고리즘 기반 범죄 수사 기법 연구 (Artificial Intelligence Algorithms, Model-Based Social Data Collection and Content Exploration)

  • 안동욱;임춘성
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.23-34
    • /
    • 2019
  • 최근 디지털 플랫폼을 활용한 민생 위협 범죄는 '15년 약 14만여 건, '16년 약 15만여 건 등 사이버범죄 지속 증가 추이이며 전통적인 수사기법을 통한 온라인 범죄 대응에 한계가 있다고 판단되고 있다. 현행 수기 온라인 검색 및 인지 수사 방식만으로는 빠르게 변화하는 민생 위협 범죄에 능동적으로 대처 할 수 없으며, 소셜 미디어 특성상 불특정 다수에게 게시되는 콘텐츠로 이루어 졌다는 점에서 더욱 어려움을 겪고 있다. 본 연구는 민생 침해 범죄가 발생하는 온라인 미디어의 특성을 고려한 콘텐츠 웹 수집 방식 중 사이트 중심의 수집과 Open API를 통한 방식을 제시한다. 또한 불법콘텐츠의 특성상 신속히 게시되고 삭제되며 신조어, 변조어 등이 다양하고 빠르게 생성되기 때문에 수작업 등록을 통한 사전 기반 형태소 분석으로는 빠른 인지가 어려운 상황이다. 이를 해소 하고자 온라인에서 벌어지는 민생 침해 범죄를 게시하는 불법 콘텐츠를 빠르게 인지하고 대응하기 위한 데이터 전처리인 WPM(Word Piece Model)을 통하여 기존의 사전 기반의 형태소 분석에서 토크나이징 방식을 제시한다. 데이터의 분석은 불법 콘텐츠의 수사를 위한 지도학습 기반의 분류 알고리즘 모델을 활용, 투표 기반(Voting) 앙상블 메소드를 통하여 최적의 정확도를 검증하고 있다. 본 연구에서는 민생경제를 침해하는 범죄를 사전에 인지하기 위하여 불법 다단계에 대한 사례를 중심으로 분류 알고리즘 모델을 활용하고, 소셜 데이터의 수집과 콘텐츠 수사에 대하여 효과적으로 대응하기 위한 실증 연구를 제시하고 있다.

  • PDF

트위터 특징에 기반한 콘텐츠 중요성 평가 기법 (An Evaluation Method for Contents Importance Based on Twitter Characteristics)

  • 이의종;김정동;백두권
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1136-1144
    • /
    • 2014
  • 트위터는 하루 약 1억 4000만개의 콘텐츠를 생성하는 소셜 네트워크 서비스로 다양한 데이터를 포함하고 있으며 이를 분석하기 위한 연구가 다방면에서 진행 중에 있다. 본 연구는 트위터의 콘텐츠 검색 분야에서 유용하게 사용될 수 있는 콘텐츠 중요성을 평가하기 위한 연구이다. 트위터 콘텐츠의 중요성이란 단일 콘텐츠가 트위터 서비스 사용자들에게 사실관계가 명확한 정보를 전달하고 있는지를 평가하는 요소를 말한다. 본 논문은 트위터 콘텐츠의 중요성 평가를 위해 콘텐츠 작성자의 청자 수인 팔로워와 콘텐츠의 인기도라고 할 수 있는 리트윗을 사용했다. 더불어 실제 트위터 데이터를 사용해 제안한 방법이 효과적으로 콘텐츠의 영향력을 측정할 수 있음을 보였다. 또한 정보를 전달하는 정보 전달자의 분류를 통해 공공성을 띈 사용자의 분류가 작성한 콘텐츠가 트위터 영향력 측정에 유용하게 사용될 수 있음을 트위터 데이터 분석을 통해 보여주었다.

텍스트 마이닝을 활용한 매스 미디어와 소셜 미디어 의제 분석 : '마스크 5부제'를 중심으로 (Mass Media and Social Media Agenda Analysis Using Text Mining : focused on '5-day Rotation Mask Distribution System')

  • 이새미;유승의;안순재
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.460-469
    • /
    • 2020
  • 본 연구는 코로나19 사태로 인하여 최근 이슈로 떠오르는 '마스크 5부제'에 대한 온라인 뉴스 기사와 카페글을 분석하여 언론과 대중들의 반응을 담고 있는 매스 미디어와 소셜 미디어 의제를 파악하고, 그 차이점을 알아보았다. 분석을 위해 네이버 뉴스 기사 전문 2,096건과 카페글 1,840건을 수집하고 데이터 전처리 과정과 정제과정을 거쳐 단어 빈도분석, 워드 클라우드, LDA 토픽모델링 분석을 실시하였다. 분석 결과, 매스 미디어에 비해 소셜 미디어는 '대리 구매', '개학 연기', '마스크 사용', '마스크 구입'과 같이 실생활 관련 토픽이 나타나 개인 미디어의 특성이 반영되어 정보 전달의 기능 보다는 개인의 의견, 감정, 정보를 교류하는 역할을 하는 것으로 나타났다. 본 연구에 적용된 연구방법의 적용으로 다양한 미디어 분석을 통해 사회이슈가 공중의제화되고, 정부의제로 진화하는 정책의제설정 과정에서 참고자료로 활용될 수 있을 것이다.

대용량 분석 시스템을 이용한 교통 연구 검색 방법론에 관한 연구 (A Study on Traffic Research Retrieval Method using Large Capacity Analysis System)

  • 배진아;윤청
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.577-580
    • /
    • 2018
  • 지난 몇 년간 우리는 소셜 검색에 몰두하여 연관검색 및 소비자의 만족을 위해 빅데이터 분석을 하였다. 최근에는 빅데이터 분석이라는 흐름에 맞춰 기업 및 기관별 본연의 정보를 통합하여 효율적인 검색을 할 수 있도록 하는 솔루션을 대거 도입하고 있다. 또한 기업 및 기관에서 가지고 있는 정보는 기존 비정형 데이터로 방대하여 기존의 방법이나 도구로 수집 및 저장 분석이 어려운 실정이다. 이에 공공기관 및 민간기업 등에서는 키워드 중심의 다양한 검색엔진을 개발하거나 도입하고 있으며, 정보 분류의 확대, 메타데이터의 활용, 태그정보의 제공, 개인 맞춤형 서비스 등 고객의 만족도를 제고하기 위한 다양한 방법을 시도하고 있다. 본 연구에서는 기관의 교통 연구와 관련한 일련의 작업 중 행정문서, 연구정보, 유관기관 게시물 등의 통합 빅데이터를 가지고 검색시스템을 구현하였다. 이와 더불어 사용자 사전 및 동의어 사전을 통한 검색 키워드를 데이터베이스에 저장하여 검색 효율성을 제고하는 방안을 제시한다.

IPTV 콘텐츠 메타데이터 기술 표준 비교 분석 연구 (Comparative Analysis of IPTV Contents Metadata in Technical Standards)

  • 김경록;홍인화;김찬규;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.276-277
    • /
    • 2010
  • Web2.0의 고도화와 소셜미디어의 진화에 따라 웹 기반 콘텐츠에 대한 다양한 활용이 시도되고 있다. 또한, IPTV 부분에서는 기존의 TV기반에서 Web기반, Mobile기반 서비스로 확산되고 있다. 이러한 멀티디바이스 환경과 웹기반 콘텐츠의 IPTV 활용 서비스를 위해서는 콘텐츠에 대한 정의와 이를 표현하기 위한 메타데이터에 대한 정의가 필요하다. 이를 위해서 관련 표준화 단체를 분석한 후 이들이 제공하는 콘텐츠 메타데이터의 연관관계를 비교 분석하였다. IPTV 서비스를 위한 콘텐츠 메타데이터는 TV AnyTime Phase1 을 바탕으로 각 표준기구의 네트워크 상황과 서비스 방식에 따라 선택적으로 적용하고 있으며, VOD 서비스를 위해서는 CableLab의 ADI 메타데이터를 적용하고 있다. 향후 멀티디바이스 환경에서 IPTV 서비스를 위해서는 메타데이터에 대한 확장 연구가 필요하다.

  • PDF