• 제목/요약/키워드: 소셜 데이터 분석

검색결과 737건 처리시간 0.027초

CNN 딥러닝을 활용한 경관 이미지 분석 방법 평가 - 힐링장소를 대상으로 - (Assessment of Visual Landscape Image Analysis Method Using CNN Deep Learning - Focused on Healing Place -)

  • 성정한;이경진
    • 한국조경학회지
    • /
    • 제51권3호
    • /
    • pp.166-178
    • /
    • 2023
  • 본 연구는 이용자들의 인식과 경험이 내재된 소셜미디어 사진에서 경관 이미지를 분석하기 위한 방법으로 CNN 딥러닝 방법을 소개하고 평가하는 데 그 목적이 있다. 본 연구에서는 힐링장소를 연구의 대상으로 설정하여 경관 이미지를 분석하였다. 연구를 위해 텍스트마이닝과 선행연구 고찰을 통해 힐링과 관련되는 7가지의 경관 형용사를 선정하였다. 이후 CNN 딥러닝 학습 사진 구축을 위해 50명의 평가자를 모집하였으며, 평가자들에게 포털사이트에서 '힐링', '힐링풍경', '힐링장소'로 검색되는 사진 중 7가지 형용사마다 가장 적합한 사진을 3장씩 수집하도록 하였다. 수집된 사진을 정제 및 데이터 증강 과정을 거쳐 CNN 모델을 제작하였다. 이후 힐링장소 경관 분석을 위해 포털사이트에서 '힐링'과 '힐링풍경'으로 검색되는 15,097장의 사진을 수집하여 이를 분류하였다. 연구결과 '기타'와 '실내'를 제외한 범주에서 '조용한'이 2,093장(22%)으로 가장 높게 나타났으며, '개방적인', '즐거운', '안락한', '깨끗한', '자연적인', '아름다운' 순으로 나타났다. CNN 딥러닝은 경관 이미지 분석에서도 결과를 도출 가능한 분석 방법임을 연구를 통해 알 수 있었다. 또한, 기존 경관 분석 방법을 보완할 수 있는 하나의 방법임을 시사하였고, 경관 이미지 학습 데이터 셋 구축을 통한 향후 심층적이고 다양한 경관 분석을 제안한다.

지식서비스를 위한 개인경험지식 분석 평가 모델 연구 (A Study on Personal Experience Knowledge Evaluation Model for Knowledge Service)

  • 김유두;주인학;박윤경;문일영;권오영
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1865-1872
    • /
    • 2013
  • 스마트 디바이스의 급격한 증가와 함께 사용자의 SNS(Social Network Service) 이용률도 급격하게 증가하게 되었다. 이로 인해 사용자들의 웹에 대한 접근성도 증가하면서, 데이터의 양도 기하급수적으로 증가하는 결과를 초래하였다. 이런 엄청난 양의 빅 데이터를 통해 획일적인 검색을 통한 정보 제공이 아닌, 사용자 맞춤형 지식 제공을 위한 연구의 필요성이 높아지고 있다. 이러한 지식 서비스를 제공하기 위해서는 사용자에 의해 수집된 데이터를 분석하고 평가하는 모델이 필요하다. 이에 본 논문에서는 스마트폰을 활용하여 40명의 데이터를 수집하여 이동정보와 장소를 추측 하고, 정답 셋을 구성하여 데이터의 평가를 할 수 있는 모델에 대한 연구를 수행 하였다.

빅데이터 마이닝에 의한 공시지가 민원의 시공간적 분석모델 제시 (A Suggestion for Spatiotemporal Analysis Model of Complaints on Officially Assessed Land Price by Big Data Mining)

  • 조태인;최병길;나영우;문영섭;김세훈
    • 지적과 국토정보
    • /
    • 제48권2호
    • /
    • pp.79-98
    • /
    • 2018
  • 이 연구는 빅데이터 마이닝에 기초하여 공시지가 민원에 대한 시공간적 특성을 분석하는 모델을 제시하는 데 목적이 있다. 특히 이 연구는 행정 민원이 제기되는 원인을 학술적 요인보다는 시공간적 측면에서 찾았고, 그러한 민원 발생의 경향을 시공간적으로 모니터링하는 모델을 제시하였다. 2006년부터 2015년까지 인천광역시 중구의 공시지가에 대한 6,481개의 민원정보가 시간 및 공간적 특성을 고려해 수집되었고 분석을 위해 사용되었다. 텍스트 마이닝 기법을 이용해 주요 키워드의 빈도수를 도출했으며, 소셜 네트워크 분석을 통해 주요 키워드 간의 관계를 분석하였다. 키워드의 가중치와 연관되는 TF(term frequency)와 TF-IDF(term frequency-inverse document frequency)를 산출함으로써, 공시지가의 민원 발생에 대한 주요 키워드를 식별하였다. 마지막으로 Getis-Ord의 $Gi^*$의 통계량에 기초한 핫스팟 분석을 통해 공시지가 민원의 시공간적 특성을 분석하였다. 연구 결과, 공시지가 민원의 특성은 시공간적으로 연계된 군집 형태를 형성하면서 변화하고 있음을 알 수 있었다. 텍스트 마이닝과 소셜 네트워크 분석 방법을 이용하여 자연어 기반의 공시지가 민원에 대한 발생 원인을 정량적으로 규명할 수 있음을 알 수 있었으며, 키워드 가중치인 단어 빈도(TF) 및 단어 빈도와 역문서 빈도의 조합값(TF-IDF)의 상대적인 차이가 있어 시공간적인 민원 특성을 분석하기 위한 주요 설명변수로 활용될 수 있음을 알 수 있었다.

R의 Shiny를 이용한 시각화 분석 활용 사례 (Visualization analysis using R Shiny)

  • 나종화;황은지
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1279-1290
    • /
    • 2017
  • R의 {shiny} 패키지는 R 스크립트만으로 웹 어플리케이션을 제작할 수 있는 환경을 제공한다. Shiny는 별도의 웹 프로그래밍 언어에 대한 지식을 요구하지 않으며 그 개발이 매우 쉽고 간명하다. 또한 Shiny는 다양한 확장성을 가지고 있으며, 그 기능이 날로 확대되고 있다. 따라서 완성도 높은 결과물의 제시가 절실한 R 기반의 분석전문가들에게는 더 없이 훌륭한 도구이다. 본 논문에서는 Shiny를 활용하여 대용량 데이터를 분석한 실제 사례를 소개한다. 먼저, 공간 자료와 관계된 분석으로 등고선 등의 형태로 표현되는 지형자료를 분석하여 지질 이상대를 추출한다. 다음으로, 기상, 환경, 소셜미디어 정보를 이용하여 전국의 16개 시, 도별 주요 질환을 예측하는 모형을 구축한다. 이 과정에서 Shiny가 데이터의 시각화와 분석에 매우 효과적임을 보이고자 한다.

딥러닝 기반 소셜미디어 한글 텍스트 우울 경향 분석 (A Deep Learning-based Depression Trend Analysis of Korean on Social Media)

  • 박서정;이수빈;김우정;송민
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.91-117
    • /
    • 2022
  • 국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.

재난취약계층의 위험이슈분석 -어린이, 임산부 사례를 중심으로- (Risk Issue Analysis of Disaster Vulnerable Groups -Focusing on Cases of Children and Pregnant Women)

  • 김신혜;권설아
    • 한국콘텐츠학회논문지
    • /
    • 제21권7호
    • /
    • pp.291-303
    • /
    • 2021
  • 현대사회에서 노인, 장애인, 외국인, 어린이 등 재난취약계층의 수가 빠르게 증가하고 있다. 이러한 재난에 취약한 계층의 일반적인 특성은 경제적 어려움으로 인하여 주거형태가 재난에 취약하고, 재난에 노출되면 회복력이 더디다는 것이다. 본 연구는 재난취약계층에 대한 대상자 위험이슈분석을 통해 새롭게 도출되는 위험이슈를 파악하고, 정책개발의 기초자료를 제공하는 데 그 목적이 있다. 연구방법은 재난취약계층 중에서 어린이와 임산부의 사례를 중심으로 최근 10년간('10-19) 소셜미디어의 이슈 데이터를 중심으로 소셜네트워크 분석을 수행하였고, 연구결과 첫째, 이슈의 추이를 살펴보면 특정 사건의 발생과 연관성을 갖는다. 둘째, 위기관리의 유형, 대상, 관리방식에 대한 인식이 분석되었다. 셋째, 위험이슈의 해결방안이나 대상의 특성을 반영한 감정어가 분석되었고, 부정적인 감성을 유발하는 단어도 분석되었다. 따라서 본 기초데이터를 바탕으로 정부와 지자체는 국민의 정서분석과 대중의 인식을 토대로 급변하는 재난환경의 효율적인 위기관리체계를 구축하기를 바란다.

소셜네트워크서비스에 활용할 비표준어 한글 처리 방법 연구 (Research on Methods for Processing Nonstandard Korean Words on Social Network Services)

  • 이종화;레환수;이현규
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.35-46
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 관계망을 구축해주는 온라인 서비스인 소셜네트워크서비스(SNS), 자신의 관심사에 따라 자유롭게 글, 사진, 동영상 등을 올릴 수 있는 공간인 블로그(Blog) 등은 자신을 알리고 표현하는 사회현상으로 자리 매김하고 있다. 이러한 SNS나 블로그를 통해 사용자들이 자유롭게 표현한 글들을 분석하여 의미있는 정보와 가치, 그리고 패턴을 찾기 위한 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 의미 분석(Semantic Analysis) 등의 연구가 활발히 이루어지고 있다. 또한, 연구자들의 연구 효율을 보다 높이기 위하여 키워드 기반 연구들도 이루어져있다. 하지만 대부분의 연구들은 한글의 맞춤법에 많은 한계점을 나타내고 있다. 본 연구는 어근을 찾기 힘든 이상한 외계 언어, 무분별하게 표현되는 속어, 알기 힘든 한글 이모티콘 인터넷 언어, 마이닝 처리 과정에서 파악하기 어려운 단어들을 데이터베이스에 구축하여 데이터 사전 기반 마이닝 처리 기법의 한계를 극복하고자 한다. 특정 주제에 대한 주관적 견해로 구성된 블로그를 사례 분석 대상으로 연구를 진행하였으며 유니코드를 활용한 비표준어 추출은 텍스트 마이닝 처리에 유용함을 발견할 수 있었다.

유튜브 인플루언서 마케팅: 사회적 거리, 지각된 진정성 및 광고태도의 관계에서 제품-인플루언서 일치성의 역할 (Influencer Marketing: The Role of Product-Influencer Congruence between Social Distance, Perceived Authenticity and Attitude toward Ads)

  • 최건;양병화
    • 미래기술융합논문지
    • /
    • 제1권2호
    • /
    • pp.27-35
    • /
    • 2022
  • 본 연구는 소셜미디어 인플루언서 마케팅의 효과성을 알아보기 위한 것으로 유튜브 인플루언서에 대한 지각된 사회적 거리, 진정성 및 광고태도의 관계를 분석하였다. 지각된 진정성은 인플루언서의 활동에 중요한 요소로서 협찬광고의 노출에 따른 소비자의 태도에 영향을 줄 것이며, 특히 지각된 진정성의 효과는 제품과 인플루언서 활동 간의 일치성에 의해 조건부 간접효과를 보일 것으로 가정되었다. 이를 알아보기 위해, 364명의 대학생을 대상으로 설문조사를 실시하였고 무응답 및 불성실 응답을 제외하고 340명의 데이터를 타당하게 분석하였다. 분석 결과, 인플루언서와의 사회적 거리는 지각된 진정성과 광고태도에 긍정적 영향을 주었고, 지각된 진정성은 광고태도에 직접 영향을 주는 것으로 나타났다. 특히 지각된 진정성은 사회적 거리와 광고태도의 관계성을 부분매개하는 효과를 보였고, 이러한 매개효과는 낮은 수준의 제품-인플루언서 일치성에서 나타나는 반면 높은 수준의 일치성에서는 발견되지 않았다. 이러한 결과에 기초하여, 인플루언서 마케팅에 대한 전략적 시사점을 논의하였다.

공간지능화서비스 구현을 위한 공공데이터 분석 (An Analysis of the Public Data for Making the Ambient Intelligent Service)

  • 김미연;서동조
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.313-321
    • /
    • 2014
  • 현대 사회는 엄청난 양의 데이터를 만들어내는 디지털 시대에 접어들었고, 다변화되는 도시에서는 정보의 생성, 수집, 표현을 특징으로 하는 스마트 공간이 등장하고 있다. 2012년 이후 스마트기기의 확산과 초연결사회로 불리우는 소셜미디어 환경에서 공공데이터에 대한 관심이 더욱 고조되고, 보편화된 모바일 기기 사용 및 SNS 이용 확산에 따라 빅 데이터에 대한 이슈에 주목하고 있다. 초기에는 데이터의 플랫폼 구성에 연구개발이 집중되었으나 최근에는 공간지능화 서비스 구현을 위한 데이터의 분석과 활용방안에 대한 여러 분야의 아이디어가 제안되고 있다. 본 연구에서는 이러한 공공데이터의 활용성 측면에서 전문가보다는 일반인의 사용성 증대를 위한 시각화 과정에 집중하고자 기존의 공공데이터포털에서 제공하는 공개데이터 및 공공데이터 서비스 현황을 파악하여 그 활용가능성을 고찰하고자 한다. 연구의 결과로 일반 시민들에게 있어서 데이터의 분석 및 응용은 현재 종이문서의 이용을 감소시키고, 지능형 공간에서 공공정보서비스에 대한 개개인의 요구 및 행동에 맞추어 빠르고 신속한 대응할 수 있는 어플리케이션 개발에 도움이 될 것으로 기대한다.

오피니언 마이닝을 위한 VOC 데이타의 신뢰성 분석 (Reliability Analysis of VOC Data for Opinion Mining)

  • 김동원;유성진
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.217-245
    • /
    • 2016
  • 이 연구의 목적은 소셜 미디어에서 추출된 7개의 감성 도메인이 기업의 성과에 대한 영향 분석실험을 위한 데이터로서 적합한 지에 대해 신뢰성을 확인하고, 실제 고객감성이 자동차 시장점유율에 어떠한 영향을 미치는 지에 대하여 확인하기 위한 것이다. 본 연구는 총 3단계 구성으로서, 단계 1은 감성사전 구축 단계로서 미국 내 26개의 자동차 제조 회사의 고객의 소리 (VOC: Voice of Customer) 총 45,447개를 자동차 커뮤니티로부터 crawling하여 POS 정보 추출 후 감성사전을 구축하였고, 7개의 감성도메인을 만들었다. 단계 2는 신뢰성분석의 단계로서 자기상관관계분석과 주성분 분석 (PCA)을 통해 데이터의 실험 적합성을 검증하였다. 단계 3에서는 PCA를 근거로 2개의 선형회귀분석 모델을 구축하였고 GM, FCA, VOLKSWAGEN 등 3개의 기업을 선정, 2013년부터 2015년까지 7개 감성영역의 자동차 시장점유율에 대한 영향을 실험하였다. 실험 결과, 자기상관관계분석에 의해서 감성 데이터에 자기상관성과 시계열적 패턴이 관찰되었다. PCA 결과, 감성영역이 부정성, 긍정성, 중립성을 주성분으로 연결되어 있음이 확인되었다. VOC 감성 데이터에 대한 신뢰성을 바탕으로 한 2개 Model의 선형회귀분석 결과, 기업마다 시장점유율에 유의미한 영향을 미치는 감성들이 존재하며 Model 1과, 2의 감성영향력이 차이가 있고 중립성의 영향을 발견하였다. 본 연구를 통해, 데이터 상에 나타난 정보를 가진 감성이 과거 값에 기초하여 자동차 시장에서 변화를 수반할 수 있다는 것을 나타내고 있음을 확인하였다. 또한, 우리가 시장 데이터의 가용성을 적용하려고 할 때, 자동차 시장 관련 정보나 감성의 자기상관성을 잘 활용할 수 있다면, 감정 분석에 대한 연구에 큰 기여를 할 수 있을 뿐만 아니라, 실제 시장에서의 비지니스 성과에도 다양한 방법으로 기여할 수 있을 것으로 기대된다.