• 제목/요약/키워드: 소셜 미디어 데이터 수집 및 분석

검색결과 81건 처리시간 0.026초

재난안전 용어사전 구축을 위한 미디어별 어휘 사용 양상 비교 (Comparing the Usages of Vocabulary by Medias for Disaster Safety Terminology Construction)

  • 이정은;김태영;오효정
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권6호
    • /
    • pp.229-238
    • /
    • 2018
  • 재난사건의 신속한 대응은 다양한 분야의 재난안전 유관기관들이 유기적으로 관계함으로써 가능하며, 이 때 사용되는 재난용어의 표준화는 필수적이다. 따라서 재난안전 분야의 전문 용어사전 구축은 각 유관기관 간의 의사소통 및 국민에게 명확한 정보 전달을 위해 수반되는 핵심 요소이다. 더불어 효율적인 용어사전 구축을 위해서는 구축 대상 용어의 우선순위 선정이 필요하다. 본 연구에서는 구체적인 용어사전 구축방향의 설정을 위하여 용어 사용 주체로 대표되는 미디어를 각각 용어사전, 뉴스미디어, 소셜미디어로 선정하고 어휘의 사용 양상을 비교하였다. 이를 위해 각 미디어에서 수집된 어휘 자원을 바탕으로 미디어별 동시 출현 양상 및 빈도 가중치 분석을 통하여 어휘의 분포를 시각화하였다. 분석 결과를 통해 어휘의 사용 양상에 따라 용어사전의 구축대상이 될 수 있는 어휘의 유형을 4가지로 분류하고, 구축대상 기준별 용어사전 구축의 우선순위 방향성을 제안하였다.

팬데믹에 따른 소비자의 피부 관련 관심 영역 변화 분석: 구조적 토픽모델링을 중심으로 (Analyzing Changes in Consumers' Interest Areas Related to Skin under the Pandemic: Focusing on Structural Topic Modeling)

  • 김나경;박지원;문형빈
    • 지식경영연구
    • /
    • 제25권1호
    • /
    • pp.173-192
    • /
    • 2024
  • 최근 뷰티 산업은 급격한 성장과 혁신으로 빠르게 발전하였으며, 코로나19 팬데믹으로 인한 마스크 착용 및 비대면 생활의 증가와 같은 생활 양식 변화에 따라 새로운 전환을 겪고 있다. 본 연구는 온라인상에 나타난 소비자의 피부에 대한 의견을 분석하여 코로나19 팬데믹 이후 뷰티 산업의 변화를 수요 측면에서 이해하고자 하였다. 이를 위해 2017년부터 2022년까지 소셜 미디어에 게재된 게시글 중 '피부 고민'을 포함한 96,908개의 게시글을 수집하고 이를 구조적 토픽모델에 적용하여 피부 관련 주제를 도출하였다. 분석 결과, 소비자가 고민하고 있는 피부 관련 주제는 총 22개로 구분될 수 있음을 확인하였으며, 이들 주제는 크게 뷰티 제조업, 뷰티 서비스업·연관산업, 피부고민, 기타 등 4가지 유형으로 구분될 수 있었다. 또한 본 연구는 분석 기간을 코로나19 팬데믹의 확산 양상을 기준으로 7개 단계로 나누고 각 토픽의 비중이 어떻게 변화하는지를 상승, 하강, 일정, 진동으로 구분하여 보았다. 코로나19 팬데믹 전과 후 시점에 대하여 주제별 비중의 변화 양상을 분석한 결과, 피부 고민 중 피부 트러블(여드름)과 이와 관련된 제품(스팟패치)은 상승 분야로, 뷰티 연관산업 중 성형외과와 한의원은 하강 분야로, 뷰티 제조업 중 수분 마스크팩, 메이크업 제품은 큰 변화가 없는 일정 분야로 나타났다. 또한 코로나 발생기간 내에서 팬데믹이 최고조에 달한 시기에는 바디케어 제품과 관련된 토픽이 급증하는 것을 확인할 수 있었다. 본 연구의 결과는 뷰티 산업의 수요 변화에 대응하여 기업이 제품 개발, 마케팅 전략을 수립하는 데에 활용될 수 있으며, 팬데믹 발생 시 정부가 경제적 지원 정책을 수립하는 경우 정책 추진의 근거로서도 활용될 수 있을 것으로 기대된다.

노인 인지능력 개선을 위한 헬스케어 서비스디자인 연구: 비정형 데이터 분석을 중심으로 (A Study on Health Care Service Design for the Improvement of Cognitive Abilities of the Senior Citizens: Focusing on Unstructured Data Analysis)

  • 김성호;김협
    • 지식경영연구
    • /
    • 제23권4호
    • /
    • pp.69-89
    • /
    • 2022
  • 초고령사회로 접어들면서 노인의 건강 문제는 의료분야를 포함해 경제, 사회, 문화 등 다양한 분야에 영향을 미치고 있다. 본 연구에서는 노인의 인지능력 개선을 위한 디지털 헬스케어 서비스디자인을 적용하기 위하여 텍스트마이닝, 사회연결망 분석 등 비정형 데이터를 분석하여 시사점을 도출하고자 한다. 본 연구의 연구 절차는 서비스디자인 방법론을 비정형 데이터 분석에 적합한 프로세스로 개선하여 6단계로 적용하였다. 소셜미디어에 존재하는 노인인지 개선, 헬스케어를 중심으로 관련 키워드를 수집 및 분석하였고, 이 결과를 바탕으로 노인 인지능력 개선을 위한 헬스케어 서비스디자인의 방향성을 도출하였다. 본 연구의 결과는 빅데이터 분석 방법의 활용 범위 확장 및 기존 헬스케어 서비스 개발 방법론 개선에 도움을 줄 수 있는 학술적, 실무적 시사점을 제공할 것으로 사료된다.

기업의 개인정보 보호에 대한 사용자 인식 연구: 다차원 접근법(Analytic Hierarch Process)을 활용한 정보보안 속성 평가 및 업종별 비교 (User Perception of Personal Information Security: An Analytic Hierarch Process (AHP) Approach and Cross-Industry Analysis)

  • 박종화;한승민;정윤혁
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.233-248
    • /
    • 2023
  • 최근 지능정보기술의 활용이 확산되면서 개인정보 침해에 대한 위험이 더욱 증가하고 있다. 특히, 기업이 디지털 환경에서 개인정보의 수집과 활용에 중점을 두면서, 기업의 고객정보 보호에 대한 사회적 관심이 증가하고 있다. 비록 인터넷 사용자들의 개인정보 보호에 대한 인식은 광범위하게 연구되어 왔으나, 특정 업종의 문맥, 더 나아가 업종별 개인정보 보호에 대한 비교 연구는 아직 부족한 실정이다. 본 연구는 기업의 개인정보 보안 특성에 대한 사용자 인식을 바탕으로, 업종별 개인정보 보호 수준을 비교 분석하고자 한다. 이를 위해 인터넷 사용자 498명을 대상으로 국내 포털사이트, 해외 포털사이트, 소셜미디어, 온라인 쇼핑몰, 은행, 정부기관, 온라인 사행성 게임 등 다양한 업종에 대한 개인정보 보안 특성에 대한 분석을 실시하였다. 설문을 통해 수집된 데이터를 분석적 계층과정(Analytic Hierarch Process, AHP)을 이용하여 각 보안 특성의 상대적 중요도를 도출하였다. 연구결과, 사용자들은 기업의 개인정보 보호를 평가할 때 기술적 보안과 투명성을 가장 중요한 요소로 간주하였다. 기술적 보안면에서는 은행과 국내 포털사이트가, 투명성 면에서는 은행과 정부기관이 우수한 성과를 보였다. 반면, 소셜미디어는 기술적 보안과 투명성 모두에서 가장 부진한 성과를 보였다. 본 연구는 개인정보 보안에 대한 다차원적 접근법을 제시하고, 사용자 관점에서 각 보안 특성에 대한 업종별 차이를 조명함으로써 연구적 의의를 가진다.

정형 및 비정형 빅데이터를 이용한 양파 소비 예측 (Prediction of Onion Purchase Using Structured and Unstructured Big Data)

  • 나형철;오은화;유도일;조완섭;아지즈 나스리디노프;박성호;조용빈;류관희
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.30-37
    • /
    • 2018
  • 인터넷 시대를 살아가는 현대인의 식품 소비는 다양한 대충 매체 및 소셜 미디어를 통해 신속하고 방대한 정보 전달에 영향을 받는 것으로 알려져 있다. 2018년 4월 국내 언론 보도에 따르면, 양파 재배 면적이 증가하고 양파 생산량이 증가할 것으로 예상되며, 이후에 양파 가격은 폭락할 것으로 예상되었다. 이러한 상황을 고려하여 SNS, 인터넷 정보 검색, 방송 프로그램에서 언급된 양파 관련 정보를 분석하여, 실제 가격폭락이 발생하기 전에, 양파 소비를 촉진할 수 있는 요인을 파악할 필요가 있다. 2018년 양파 생산량 증가에 따른 양파 가격 폭락이 예상되는 상황에, 가장 최근 양파 생산량 증가에 따라 가격 폭락을 경험하였던 2014년의 방송 프로그램 및 SNS가 양파 소비와 연계되었는지 파악하고자, 양파 소비 촉진과 관련된 정형 및 비정형 빅데이터를 수집하여, 양파 소비 촉진과 관련된 변수를 찾아 양파 가격 하락이 예상되는 2018년에 소비 촉진에 활용하고자 본 연구를 수행하였다. 연구 결과, 방송 뉴스의 양파 언급 기사 수(3~6주), 양파와 건강을 언급하는 방송 프로그램 수(11주), 양파의 효능을 언급하는 블로그의 댓글 빈도(5주)가 양파 구매금액 증가에 시차를 두고 양의 상관관계를 갖는 것을 확인한 본 연구 결과를 근거로, 양파 생산량 증가에 따른 양파 가격 폭락 시, 양파 소비 촉진을 위한 홍보에, 뉴스, 먹방, 쿡방 등의 방송 프로그램 및 블로그 등의 매체를 활용하는 소비촉진에 기여할 것으로 여겨진다.

빅데이터와 AI를 활용한 교육용 자료의 분석에 대한 조사 (A Survey on Deep Learning-based Analysis for Education Data)

  • 노영욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.240-243
    • /
    • 2021
  • 최근에 빅 데이터와 AI 기술을 교육의 평가와 개별 학습에 적용하는 연구 성과가 있었다. 정보 기술의 혁신으로 소셜 미디어, MOOC, 지능형 개인지도 시스템, LMS, 센서 및 모바일 장치 등으로부터 학생들의 개인 기록, 생리학적 데이터, 학습 로그 및 활동, 학습 성과 및 결과를 포함하는 동적이고 복잡한 데이터를 수집 가능하였다. 또한 COVID-19 환경에서 e-러닝이 활성화 되어 많은 양의 학습 데이터가 생성되었다. 이 데이터로부터 학습 분석과 AI 기술을 적용하여 의미있는 패턴의 추출과 지식의 발견이 될 것으로 예상된다. 학습자 측면에서 학생의 학습 및 정서적 행동 패턴과 프로필을 식별하고, 평가 및 평가 방법을 개선하고, 개별 학생의 학습 성과 또는 중퇴를 예측하고, 개인화 된 지원을 위한 적응 시스템에 대한 연구는 필요하다. 본 연구에서는 교육용 데이터를 대상으로 이상탐지와 추천시스템에서 사용하는 기계학습 기술에 대한 조사와 분류를 하여 교육 분야의 연구에 기여하고자 한다.

  • PDF

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.

미국 주립기록관 페이스북에서의 이용자 참여에 관한 연구 (A Study on User Participation in Facebook of the U.S. State Archives)

  • 김지현
    • 한국비블리아학회지
    • /
    • 제27권4호
    • /
    • pp.63-84
    • /
    • 2016
  • 본 연구는 미국 주립기록관 페이스북에 게시된 이용자 댓글을 분석하여 이용자 참여도와 게시물에 대한 이용자 반응의 유형을 조사하는 것을 목적으로 하였다. 이를 위해 페이스북을 지속적으로 운영하고 있는 27개 주립기록관에서 2016년 8월 1일부터 9월 30일 사이에 생성된 페이스북 데이터를 수집하여 분석에 활용하였다. 이용자 댓글 수, 개별 이용자 수 및 게시물 당 평균 댓글 수를 토대로 이용자의 참여도를 측정하였으며 이용자 참여도가 높은 순서대로 상위 10개의 주립기록관을 선정하였다. 이들 중 최상위인 오하이오 주립기록관과 5위권의 플로리다 주립기록관, 10위권의 아칸소 주립기록관 페이스북에서 이용자 댓글 687개와 댓글이 달린 게시물 132개를 수집하여 내용 분석을 실시하였다. 분석 결과 이용자의 감성적 의견판단, 게시물에 대한 설명 추가 및 개인이야기 공유와 관련된 댓글이 다수를 차지하였다. 또한 질문을 통한 이용자 간 또는 이용자와 아키비스트 간 상호작용도 확인할 수 있었다. 게시물의 경우 소장자료와 관련된 정보와 지식을 공유하는 유형이 높은 비율을 차지하였다. 분석 결과를 바탕으로 국내 기록관에서 이용자의 삶과 연결되는 역사적 사실 및 관련 기록물을 발굴하여 제시하고 소셜 미디어에서 이용자와 효과적인 상호작용을 수행할 수 있는 방법을 모색하며 온라인 이용자 커뮤니티를 구축 유지하여 소셜 미디어를 통한 기록관 홍보 및 확장 서비스를 강화할 것을 제안하였다.

빅데이터를 활용한 젠트리피케이션 상권의 장소성 분류와 특성 분석 -서울시 14개 주요상권을 중심으로- (Classifying and Characterizing the Types of Gentrified Commercial Districts Based on Sense of Place Using Big Data: Focusing on 14 Districts in Seoul)

  • 김영재;박인권
    • 지역연구
    • /
    • 제39권1호
    • /
    • pp.3-20
    • /
    • 2023
  • 본 연구는 젠트리피케이션이 발생한 상권의 장소성을 파악하여 상권의 확장과 쇠퇴 속에서 장소성의 구체적인 모습을 유형화하고 유형별 특징을 분석하는 것을 목적으로 한다. 소셜 미디어를 통해 수집된 대용량 문서를 활용하여 위계적 군집분석을 시행하였으며, 지역별 장소성을 인지적 차원의 <경험>과 실재적 차원의 <상권특성>으로 구분하여 상권 군집별 특성을 확인하였다. 이를 위해 잠재 디리클레 할당(Latent Dirichlet Allocation: LDA) 토픽모델링 기법과 서울시 우리마을가게 상권분석서비스를 통해 수집된 상권별 매출액 통계자료를 활용하였다. 분석 결과 서울시 젠트리피케이션 상권은 고유한 특성을 가진 '연극 상권', '전통문화 상권', '여성 미용 상권', '고급음식점 및 의료서비스 상권', '트렌디 상권'으로 분류되는 것으로 나타났다. 연구의 결과를 바탕으로 보다 효율적이고 지역별 특색에 맞는 상업정책들을 시행할 수 있을 것으로 기대한다.

딥러닝 기반 소셜미디어 한글 텍스트 우울 경향 분석 (A Deep Learning-based Depression Trend Analysis of Korean on Social Media)

  • 박서정;이수빈;김우정;송민
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.91-117
    • /
    • 2022
  • 국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.