• 제목/요약/키워드: LDA 토픽 모델링

검색결과 233건 처리시간 0.021초

트윗 키워드 네트워크를 이용한 구제역의 감성분석 (Sentiment Analysis of Foot-and-mouth Disease using Tweet Keyword Network)

  • 채희찬;이종욱;최윤아;박대희;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.267-270
    • /
    • 2018
  • 구제역으로 인하여 국내 축산업계 및 관련 산업분야는 매년 막대한 피해를 입고 있다. 구제역과 관련한 다양한 학술적 연구들이 현재 진행되고는 있으나, 구제역의 발병에 따른 사회적 파급효과에 관한 공학적 분석 연구는 매우 제한적이다. 본 연구에서는 구제역에 관한 일반 시민들의 감성적 반응을 텍스트 마이닝 방법론을 사용하여 분석하는 체계적인 방법론을 제안한다. 제안하는 시스템은 먼저, 트위터에 게시된 트윗 중 구제역과 관련된 데이터를 수집한 후, 감성사전을 기반으로 극성탐지 과정을 거친다. 둘째, 토픽 모델링의 대표적인 기법 중 하나인 LDA를 활용하여 트윗으로 부터 키워드들을 추출하고, 추출된 키워드들로부터 극성별 동시출현 키워드 네트워크를 구성한다. 셋째, 키워드 네트워크을 통해 각 구간별 구제역의 사회적 파급효과를 분석한다. 사례 분석으로써, 2010년 7월부터 2011년 12월까지 국내에서 발생한 구제역에 관한 일반 시민들의 감성적 변화를 분석하였다.

토픽모델링을 활용한 신규간호사 관련 국내 연구동향 분석 (Research trend analysis of Korean new graduate nurses using topic modeling)

  • 박승미;이정림
    • 한국간호교육학회지
    • /
    • 제27권3호
    • /
    • pp.240-250
    • /
    • 2021
  • Purpose: The aim of this study is to analyze the research trends of articles on just graduated Korean nurses during the past 10 years for exploring strategies for clinical adaptation. Methods: The topics of new graduate nurses were extracted from 110 articles that have been published in Korean journals between January 2010 and July 2020. Abstracts were retrieved from 4 databases (DBpia, RISS, KISS and Google scholar). Keywords were extracted from the abstracts and cleaned using semantic morphemes. Network analysis and topic modeling were performed using the NetMiner program. Results: The core keywords included 'education', 'training', 'program', 'skill', 'care', 'performance', and 'satisfaction'. In recent articles on new graduate nurses, three major topics were extracted by Latent Dirichlet Allocation (LDA) techniques: 'turnover', 'adaptation', 'education'. Conclusion: Previous articles focused on exploring the factors related to the adaptation and turnover intentions of new graduate nurses. It is necessary to conduct further research focused on various interventions at the individual, task, and organizational levels to improve the retention of new graduate nurses.

포스트 팬데믹 시대의 중고 패션 소비 인식 변화 (Changes in the Perception of Second-hand Fashion Consumption in the Post-pandemic Era)

  • 김하빈;이하경
    • 한국의류산업학회지
    • /
    • 제24권1호
    • /
    • pp.66-80
    • /
    • 2022
  • Even before the Covid-19 outbreak, the second-hand fashion market has been growing as the fashion industry strives towards sustainability. It has also accelerated due to the economic contraction caused by the pandemic. In previous studies, the second-hand market has been steadily studied; however, the research is insufficient compared to the diversified market. Therefore, this study investigates changes in consumers' perception of the second-hand fashion market affected by Covid-19. This study collected text data with the keyword 'second-hand fashion' from various blogs. We analyzed 24,000 posts before and after the Covid-19 outbreak by applying the LDA algorithm for topic modeling and content analysis. Seven and nine different topics for the period before and after the pandemic respectively were derived. The results revealed that during the pandemic the consumers realized the practical value of sustainability in their daily lives than they did before the pandemic. Furthermore, they tried to minimize transaction anxiety by using diverse platforms with advanced technology. They also realized economic value by buying and selling sneakers in the popular sneakers resale market. The results could help understand the rapidly growing second-hand fashion market during Covid-19.

RFE-SHAP을 활용한 온라인 리뷰를 통한 고객 만족도 예측 (Prediction of Customer Satisfaction Using RFE-SHAP Feature Selection Method)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.325-345
    • /
    • 2023
  • 본 연구는 온라인 리뷰를 이용하여 고객 만족도를 예측하는 새로운 접근 방식을 제안한다. LDA 주제 모델링과 결합된 RFE-SHAP 기능 선택 방법을 활용하여 고객 만족도에 큰 영향을 미치는 주요 기능을 식별하여 예측 분석을 개선했다. 먼저 Random Forest 알고리즘의 경우, 초기 28개 입력변수에서 14개의 변수를 최적 하위 집합으로 추출했다. 제안된 방법에서 Random Forest 모델의 성과는 84%로 확인 되었으며 변수가 많은 모델에서 흔히 발생하는 과적합을 방지하였다. 또한 품질, 착용감, 내구성 등과 같은 리뷰의 특정 요소들이 패션 산업 내에서 소비자 만족도를 증진시키는 중요한 역할을 한다는 사실을 밝혀냈다. 본 연구는 예측 결과를 설명할 때 선택한 각 기능이 고객 만족도에 어떻게 영향을 미치는지에 대한 자세한 설명을 제공하고 고객이 가장 중요하게 생각하는 측면에 대한 세부적인 보기를 제공한다. 본 연구의 공헌도는 다음과 같다. 첫째, 전자상거래 분석 분야 내에서 예측 모델링을 강화하고 특성 중심적인 접근법을 소개함으로써 방법론을 개선하였다. 이는 고객 만족도 예측의 정확도를 높일 뿐만 아니라 예측 모델에서의 변수 선택에 대한 새로운 접근을 제시한다. 둘째, 특히 의류 부문에서 전자상거래 플랫폼에 구체적인 통찰력을 제공한다. 품질, 사이즈, 내구성 등 고객 리뷰의 어떤 부분이 만족도에 가장 큰 영향을 미치는지 강조함으로써, 기업들이 제품과 서비스를 맞춤화 할 수 있는 전략적 방향을 제시한다. 이러한 목표 지향적인 개선은 고객의 쇼핑 경험을 개선하고, 만족도를 향상시키면서 충성도를 이끌어낼 수 있을 것으로 기대한다.

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.

토픽 모델링을 이용한 시뮬레이션 연구 동향 분석 (Trend Analysis using Topic Modeling for Simulation Studies)

  • 나상태;김자희;정민호;안주언
    • 한국시뮬레이션학회논문지
    • /
    • 제25권3호
    • /
    • pp.107-116
    • /
    • 2016
  • 시뮬레이션의 활용범위와 기법이 나날이 다양해지면서 시뮬레이션의 최신 연구 동향을 분석하고 이를 대학 교육과 연구에 적용하는 노력이 요구된다. 기존에는 트렌드 분석을 위해 문헌조사 또는 전문가 평가와 같은 정성적인 연구방법이 주로 사용되었으나 이런 방법들은 많은 시간과 비용이 소요될 뿐만 아니라 전문가의 주관적인 관점이 반영될 가능성이 있다. 본 연구에서는 객관적 분석을 위해 국내 학술 논문에 대하여 토픽분석을 포함한 정량적 분석을 실시하였다. 그 결과 국내에서는 시뮬레이션이 전기전자 분야에서 가장 활발하게 활용된다는 사실을 발견하였다. 또한 사회 과학에서는 교육 및 오락의 목적으로도 활용됨을 알 수 있었다. 이 연구 결과는 국내 시뮬레이션 연구와 한국 시뮬레이션 학회가 어떤 방향으로 발전할지를 예측하는 데 도움이 된다. 본 연구결과는 시뮬레이션 활용 연구 분야의 핵심 토픽을 도출하기 위하여 텍스트마이닝 기반의 트렌드분석에 대한 활용 가능성을 제시하고, 텍스트마이닝이 미래예측 키워드를 도출하는 유용한 방법임을 증명하였으며, 전문가들의 정성적인 자료를 보조하는 정량적인 자료분석 방법으로 유용할 것으로 기대된다.

SNS 데이터를 이용한 공공시설 매력도지수에 따른 접근성 분석기법 (Accessibility Analysis Method based on Public Facility Attraction Index Using SNS Data)

  • 이지원;유기윤;김지영
    • 한국측량학회지
    • /
    • 제37권1호
    • /
    • pp.29-42
    • /
    • 2019
  • 본 연구는 공공시설의 질적인 측면의 확대를 위해 SNS (Social Network Service) 데이터를 활용하여 이용자 중심의 공공시설 선호요인을 도출하고, 이를 공급측면과 수요측면에서 정량화시키는 방법을 제안하였다. 선호요인 도출을 위해 토픽모델링 중 하나인 LDA (Latent Dirichlet Allocation)를 활용하였으며, 공급요인인 개별시설별로 매력도지수를 산출하였다. 또한 수요자 입장에서 서비스체감 정도를 측정하기 위해 공간접근성을 분석하였는데, 2SFCA (2-Step Floating Catchment Area) 방법을 활용하여 앞서 제안한 공공시설 매력도지수를 적용할 수 있도록 하였다. 실험은 서울시 공공도서관을 대상으로 진행하였다. 연구결과 공공도서관에 대한 선호요인으로 주변 환경, 시설 및 이용규모, 문화 프로그램, 육아, 장서 및 자료현황의 5가지 주제가 추출되었으며, 주변 환경이나 육아관련 주제는 새롭게 도출된 선호요인으로 선행연구와 차별성이 있다. 각 도서관별로 매력도지수를 산출한 결과 송파도서관, 정독도서관, 남산도서관의 매력도지수가 높게 나타났으며, 송파도서관은 육아요인에서 정독도서관과 남산도서관은 주변 환경요인에서 좋은 평가를 받고 있는 것으로 나타났다. 각 동별 공간접근성은 공공도서관이 많이 몰려있는 서울 중심부의 접근성이 좋은 편이며, 외곽지역으로 갈수록 줄어드는 것으로 보였다. 본 연구에 제안한 기법을 통해 이용자 중심의 공공시설 평가 및 정책의사 결정에 도움을 줄 것으로 기대한다.

스마트도시 구현을 위한 시민참여의 역할과 방향에 관한 연구 (Civic Participation in Smart City : A Role and Direction)

  • 남우민;박건철
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.79-86
    • /
    • 2022
  • 본 연구는 스마트도시 구축과정에서 시민참여 활성화를 위한 연구동향을 파악하고자 한다. 이를 바탕으로 스마트도시에서 시민참여의 역할과 방향을 제시하고 시민참여를 유인할 수 있는 정책적·산업적·학술적·방향성을 제시하는데 있다. 전 세계적으로 급격하게 진행되는 도시화와 도시인구 증가로 교통, 환경, 에너지 등 각종사회 문제가 도시를 중심으로 확산 및 심화되고 있다. 세계 각국은 이런 도시문제 해결 및 지속가능한 발전을 이루기 위해 스마트도시를 도입하고 있다. 최근에는 인프라 확대 등 스마트도시 건설을 위한 기존의 하향식(Top-Down) 도시계획 방식에서 벗어나 시민들이 직·간접적으로 도시건설 과정에 참여 및 상호작용할 수 있는 상향식(Bottom-Up) 방식으로의 접근이 경주되고 있다. 한편, 국내에서도 국가전략관점에서 스마트도시 건설이 추진되고 있지만, 스마트도시에 대한 일반 시민의 인식과 참여는 낮은 것으로 나타나고 있다. 이런 상황을 극복하기 위해 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 연구가 시급한 상황이다. 따라서 본 연구에서는 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 전략모색을 위해 Scopus DB에서 'Smart City'와 'Participation(Engagement)'가 동시에 포함된 문헌 995건을 수집 후 토픽모델링 기법을 활용하여 관련 연구주제를 유형화하고, 연구동향을 분석하였다. 이를 통해 스마트도시에서 시민참여에 관한 연구방향을 이해하고, 향후 관련 연구에 대한 방향성을 제시하는 근거자료로 활용될 수 있을 것으로 기대된다.

동적 토픽 모델링과 감성 분석을 이용한 COVID-19 구간별 비대면 근무 부정요인 검출에 관한 연구 (Detection of Complaints of Non-Face-to-Face Work before and during COVID-19 by Using Topic Modeling and Sentiment Analysis)

  • 이선민;천세진;박상언;이태욱;김우주
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권4호
    • /
    • pp.277-301
    • /
    • 2021
  • Purpose The purpose of this study is to analyze the sentiment responses of the general public to non-face-to-face work using text mining methodology. As the number of non-face-to-face complaints is increasing over time, it is difficult to review and analyze in traditional methods such as surveys, and there is a limit to reflect real-time issues. Approach This study has proposed a method of the research model, first by collecting and cleansing the data related to non-face-to-face work among tweets posted on Twitter. Second, topics and keywords are extracted from tweets using LDA(Latent Dirichlet Allocation), a topic modeling technique, and changes for each section are analyzed through DTM(Dynamic Topic Modeling). Third, the complaints of non-face-to-face work are analyzed through the classification of positive and negative polarity in the COVID-19 section. Findings As a result of analyzing 1.54 million tweets related to non-face-to-face work, the number of IDs using non-face-to-face work-related words increased 7.2 times and the number of tweets increased 4.8 times after COVID-19. The top frequently used words related to non-face-to-face work appeared in the order of remote jobs, cybersecurity, technical jobs, productivity, and software. The words that have increased after the COVID-19 were concerned about lockdown and dismissal, and business transformation and also mentioned as to secure business continuity and virtual workplace. New Normal was newly mentioned as a new standard. Negative opinions found to be increased in the early stages of COVID-19 from 34% to 43%, and then stabilized again to 36% through non-face-to-face work sentiment analysis. The complaints were, policies such as strengthening cybersecurity, activating communication to improve work productivity, and diversifying work spaces.

국내 모바일 뱅킹 애플리케이션에 대한 이용자 중요도-만족도 분석(IPA): 구글 플레이스토어 리뷰 데이터를 활용하여 (Importance-Performance Analysis for Korea Mobile Banking Applications: Using Google Playstore Review Data)

  • 김소희;김무건;류민호
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.115-126
    • /
    • 2022
  • 본 연구는 국내 모바일 뱅킹 애플리케이션에 대한 이용자 리뷰 데이터에 텍스트 마이닝 기법을 적용하여 중요도-만족도 분석을 시도하고, 개선의 우선순위를 도출하는 것을 목적으로 한다. 분석에는 구글 플레이스토어에서 국내 시중은행(국민은행, 신한은행, 우리은행, 하나은행), 지역은행(경남은행, 부산은행), 인터넷 은행(카카오뱅크, 케이뱅크, 토스)의 모바일 뱅킹 애플리케이션에 대한 이용자 리뷰 데이터를 활용하였으며, 주요 속성 도출 및 각 속성에 대한 중요도와 만족도 측정을 위해 토픽 모델링, 빈도분석 및 감성분석을 진행하였다. 분석 결과 '인증서비스', '기능 개선', '로그인', '속도/연결성', '시스템/업데이트' 그리고 '뱅킹서비스'가 이용자들이 모바일 뱅킹 애플리케이션을 사용할 때 느끼는 중요도가 상대적으로 높은 속성임에도 불구하고 그 만족도가 평균 수준에 미치지 못해 개선이 시급한 속성으로 나타났다.