• 제목/요약/키워드: Topic Mining

검색결과 515건 처리시간 0.023초

텍스트 마이닝과 토픽모델링 활용한 사회서비스 품질의 학술연구 동향 분석 (The Analysis of Research Trends in Social Service Quality Using Text Mining and Topic Modeling)

  • 이혜정;윤기혁
    • 사물인터넷융복합논문지
    • /
    • 제8권3호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 연구는 텍스트 마이닝과 토픽모델링을 활용하여 우리나라에 사회서비스가 본격적으로 도입된 2007년부터 2020년 까지의 사회서비스 품질에 대한 학술연구 동향을 분석하였다. 이를 토대로 사회서비스 품질에 관한 논문의 패턴 및 전체 데이터 속에 의미를 파악하여 사회서비스 발전방향에 대한 기초자료를 제공하고자 함에 목적이 있다. 자료수집은 학술연구정보서비스(RISS)에서 사회서비스, 사회복지서비스, 품질 키워드로 97편의 논문을 선정하였고, 2개 구간으로 구분하여 텍스트 마이닝을 활용하여 데이터를 분석하였다. 본 연구의 결과는 첫째, 본 연구에서 활용된 97개의 논문 중 1구간은 38편, 2구간은 59편으로 나타났고, 연 평균 6.9개의 논문이 발표되었다. 둘째, 단어빈도 분석 결과 1구간과 2구간의 공통 키워드는 서비스, 품질, 사회서비스, 만족도, 이용자, 품질관리, 재이용, 정책, 바우처 등의 순으로 나타났다. TF-IDF 분석 결과 1구간과 2구간의 공통 키워드는 사회서비스, 만족도, 이용자, 고객만족, 재이용, 바우처, 품질, 노인요양시설, 품질관리, 지역사회서비스투자사업 등의 순으로 나타났다. 셋째, 토픽 모델링 분석 결과 1구간의 주요 토픽은 서비스 제공유형, 서비스 비용, 재이용, 이용자 중심, 일자리 창출로 나타났고, 2구간은 품질관리체계, 공공성, 제공인력 관리체계, 공급방식체계, 서비스 만족도로 나타났다. 본 연구 결과를 바탕으로 사회서비스 품질 학술연구의 방향성을 제시하였다.

토픽모델링을 활용한 실내환경 분야 연구동향 파악 : 실내환경학회지 초록 사례연구 (An analysis of indoor environment research trends in Korea using topic modeling : Case study on abstracts from the journal of the Korean society for indoor environment)

  • 전형진;김도연;한국진;김동우;손승우;이철민
    • 실내환경 및 냄새 학회지
    • /
    • 제17권4호
    • /
    • pp.322-329
    • /
    • 2018
  • The objective of this study is to identify the research trend in the field of indoor environment in Korea. We collected 419 papers published in the Journal of the Korean Society for indoor environment between 2004 and 2018, and attempted to produce datasets using a topic modeling technique, Latent Dirichlet Allocation(LDA). The result of topic modeling showed that 8 topics ("VOCs investigation", "Subway environment", "Building thermal environment", "School health", "Building particulate matter", "Asbestos risk", "Radon risk", "Air cleaner and treatment") could be extracted using Gibbs sampling method. In terms of topic trends, investigation of volatile organic compounds, subway environment, school health, and building particulate matter showed a decreasing tendency, while the building thermal environment, asbestos risk, radon risk, air cleaners, and air treatment showed an increasing tendency. The results of this topic modeling could help us to understand current trends related indoor environment, and provide valuable information in developing future research and policy frameworks.

A Research on Difference Between Consumer Perception of Slow Fashion and Consumption Behavior of Fast Fashion: Application of Topic Modelling with Big Data

  • YANG, Oh-Suk;WOO, Young-Mok;YANG, Yae-Rim
    • 융합경영연구
    • /
    • 제9권1호
    • /
    • pp.1-14
    • /
    • 2021
  • Purpose: The article deals with the proposition that consumers' fashion consumption behavior will still follow the consumption behavior of fast fashion, despite recognizing the importance of slow fashion. Research design, data and methodology: The research model to verify this proposition is topic modelling with big data including unstructured textual data. we combined 5,506 news articles posted on Naver news search platform during the 2003-2019 period about fast fashion and slow fashion, high-frequency words have been derived, and topics have been found using LDA model. Based on these, we examined consumers' perception and consumption behavior on slow fashion through the analysis of Topic Network. Results: (1) Looking at the status of annual article collection, consumers' interest in slow fashion mainly began in 2005 and showed a steady increase up to 2019. (2) Term Frequency analysis showed that the keywords for slow fashion are the lowest, with consumers' consumption patterns continuing around 'brand.' (3) Each topic's weight in articles showed that 'social value' - which includes slow fashion - ranked sixth among the 9 topics, low linkage with other topics. (4) Lastly, 'brand' and 'fashion trend' were key topics, and the topic 'social value' accounted for a low proportion. Conclusion: Slow fashion was not a considerable factor of consumption behavior. Consumption patterns in fashion sector are still dominated by general consumption patterns centered on brands and fast fashion.

토픽 모델링을 이용한 한국 무역규범 연구동향 분석 : 2000년~2022년 (Korea's Trade Rules Analysis using Topic Modeling : from 2000 to 2022)

  • 임병호;장정인;김태한;한하늘
    • 무역학회지
    • /
    • 제48권1호
    • /
    • pp.55-81
    • /
    • 2023
  • 본 연구의 목적은 한국 무역의 주요 이슈와 동향을 분석하고 향후 무역규범 연구에 대한 시사점을 도출하는데 있다. 분석자료로서 Korean Journal Citation Index 데이터베이스에서 2000년부터 2022년 7월까지 'Trade Rules'로 검색된 영문 키워드로 총 476개의 학술지를 분석하였다. 분석 방법으로는 동시발생네트워크와 텍스트마이닝 방법의 하나인 토픽트렌드 분석이 있다. 분석 결과, 최근 한국 무역을 대표하는 키워드는 연구 저널 수가 급증한 카테고리인 Topic 4(투자조약), Topic 7(무역안보), Topic 8(중국 보호무역주의), Topic 11(무역결제) 4가지로 나타났다. 이들 주제의 주요 배경은 기존의 국제무역 체제를 위협하는 미국과 중국 간의 무역마찰이며, 중국의 보호주의, 무역 안보 시스템의 변화, 새로운 투자 협정, 지불 방법의 변화에 대한 상세한 연구는 가까운 장래에 도전 과제가 될 것이다.

텍스트 마이닝 분석 기법을 활용한 월경주기측정 애플리케이션 사용자 경험 평가 (User Experience Evaluation of Menstrual Cycle Measurement Application Using Text Mining Analysis Techniques)

  • 정우경;신동희
    • 정보관리학회지
    • /
    • 제40권4호
    • /
    • pp.1-31
    • /
    • 2023
  • 본 연구는 여성의 건강과 밀접한 관련이 있는 모바일 월경주기 측정 애플리케이션을 대상으로 토픽모델링 기법과 함께 다양한 텍스트 마이닝 기법을 도입하여 사용자 경험 평가를 실시하였으며 그 결과를 허니콤(Honeycomb)모델과 결합하여 분석하였다. 월경주기측정 애플리케이션 리뷰에서 드러난 사용자 경험을 평가하기 위해 월경주기측정 애플리케이션의 한국어 리뷰 47,117개를 수집하였다. 리뷰에서 드러난 사용자 경험에 관한 전체적인 담론 확인을 위해 토픽모델링 분석을 실시하였고, 각 토픽 별 구체적인 경험을 확인하고자 동시출현 네트워크 관계로 구축한 텍스트 네트워크 분석을 실시하였다. 또한 사용자의 정서적 경험을 파악하기 위해 감정분석(Sentiment Analysis)을 실시하였다. 이를 기반으로 월경주기측정 애플리케이션의 개발 전략을 정확도, 디자인, 모니터링, 데이터관리 및 사용자관리 측면에서 제시하였다. 연구 결과, 애플리케이션의 월경주기측정 정확도 및 모니터링 기능을 개선해야 함이 확인되었으며 다양한 디자인적 시도가 필요함이 관찰되었다. 또한 개인정보와 사용자의 생체 데이터 관리방법에 대한 보완의 필요성도 확인되었다. 본 연구는 월경주기측정 애플리케이션의 사용자 경험(UX)을 심층적으로 탐색하여 이용자들이 경험한 다양한 요인을 밝히고 더 나은 경험을 제공하기 위한 실질적인 개선점을 제시하였다. 또한 사용자 경험을 평가하는 과정에서 방대한 양의 리뷰 데이터를 연구자가 면밀하게 파악할 수 있도록 토픽모델링과 텍스트 네트워크 분석 기법을 결합하여 방법론을 제시하였다는 점에서 의의가 있다.

텍스트 마이닝을 이용한 주제기반의 기업인 네트워크 계층 분석 (Topic Based Hierarchical Network Analysis for Entrepreneur Using Text Mining)

  • 이동훈;김용화;김관호
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.33-49
    • /
    • 2018
  • 다양한 고객의 요구를 만족시키기 위한 신제품 설계 및 개발의 필요성 때문에 중소기업 간의 융합 활동의 중요성은 증대하고 있다. 특히, 최고 의사결정을 가지는 중소기업 대표는 적합한 융합 활동 파트너를 구하기 위해 인맥관리는 필수적이다. 한편 기업인들은 많은 양의 인맥을 형성하는 것이 중요할 뿐만 아니라 유사한 토픽정보를 가진 기업인과의 인맥관계를 이해하는 것이 중요하다. 그러나 중소기업의 현황 부재와 산업분야별 기업인들의 기술과 특성을 나타낼 수 있는 토픽정보를 수집하는데 어려운 한계가 존재한다. 본 논문에서는 토픽 추출기법을 통해 이와 같은 문제점을 해결하고 3가지 측면에서 기업 네트워크를 분석한다. 구체적으로 C, S, T-Layer 모델이 있으며 각각의 모델은 인맥의 양, 인맥 중심성, 토픽 유사성을 분석한다. 실 데이터를 통한 실험 결과, 인맥의 양이 적은 경우 중심성이 높은 기업과 네트워크를 강화하여 인맥 네트워크를 활성화 시켜야 할 필요가 있고, 토픽 유사성이 낮은 경우 주제 기반의 네트워크를 활성화 시켜야 할 필요가 있다는 것을 실험을 통해 확인하였다.

한국 플랫폼 정부의 방향성 모색 : 공공기관 연구보고서에 대한 토픽 모델링과 네트워크 분석 (An Exploratory Study of Platform Government in Korea : Topic Modeling and Network Analysis of Public Agency Reports)

  • 남현동;남태우
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.139-149
    • /
    • 2020
  • 새로운 플랫폼 정부는 지능적인 정보기술을 활용하여 정부와 국민이 서로 협력하는 새로운 생태계 기반 정부 혁신과 지속 가능한 발전을 견인하는 역할을 할 것이다. 이에 플랫폼 정부의 플랫폼 구축을 위해 최근 관련 연구 동향에 대해 살펴보고 향후 미래정책 방향 및 연구기반을 마련하기 위한 토대를 구축하고자 한다. 연구 분석을 위해 각 부처와 정부산하기관에서 발행된 연구보고서를 텍스트마이닝 기법을 활용하여 텍스트 자료를 수집하고, 수집된 텍스트 자료를 토픽 모델링과 네트워크 분석을 시행하였다. 분석결과 미래전략과 집단 내에서의 네트워크 연결이 제대로 이루워지지 않고 있으며 연결 중심성이 강할수록 관계성이 약해지는 것을 도출하였다. 이는 정부가 플랫폼을 설계하고 데이터와 서비스를 공급하는 공급 역할에서 통합적, 상호 교류적 접점이 필요하며 정부와 시민, 기업의 협치가 가능한 생태계가 조성되어야 할 것이다. 본 연구를 통해 플랫폼 정부의 공급과 수요적 접근의 이해를 높이고 잠재적 토픽에 따라 적절한 변경관리 방법을 구현하기 위한 논의가 다각적으로 이루어지길 기대한다.

WV-BTM: SNS 단문의 주제 분석을 위한 토픽 모델 정확도 개선 기법 (WV-BTM: A Technique on Improving Accuracy of Topic Model for Short Texts in SNS)

  • 송애린;박영호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.51-58
    • /
    • 2018
  • SNS의 사용자와 데이터량이 폭발적으로 증가함에 따라, SNS 빅 데이터를 기반으로 한 연구들이 활발히 진행되고 있다. 특히 소셜 마이닝 분야에서는 비 분류된 대용량 SNS 텍스트 데이터로부터 각 텍스트 별 유사성을 파악하고, 그로부터 트렌드를 추출하기 위해 대표적인 토픽 모델 기법인 LDA를 사용한다. 그러나 LDA는 단문 데이터에 대하여 비 빈발 단어 출현으로 인한 의미 희박성(semantic sparsity)으로 인해 양질의 주제 추론이 어렵다는 한계를 가진다. BTM 연구는 이와 같은 LDA의 한계점을 두 단어의 조합을 통해 개선하였으나, BTM 또한 조합된 단어 중 높은 빈도수의 단어에 더 큰 영향을 받아 각 주제와의 연관성을 고려한 가중치 계산이 불가능하다는 한계점을 지닌다. 본 논문은 단어 간의 의미적 연관성을 반영함으로써 기존 연구 BTM의 정확도를 개선하는 방안을 모색한다.

도로 위의 군비경쟁: LDA 토픽모델을 활용한 SUV의 인기 요인 탐구 (The Arms Race on the Road: Exploring Factors of SUVs' Popularity by LDA Topic Model)

  • 전승봉;고태경
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.239-252
    • /
    • 2020
  • 본 연구자들은 텍스트 마이닝을 활용하여 SUV 선호 증가의 요인을 탐색하고자 한다. 온라인 자동차 커뮤니티인 보배드림에서 2005년부터 2019년까지 작성된 SUV 관련 게시글 32,679개를 수집한 후, LDA 토픽모델링 기법을 적용하였다. 분석 결과, SUV 담화에서 주요한 토픽으로 등장한 '안전'이 범죄로부터 개인의 위험에 주목한 기존 연구와 달리 교통사고 및 고속주행 상황에서의 안전을 의미하는 것으로 드러났다. 한국 사회의 SUV 소비는 개인이 운전하면서 느끼는 불안과 위험에 대한 대비 수단을 의미한다고 볼 수 있다는 것이다. 또한, 이와 같은 위험 인식 저변에는 불평등 증대로 인해 감소하는 타인에 대한 신뢰가 작동한다고 할 수 있다.

신재생에너지 동향 파악을 위한 토픽 모형 분석 (Topic Model Analysis of Research Trend on Renewable Energy)

  • 신규식;최회련;이홍철
    • 한국산학기술학회논문지
    • /
    • 제16권9호
    • /
    • pp.6411-6418
    • /
    • 2015
  • 기후변화 및 환경오염에 대응하기 위해 신재생에너지 정책 연구가 증가하고 있다. 신재생에너지는 녹색산업과 녹색기술로 대표되는 새로운 성장 동력 기술이다. 현재 우리나라는 태양광, 풍력, 수소연료전지 등 3대 전략부분에 신재생에너지 보급 및 기술개발사업에 대한 투자가 이루어지고 있지만 아직은 초기 단계로, 연구 방향 및 투자 분야에 대한 불확실성을 줄이는 것이 무엇보다도 시급한 실정이다. 따라서 본 연구는 빅데이터(big data) 분석방법 중 텍스트 마이닝(Text mining method)과 토픽 모델링 기법(multinominal topic model)을 신재생에너지와 관련된 최근 10년간의 우리나라 언론기사에 적용하여 국가 정책의 핵심이슈 및 세계적인 연구 트렌드를 분석하고, 성장 가능성이 있는 신재생에너지 분야를 예측하였다. 정보통신기술을 바탕으로 한 연구결과는 신재생에너지 분야에 활발히 적용될 것으로 예측된다.