• 제목/요약/키워드: LDA 토픽 모델링

검색결과 233건 처리시간 0.023초

텍스트네트워크분석을 활용한 신규간호사가 경험하는 현실충격 관련 연구의 지식구조 분석 (Analysis of the Knowledge Structure of Research related to Reality Shock Experienced by New Graduate Nurses using Text Network Analysis)

  • 윤희장
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.463-469
    • /
    • 2023
  • 본 연구의 목적은 신규간호사가 경험하는 현실충격 관련 연구를 텍스트 네트워크 분석을 통해 분석함으로써 신규간호사의 성공적인 임상적응과 이직률 감소에 기여할 수 있는 기초자료를 제공하기 위함이다. 2002년 1월부터 2021년 12월까지 국내외 학술지에 게재된 115편의 논문에서 신규간호사가 경험한 현실충격에 관한 토픽을 추출하였다. 6개의 데이터베이스(국내: DBpia, KISS, RISS / 해외: Web of science, Springer, Scopus)에서 문헌을 검색하였다. 키워드는 문헌의 초록에서 추출되었고 의미론적 형태소를 사용하여 정리되었다. 네트워크분석 및 토픽모델링은 NetMiner 4.5 프로그램을 사용하여 수행되었다. 핵심 키워드는 '신규간호사', '현실충격', '전환', '학생간호사', '경험', '실습', '근무환경', '역할', '돌봄', '교육' 등으로 확인되었다. 최근 신규간호사의 현실충격에 관한 연구에서 잠재적 디리클레 할당(LDA) 기법으로 '이직', '근무환경', '전환 경험'의 세 가지 주요 주제를 추출하였다. 본 연구결과를 바탕으로 신규호사가 경험하는 현실충격을 효과적으로 감소시키고 성공적으로 임상적응을 도울 수 있는 중재 연구의 필요성을 제언한다.

언어 네트워크 분석을 통한 IFLA의 학교도서관 가이드라인 비교·분석에 관한 연구 (A Comparative Analysis Study of IFLA School Library Guidelines Using Semantic Network Analysis)

  • 이병기
    • 한국도서관정보학회지
    • /
    • 제51권2호
    • /
    • pp.1-21
    • /
    • 2020
  • 본 연구는 언어 네트워크 분석을 통해 IFLA의 학교도서관 가이드라인의 언어적 의미를 파악하는데 목적이 있다. IFLA의 학교도서관 가이드라인은 2002년 초판과 2015년에 개정한 제2판이 있다. 본 연구는 학교도서관 가이드라인의 2002년판과 2015년판을 언어 네트워크의 관점에서 분석하고, 상호 비교하였다. 대상 테스트로부터 키워드들을 추출하고 동시출현관계를 바탕으로 언어 네트워크를 구성하였다. 동시출현 네트워크로부터 중심성(연결정도 중심성, 근접 중심성, 매개 중심성)을 분석하였다. 또한, 본 연구는 넷마이너4.0의 LDA 기능을 사용하여 토픽모델링 분석을 수행하였다. 본 연구의 주요 결과는 다음과 같다. 첫째, 중심성 차원에서 비교해 보면, 2015년판에서 'Program, Teaching, Reading, Inquiry, Literacy, Media' 등의 키워드가 2002년판에 비해 높게 나타나고 있다. 둘째, 2002년판의 중심성 상위 리스트에서 보이지 않던 'Inquiry'와 'Achievement' 키워드가 2015년판의 연결정도 중심성과 근접중심성에 새롭게 출현하고 있다. 셋째, 토픽 모델링의 분석 결과, 2002년판에 비해 2015년판은 학교도서관 서비스, 사서교사의 교수학습 활동, 미디어 및 정보활용교육, 교육과정 참여 등에 관한 토픽의 비중이 높아지고 있다.

감염병 확산에 따른 레스토랑 선택속성 변화 분석: 텍스트마이닝 기법 적용 (Analysis of Changes in Restaurant Attributes According to the Spread of Infectious Diseases: Application of Text Mining Techniques)

  • 유준일;이은지;구철모
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.89-112
    • /
    • 2023
  • 2020년 3월, 코로나바이러스 팬데믹으로 선포되면서, 다양한 방역 조치가 취해져 왔다. 이에 따라, 관광 및 환대 산업 내의 많은 변화들이 야기되었다. 특히 레스토랑 산업에서는 비대면 서비스 및 좌석 간 거리두기 등 방역 지침이 시행되었다. 전통적으로 레스토랑 선택속성에 대한 연구는 분위기, 서비스 품질, 음식의 품질을 포함한 3가지 속성의 중요성이 강조해 온 데 반해, 코로나19 이후 레스토랑 이용자를 대상으로 레스토랑 선택속성을 탐색한 연구는 미비한 실정이다. 이에 따라, 본 연구에서는 코로나19라는 환대 산업 내의 환경적 변화에 대한 이해에 기반하여, 국내 온라인 리뷰 데이터 상에서 새로운 레스토랑 경험적 속성을 확인하기 위한 탐색적인 접근을 시도하였다. 본 연구는 서울 을지로 지역에 위치한 일반음식점 및 휴게음식점 475개로 네이버 플레이스에 등록된 총 31,115개의 온라인 리뷰를 분석 단위로 고려하였다. 분석 방법은 단어 빈도와 역문서 빈도의 곱으로 산출된 TF-IDF와 잠재적 토픽들을 추출하는 확률적 모델 알고리즘인 LDA 토픽모델링 기법을 통해 온라인 리뷰 내에서 단어들의 군집화를 통해 레스토랑 선택속성을 재분류하고자 하였다. 분석 결과, 분위기, 서비스 품질, 음식 품질과 함께 코로나19 이후 레스토랑의 새로운 속성으로 "감염병 예방"요인이 도출되었다. 본 연구는 기존 레스토랑 선택속성에서 제시하는 세 가지 속성들을 범주화하고, 나아가 새로운 속성을 제시하였다는 점에서 기존 레스토랑 선택속성 문헌을 확장하여 학술적 의의가 있다. 나아가, 분석 결과에 기반하여 레스토랑 운영의 측면 및 정책적 관점에서의 실무적 제언을 시도하였다.

토픽모델링을 활용한 실내환경 분야 연구동향 파악 : 실내환경학회지 초록 사례연구 (An analysis of indoor environment research trends in Korea using topic modeling : Case study on abstracts from the journal of the Korean society for indoor environment)

  • 전형진;김도연;한국진;김동우;손승우;이철민
    • 실내환경 및 냄새 학회지
    • /
    • 제17권4호
    • /
    • pp.322-329
    • /
    • 2018
  • The objective of this study is to identify the research trend in the field of indoor environment in Korea. We collected 419 papers published in the Journal of the Korean Society for indoor environment between 2004 and 2018, and attempted to produce datasets using a topic modeling technique, Latent Dirichlet Allocation(LDA). The result of topic modeling showed that 8 topics ("VOCs investigation", "Subway environment", "Building thermal environment", "School health", "Building particulate matter", "Asbestos risk", "Radon risk", "Air cleaner and treatment") could be extracted using Gibbs sampling method. In terms of topic trends, investigation of volatile organic compounds, subway environment, school health, and building particulate matter showed a decreasing tendency, while the building thermal environment, asbestos risk, radon risk, air cleaners, and air treatment showed an increasing tendency. The results of this topic modeling could help us to understand current trends related indoor environment, and provide valuable information in developing future research and policy frameworks.

Latent Dirichlet Allocation 토픽모델링을 이용한 한방 의료 서비스 분석에 관한 연구 : 의료 소비자의 온라인 리뷰를 중심으로 (A Study on the Analysis of Korean Medical Services using Latent Dirichlet Allocation Topic Modeling : Focusing on online reviews by medical consumers)

  • 손채연;송연우;이승호
    • 대한예방한의학회지
    • /
    • 제26권1호
    • /
    • pp.43-57
    • /
    • 2022
  • Objective : This study aims to understand the consumer's needs for Korean medicine medical service using online review analysis of medical consumers. Methods : We analyzed the purpose and satisfaction factors of medical service use using LDA (Latent Dirichlet Allocation) topic modeling. The data used in the study was 120,727 screened reviews written by medical consumers registered on Naver. The analyzed results were compared with the "2020 Korean Medicine Utilization Survey". Results : From 2018 to 2021, the five most frequently used terms were "kindness", "treatment", "doctor", "Korean medicine", and "acupuncture". The main purpose of visiting Korean medicine medical clinic and hospital was to treat "traffic accidents" in 2018, "waist(back) pain" in 2019, "musculoskeletal pain" in 2020 & 2021. Based on the rating, reviewers were satisfied with "explanation of treatment" and "treatment attitude", and dissatisfied with "accessibility to the institution". Conclusion : We concluded that the main purpose of use of Korean medicine institution was to treat musculoskeletal disorders. Based on the results of this study, it is expected that it will be used to improve Korean medicine medical service in the future.

코로나19 관련 키워드 분석: 토픽 모델링과 의미 연결망 네트워크 분석을 중심으로 (COVID19 Related Keyword Analysis: Based on Topic Modeling and Semantic Network Analysis)

  • 김동욱;이민상;정재영;김현철
    • 반도체디스플레이기술학회지
    • /
    • 제21권2호
    • /
    • pp.127-132
    • /
    • 2022
  • In the era of COVID-19 pandemic, COVID related keywords, news and SNS data are pouring out. With the help of the data and LDA topic modeling, we can check out what media reports about COVID-19 and vaccines. Also, we can be clear how the public reacts to the vaccine on social media and how this is related with the increasing number of COVID-19 patients. By using sentimental analysis methodology, we can get to know about the different kinds of reports that Korea media send out and get to know what kind of emotions that each media company uses in majority. Through this procedure, we can know the difference between the Korean media and the foreign ones. Ultimately, we can find and analyze the keyword that suddenly rose during the COVID-19 period throughout this research.

토픽모델링을 활용한 해운물류 뉴스 분석 (Analysis of Shipping and Logistics News Articles using Topic Modeling)

  • 윤희영;곽일엽
    • 무역학회지
    • /
    • 제46권4호
    • /
    • pp.61-76
    • /
    • 2021
  • This study focuses on three logistics-related news (Logistics Newspaper, Korea Shipping Gadget, and Korea Shipping Newspaper) in order to present changes in logistics issues, centering on Corona 19, which has recently had the greatest impact in the world. For data collection, two-year news articles in 2019 and 2020 (title, article, content, date, article classification, article URL) were collected through web crawling (using Python's BeautifulSoup, requests module) on the homepages of three representative logistics-related media companies. As for the data analysis methods, fundamental statistical analysis, Latent Dirichlet Allocation (LDA) for topic modeling, and Scattertext were performed. The analysis results were as follows. First, among the three news media related to logistics, the Korea Shipping Newspaper was carrying out the most active media activities. Second, through topic modeling with LDA, eight logistics-related topics were identified, and keywords and significant issues of each topic were presented. Third, the keywords were visually expressed through Scattertext. This is the first study to present changes in the logistics field, focusing on articles from representative logistics-related media in 2019 and 2020. In particular, 2019 and 2020 can be divided into before and after the outbreak of Corona 19, which has had a great impact not only on the logistics field but also on our lives as a whole. For future work, a multi-faceted approach is required, such as comparative studies of logistics issues between countries or presenting implications based on long-term time-series articles.

토픽모델링을 이용한 무인지상차량(UGV) 특허 동향 분석 (Patent Trend Analysis of Unmanned Ground Vehicles(UGV) using Topic Modeling)

  • 김기환;전차수;송지훈;전정환
    • 한국군사과학기술학회지
    • /
    • 제27권3호
    • /
    • pp.395-405
    • /
    • 2024
  • This study provides a thorough examination of Unmanned Ground Vehicles(UGVs), focusing on crucial technologies and trends across major global markets. It includes an in-depth patent analysis revealing the dominant positions of the United States and the European Union in this field. Additionally, it underscores substantial advancements made by China, Japan, and Korea since 2010. Using Latent Dirichlet Allocation(LDA)-based patent text mining, the study identified key technology areas in UGV development, such as advanced control systems, navigation technologies, power supply mechanisms, and sensing and communication tools. Through linear regression analysis, the study predicted the future paths of these technology areas, offering important insights into the evolving world of UGV technology. The findings can provide strategic guidance for stakeholders in the defense, commercial, and academic sectors, pointing out the future directions in UGV advancements.

텍스트마이닝을 활용한 보건의료산업학회지의 토픽 모델링 및 토픽트렌드 분석 (Analysis on Topic Trends and Topic Modeling of KSHSM Journal Papers using Text Mining)

  • 조경원;배성권;우영운
    • 보건의료산업학회지
    • /
    • 제11권4호
    • /
    • pp.213-224
    • /
    • 2017
  • Objectives : The purpose of this study was to analyze representative topics and topic trends of papers in Korean Society and Health Service Management(KSHSM) Journal. Methods : We collected English abstracts and key words of 516 papers in KSHSM Journal from 2007 to 2017. We utilized Python web scraping programs for collecting the papers from Korea Citation Index web site, and RStudio software for topic analysis based on latent Dirichlet allocation algorithm. Results : 9 topics were decided as the best number of topics by perplexity analysis and the resultant 9 topics for all the papers were extracted using Gibbs sampling method. We could refine 9 topics to 5 topics by deep consideration of meanings of each topics and analysis of intertopic distance map. In topic trends analysis from 2007 to 2017, we could verify 'Health Management' and 'Hospital Service' were two representative topics, and 'Hospital Service' was prevalent topic by 2011, but the ratio of the two topics became to be similar from 2012. Conclusions : We discovered 5 topics were the best number of topics and the topic trends reflected the main issues of KSHSM Journal, such as name revision of the society in 2012.

적응적 사용자 및 토픽 모델링 기반의 자동 TV 프로그램 추천 (Adaptive User and Topic Modeling based Automatic TV Recommendation)

  • 김은희;표신지;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.431-434
    • /
    • 2012
  • 시간 흐름에 따라 TV 프로그램 스케줄은 변화하고 스케줄의 변화는 사용자 선호에 영향을 미친다. 이러한 스케줄 변화에 따른 토픽의 흐름이 사용자 선호도에 미치는 영향 외에도, 개성에 따른 선호도의 변화는 개인별 차이가 크다. 본 논문은 사용자 선호도 변화에 적응적으로 대응하면서 시간 변화에도 일정한 관심을 보이는 사용자의 선호도에는 가중치를 더한 모델을 목표로 한다. 따라서 제안 모델은 현재의 시청 데이터를 기준으로 한 사용자별 선호도의 선행 정보(prior)로 이전 시청선호를 두었고, 선호도 변화와 일관성을 고려하여 하나의 시청길이에 대한 선호도뿐만 아니라 여러 시청 길이의 선호도를 결합한 선호도를 구성할 수 있는 확장성 있는 모델을 제시한다. 선호도의 일관성에 대한 가중치 연산에 있어 전체 확률모델의 확률을 향상시키는 연산을 통해 정교성을 더한 모델을 제시한다. 실제 사용자들이 시청한 데이터인 2011 TNMS데이터를 기준으로 제안 모델의 성능을 확인한 결과, 기존의 LDA, MDTM모델 보다 나은 성능을 보임을 확인할 수 있었으며, 1주일 단위 추천결과, 5개 추천 시, 최대 67.9%의 추천 정확도를 확인할 수 있었다.

  • PDF