• 제목/요약/키워드: latent dirichlet allocation (LDA)

검색결과 181건 처리시간 0.021초

Empowering Agriculture: Exploring User Sentiments and Suggestions for Plantix, a Smart Farming Application

  • Mee Qi Siow;Mu Moung Cho Han;Yu Na Lee;Seon Yeong Yu;Mi Jin Noh;Yang Sok Kim
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.38-46
    • /
    • 2023
  • Farming activities are transforming from traditional skill-based agriculture into knowledge-based and technology-driven digital agriculture. The use of intelligent information and communication technology introduces the idea of smart farming that enables farmers to collect weather data, monitor crop growth remotely and detect crop diseases easily. The introduction of Plantix, a pest and disease management tool in the form of a mobile application has allowed farmers to identify pests and diseases of the crop using their mobile devices. Hence, this study collected the reviews of Plantix to explore the response of the users on the Google Play Store towards the application through Latent Dirichlet Allocation (LDA) topic modeling. Results indicate four latent topics in the reviews: two positive evaluations (compliments, appreciation) and two suggestions (plant options, recommendations). We found the users suggested the application to additional plant options and additional features that might help the farmers with their difficulties. In addition, the application is expected to benefit the farmer more by having an early alert of diseases to farmers and providing various substitutes and a list of components for the remedial measures.

토픽모델링을 이용한 국내 미세먼지 연구 분류 및 연구동향 분석 (A Study on the Research Topics and Trends in South Korea: Focusing on Particulate Matter)

  • 박혜민;김태용;권대웅;허준용;이주연;양민준
    • 대한원격탐사학회지
    • /
    • 제38권5_3호
    • /
    • pp.873-885
    • /
    • 2022
  • 전 세계적으로 미세먼지(particulate matter, PM)와 사망률 및 유병률 증가의 관련성이 보고되면서 다양한 연구가 수행되었으며, 우리나라에서는 1990년대 후반을 기점으로 PM에 대한 중요성을 인식하고, PM에 대한 다양한 연구가 수행되었다. 본 연구에서는 '미세먼지' 관련 연구들의 주제를 분류하고, 각 주제별 연구 동향을 확인하기 위해 Research Information Sharing Service (RISS)에 게재된 미세먼지 관련 2,764편의 논문을 대상으로 Latent Dirichlet Allocate (LDA) 분석을 수행하였다. 연구 결과, 총 10개의 주제로 분류하는 것이 가장 적합하였으며, 미세먼지 관련 연구주제는 '미세먼지 저감(Topic 1)', '정부 정책 및 관리(Topic 2)', '미세먼지 특성(Topic 3)', '미세먼지 모델(Topic 4)', '환경교육(Topic 5)', '바이오(Topic 6)', '교통수단(Topic 7)', '황사(Topic 8)', '실내 미세먼지 오염(Topic 9)', '인체 위해성(Topic 10)'의 주제로 분류할 수 있었다. 특히, '정부 정책 및 관리(Topic 2)', '미세먼지 모델(Topic 4)', '환경교육(Topic 5)'. '바이오(Topic 6)' 관련 연구주제들이 시간에 따라 전체 논문에 대한 비율이 증가하는 추세를 보여 성행하는 것을 확인하였다(linear slope>0). 본 연구의 결과는 미세먼지 관련 다양한 분야의 연구자들에게 새로운 문헌 고찰의 방법론을 제시하고, 미세먼지 분야의 역사와 발전에 대한 이해를 제공했음에 의의가 있다.

BERTopic을 활용한 인간-로봇 상호작용 동향 연구 (A Study on Human-Robot Interaction Trends Using BERTopic)

  • 김정훈;곽기영
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.185-209
    • /
    • 2023
  • 4차 산업혁명의 도래와 함께 다양한 기술이 주목을 받고 있다. 4차 산업혁명과 관련된 기술로는 IoT(Internet of Things), 빅데이터, 인공지능, VR(Virtual Reality), 3D 프린터, 로봇공학 등이 있으며 이러한 기술은 종종 융합된다. 특히 로봇 분야는 빅데이터, 인공지능, VR, 디지털 트윈과 같은 기술과 결합할 것으로 기대된다. 이에 따라 로봇을 활용한 연구가 다수 진행되고 있으며 유통, 공항, 호텔, 레스토랑, 교통 분야 등에 적용되고 있다. 이러한 상황에서 인간-로봇 상호작용에 대한 연구가 주목을 받고 있지만 아직 만족할 만한 수준에는 이르지 못하고 있다. 하지만 완벽한 의사소통이 가능한 로봇에 대한 연구가 꾸준히 이루어지고 있고 이는 인간의 감정노동을 대신할 수 있을 것으로 기대된다. 따라서 현재의 인간-로봇 상호작용 기술을 비즈니스에 적용할 수 있는지에 대한 논의가 필요하다. 이를 위해 본 연구는 첫째, 인간로봇 상호작용 기술의 동향을 살펴본다. 둘째, LDA(Latent Dirichlet Allocation) 토픽모델링과 BERTopic 토픽모델링 방법을 비교한다. 연구 결과, 1992년~2002년 간의 연구에서는 인간-로봇 상호작용에 대한 개념과 기초적인 상호작용에 대해 논의되고 있었다. 2003년~2012년에는 사회적 표현에 대한 연구가 많이 진행되었으며 얼굴검출, 인식 등과 같이 판단과 관련된 연구도 수행되었다. 2013년~2022년에는 노인 간호, 교육, 자폐 치료와 같은 서비스 토픽들이 등장하였으며, 사회적 표현에 대한 연구가 지속되었다. 그러나 아직까지 비즈니스에 적용할 수 있는 수준에는 이르지 못한 것으로 보인다. 그리고 LDA토픽모델링과 BERTopic 토픽모델링 방법을 비교한 결과 LDA에 비해 BERTopic이 더 우수한 방법임을 확인하였다.

'우주 위험' 관련 뉴스 기사의 텍스트 마이닝 분석 연구 (Text Mining Analysis of News Articles Related to 'Space Hazard')

  • 조훈;손정주
    • 한국지구과학회지
    • /
    • 제43권1호
    • /
    • pp.224-235
    • /
    • 2022
  • 본 연구는 지난 12년간의 우주위험 관련 언론기사의 토픽모델링 분석을 통해 우주위험별 언론 보도 현황을 알아보기 위한 목적으로 수행되었다. 빅카인즈(BIGKinds)의 뉴스 플랫폼에서 2010년부터 2021년까지의 태양폭풍, 인공우주물체, 자연우주물체에 대한 우주위험 기사를 각각 1200여건 이상 수집하였으며, 키워드 분석, 잠재적 디리클레 할당모형(LDA) 분석을 수행하였다. 그 결과 태양폭풍 관련 기사는 3개의 토픽인 태양폭발이 인공위성에 미치는 영향, 우주전파센터를 중심으로 태양폭발이 우리나라 전파 통신에 미치는 영향, 항공종사자와 우주방사선의 관계로 요약되었다. 인공우주물체 관련 기사의 경우 3개의 토픽으로 인공위성과 우주정거장이 우주쓰레기로부터 위협을 받거나 그 자체가 우주쓰레기가 될 수 있다는 토픽, 영화를 통한 우주쓰레기와 인류의 관계에 대한 토픽, 우주쓰레기 추적·감시 및 처리를 위한 우주강국들의 노력이라는 토픽으로 요약되었다. 자연우주물체 관련 기사는 2개의 토픽으로 국제 우주기관의 근지구소행성에 대한 추적·감시와 충돌 대책과 소행성과 혜성 충돌을 중심으로 공룡과 포유류의 진화 및 멸종 원인으로 요약되었다. 이로부터 2010년부터 현재까지 국내 언론은 우주위험을 사회, 문화 등 다양한 영역에서 총 8개의 주제로 대중들에게 그 위험성과 경각심을 전하는 역할을 하고 있음을 확인하였으며, 이러한 결과를 기반으로 우주위험에 대한 교육방법과 교육정책의 필요성을 제언하였다.

텍스트마이닝과 ChatGPT 분석을 활용한 기업과 대중의 ESG 인식 비교: 지속가능경영보고서와 소셜미디어를 기반으로 (Comparing Corporate and Public ESG Perceptions Using Text Mining and ChatGPT Analysis: Based on Sustainability Reports and Social Media)

  • 최재훈;양성병;윤상혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.347-373
    • /
    • 2023
  • 최근 기업의 지속가능한 성장을 이끄는 ESG(Environmental, Social, and Governance) 관리의 중요성이 강조되고 있다. 이에, 본 연구는 기업과 일반 대중 간의 ESG에 대한 인식 차이를 실증적으로 밝히고, ESG 정책의 시행을 방해하는 부정적인 여론과 그 배경을 규명하는 것을 목표로 한다. 이를 위해, LDA(Latent Dirichlet Allocation) 토픽모델링, JST(Joint Sentiment Topic Modeling) 및 의미연결망분석 기법을 사용하여 지속가능경영보고서와 소셜미디어에서의 주요 키워드와 토픽, 그리고 그 연결관계를 분석하였다. 또한, ChatGPT를 활용하여, 텍스트마이닝 분석의 결과를 보완하였다. 분석 결과, 기업과 일반 대중 간 ESG에 대한 인식과 중요도에 상당한 차이가 있음을 확인하였다. 구체적으로, 기업들은 위기 관리, 투명한 지배구조, 윤리적 경영 등에 집중하여 신뢰를 구축하려 했으나, '그린워싱', '중대재해', '불매운동' 등과 같은 부정적 키워드가 자주 소셜네트워크에서 등장하여, 많은 대중들이 기업의 ESG 이슈 처리에 대해 의심하고 있음을 확인하였다. 본 연구는 기업, 정부 기관, 고객 및 투자자를 위한 ESG 전략수립에 도움이 될 수 있는 가이드라인을 제공한다는 점에서 의의가 있다.

국내 기록관리학 연구동향 분석을 위한 토픽모델링 기법 비교 - LDA와 HDP를 중심으로 - (Comparison of Topic Modeling Methods for Analyzing Research Trends of Archives Management in Korea: focused on LDA and HDP)

  • 박준형;오효정
    • 한국도서관정보학회지
    • /
    • 제48권4호
    • /
    • pp.235-258
    • /
    • 2017
  • 본 연구에서는 최근 각광을 받고 있는 텍스트마이닝 기법인 LDA 토픽모델링과 이를 변형한 HDP 토픽모델링을 적용하여 국내 기록관리학의 연구동향을 분석하고자 한다. 이를 위해 국내 기록관리학 관련 학술지 2종과 문헌정보학 관련 학술지 4종에서 1997년부터 2016년까지 발표된 기록관리학 관련 논문 1,027건을 수집하고 적절한 전처리과정을 거친 후 LDA 토픽모델링과 HDP 토픽모델링을 각각 수행하였다. 또한 토픽모델링 시각화 도구인 LDAvis를 활용하여 토픽별 거리를 가시적으로 표현하고 세부 대표 키워드를 분석하였다. 두 토픽모델링을 비교한 결과, LDA 토픽모델링은 전반적으로 해당 도메인을 대표하는 주요 키워드로 빈도수에 영향을 많이 받았으며, HDP 토픽모델링은 각 토픽별 특징을 파악할 수 있는 특수한 키워드가 많이 도출되었다. 이를 통해 LDA는 국내 기록관리학 내에 거시적으로 대표되는 주제들을, HDP는 세부 주제별 미시적인 핵심 키워드를 도출하는데 효과적임을 알 수 있었다.

Topic Modeling Analysis of Beauty Industry using BERTopic and LDA

  • YANG, Hoe-Chang;LEE, Won-Dong
    • 융합경영연구
    • /
    • 제10권6호
    • /
    • pp.1-7
    • /
    • 2022
  • Purpose: The purpose of this study is identifying the research trends of degree papers related to the beauty industry and providing information which can contribute to the development of the domestic beauty industry and the direction of various research about beauty industry. Research design, data and methodology: This study used 154 academic papers and 189 academic papers with English abstracts out of 299 academic papers. All of these papers were found by searching for the keyword "beauty industry" in ScienceON on August 15, 2022. For the analysis, BERTopic and LDA (Latent Dirichlet Allocation) analysis were conducted using Python 3.7. Also, OLS regression analysis was conducted to understand the annual increase and decrease trend of each topic derived with trend analysis. Results: As a result of word frequency analysis, the frequency of satisfaction, management, behavior, and service was found to be high. In addition, it was found that 'service', 'satisfaction' and 'customer' were frequently associated with program and relationship in the word co-occurrence frequency analysis. As a result of topic modeling, six topics were derived: 'Beauty shop', 'Health education', 'Cosmetics', 'Customer satisfaction', 'Beauty education', and 'Beauty business'. The trend analysis result of each topic confirmed that 'Beauty education' and 'Health education' are getting more attention as time goes by. Conclusions: The future studies must resolve the extreme polarization between the structure of the small beauty industry and beauty stores. Furthermore, the researches have to direct various ways to create the performance of internal personnel. The ways to maximize product capabilities such as competitive cosmetics and brands are also needed attentions.

Exploring AI Principles in Global Top 500 Enterprises: A Delphi Technique of LDA Topic Modeling Results

  • Hyun BAEK
    • 한국인공지능학회지
    • /
    • 제11권2호
    • /
    • pp.7-17
    • /
    • 2023
  • Artificial Intelligence (AI) technology has already penetrated deeply into our daily lives, and we live with the convenience of it anytime, anywhere, and sometimes even without us noticing it. However, because AI is imitative intelligence based on human Intelligence, it inevitably has both good and evil sides of humans, which is why ethical principles are essential. The starting point of this study is the AI principles for companies or organizations to develop products. Since the late 2010s, studies on ethics and principles of AI have been actively published. This study focused on AI principles declared by global companies currently developing various products through AI technology. So, we surveyed the AI principles of the Global 500 companies by market capitalization at a given specific time and collected the AI principles explicitly declared by 46 of them. AI analysis technology primarily analyzed this text data, especially LDA (Latent Dirichlet Allocation) topic modeling, which belongs to Machine Learning (ML) analysis technology. Then, we conducted a Delphi technique to reach a meaningful consensus by presenting the primary analysis results. We expect to provide meaningful guidelines in AI-related government policy establishment, corporate ethics declarations, and academic research, where debates on AI ethics and principles often occur recently based on the results of our study.

빅데이터 분석을 활용한 프리다이빙 슈트에 대한 소비자 인식 연구 (A Study of Consumer Perception on Freediving Suits Utilizing Big Data Analysis)

  • 김지은;이은영
    • 한국의상디자인학회지
    • /
    • 제26권2호
    • /
    • pp.87-99
    • /
    • 2024
  • Freediving, an underwater leisure sport that involves diving without the use of a breathing apparatus, has gained popularity among younger demographics through the viral spread of images and videos on social media platforms. This study employs prominent Big Data analysis techniques, including text mining, Latent Dirichlet Allocation (LDA) topic analysis, and opinion mining to explore the keywords associated with freediving suits over the past five years. The research aims to analyze the rapidly evolving market trends of freediving suits and the increasingly complex and diverse consumer perceptions to provide foundational data for activating the freediving suit market and developing strategies for sustained growth. The study identified the keyword 'size' related to freediving suits and conducted opinion mining on 'freediving suit sizes'. Although the results showed a higher positive than negative sentiment, negative keywords were also extracted, indicating the need to understand and mitigate the negative factors associated with 'size'. The findings offer vital guidelines for the advancement of the freediving suit market and enhancing consumer satisfaction. This study is important as it contributes foundational data for continuous growth strategies of the freediving suit market.

영상감시시스템에서 움직임의 비교사학습을 통한 비정상행동탐지 (Unsupervised Motion Learning for Abnormal Behavior Detection in Visual Surveillance)

  • 정하욱;장형진;최진영
    • 전자공학회논문지SC
    • /
    • 제48권5호
    • /
    • pp.45-51
    • /
    • 2011
  • 본 논문에서는 비교사학습법을 통해 영상의 방대한 정보를 효율적으로 모델링 하는 방법을 제안하고자 한다. 여기서 이동궤적들은 자연어 처리에 사용되는 알고리즘인 잠재 디리클레 할당 모형(Latent Dirichlet Allocation)에 의해 직진, 좌회전, 우회전등 각 상황 별로 주제에 따라 그 영역을 효과적으로 분류할 수 있다. LDA를 이용해 주제별로 의미 있는 영역을 분류한 후, 각 주제별로 분류된 궤적을 관측열로 보고 은닉 마르코프 모델(Hidden Markov Model)의 바움-웰치 알고리즘을 사용하여 학습한다. 전향 알고리즘을 사용하여 입력된 행동과 학습된 행동을 비교함으로써 영상내의 행동이 정상인지 비정상인지를 효과적으로 판단할 수 있다. 실험결과 다양한 영상에 대해 의미있는 주제별로 영역이 잘 분류되며 추적에러로 인한 궤적의 노이즈에도 강인하게 물체의 무단횡단, 신호위반과 같은 상황을 효과적으로 탐지하는 것을 확인할 수 있다.