• 제목/요약/키워드: Dirichlet problems

검색결과 69건 처리시간 0.027초

사용자 리뷰 데이터를 활용한 모바일 어플리케이션 서비스 평가 척도 개선 (Improving evaluation metric of mobile application service with user review data)

  • 이범국;손창호
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.380-386
    • /
    • 2020
  • 모바일 어플리케이션 시장은 스마트폰의 등장 이후로 지난 10여 년의 성장을 통해 전자기기 소프트웨어 시장에서 가장 큰 시장을 보유하게 되었다. 모바일 어플리케이션 시장의 경쟁이 심화됨에 따라, 사용자의 소비와 사용 양태에 어플리케이션 평가가 끼치는 영향력 역시 큰 폭으로 상승하였다. 이에 따라 모바일 어플리케이션을 평가하기 위한 척도에 관한 연구들이 진행됐으나, 대부분의 연구가 전문가 중심의 인터뷰 또는 설문조사와 같은 정성적인 방법에 의존하였다. 또한, 서비스 사용자의 관점이 아닌 서비스 제공자의 관점에서 평가 척도가 구성되고 있다. 하지만 최근에는 대량의 사용자 리뷰(User Review) 데이터를 통해 실제 사용자들의 어플리케이션 평가의 정량적 분석이 가능해짐에 따라, 연구자의 주관성을 최소화하는 어플리케이션 영역별 분석의 가능성이 커지고 있다. 따라서 본 연구에서는 사용자 리뷰 데이터를 활용하여 모바일 어플리케이션들에 대한 기존의 품질 평가에 대한 문제점을 보완할 수 있는 방법론을 제시하고자 한다. 이를 위해 토픽모델링 기법인 LDA(Latent Dirichlet allocation)을 적용하여, 기존의 평가 척도를 사용자 관점에서 개선하는 방법을 제안한다. 본 연구를 통해 서비스 제공자 및 연구자의 주관성으로 인한 서비스 평가의 편향을 줄이고, 소비자 관점의 모바일 어플리케이션 영역별 평가 척도를 제공할 것으로 예상된다.

스마트 관광 활성화를 위한 트립어드바이저 애플리케이션 리뷰 분석 : 토픽 모델링을 중심으로 (Analyzing TripAdvisor application reviews to enable smart tourism : focusing on topic modeling)

  • 이유나;한무명초;유선영;소미기;노미진
    • 스마트미디어저널
    • /
    • 제12권8호
    • /
    • pp.9-17
    • /
    • 2023
  • 정보통신의 발달과 스마트 기기의 발전 및 보급 향상은 관광 형태의 변화를 야기하였고, 이후 스마트 관광이라는 개념이 등장하였다. 이에 스마트 관광 정책 및 설문에 관한 연구가 진행되고 있으나 애플리케이션 리뷰에 관한 연구는 미비한 편이다. 본 연구는 구글 플레이 스토어 내 스마트 관광 분야의 대표적인 애플리케이션인 트립어드바이저 애플리케이션 리뷰 데이터를 수집하여 LDA(Latent Dirichlet Allocation) 토픽 모델링을 통해 사용 용도와 사용자 만족을 파악하고자 한다. 분석 결과 4개의 토픽이 도출되었으며 2개의 토픽에서는 긍정적인 평가를 나머지 2개의 토픽에서는 부정적인 평가를 하고 있었다. 사용자들은 해당 애플리케이션의 숙박 및 관광 명소 추천 시스템에 만족하고 있음을 알 수 있었으며 검색 시 설정한 필터가 적용되지 않거나 업데이트 후 리뷰가 게시되지 않음에 불편을 겪고 있음을 알 수 있었다. 이에 다양한 추천 카테고리를 애플리케이션에 추가하여 사용자에게 다양한 경험을 제공하는 것이 만족도 향상에 도움이 될 것으로 기대된다. 또한 필터 기능을 포함한 애플리케이션 문제를 파악하여 애플리케이션 환경 점검과 해당 기능 오류 개선을 한다면 사용자 만족도를 향상시킬 수 있을 것으로 기대된다.

정부24 앱 사용자 리뷰 분석을 통한 문제 파악 및 개선방안: 토픽 모델을 통한 통찰 (Problem Identification and Improvement Measures through Government24 App User Review Analysis: Insights through Topic Model)

  • 한무명초;노미진
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.27-35
    • /
    • 2023
  • 4차 산업혁명과 코로나19 대유행의 영향으로 비대면 환경이 활성화되면서, 정부24 앱을 활용한 민원 서비스 이용량이 급증하고 있다. 따라서 공공 앱에 대한 사용자들의 불만과 개선 요구도 늘어나고 있으며 이에 대한 체계적인 관리가 필요하다. 본 연구의 목적은 정부24 앱 사용자의 불만 사항을 분석하여 민원인의 불만 현황을 파악하고 개선방안을 제시하는 것이다. 구글 플레이 스토어에서 2013년 5월 2일부터 2023년 6월 30일까지 데이터 6,344건을 수집하였으며, 이 중 평점이 1점이면서 '좋아요(thumbsUp)'를 1회 이상 받은 1,199건의 데이터를 토픽 모델 분석에 사용하였다. 분석 결과 '증명서 발급 문제', '사이트 작동 및 UI 문제', '사용자 아이디 관련 문제', '업데이트 문제', '공무원의 앱 관리 문제', '예산 낭비 문제((별 한 개도 or 세금이) 아깝다)', '비밀번호 관련 문제'라는 총 7개의 토픽을 추출하였다. 또한, 전체 토픽은 2021년까지 증가세를 보이다가 2022년에는 약간 감소하였으나 2023년에 다시 증가하는 추세를 보여 업데이트와 관리가 매우 시급하다. 본 연구의 결과가 현재 공공 앱의 문제점을 파악하여 앞으로 민원인이 만족하는 공공 앱 개발 및 관리에 도움이 되기를 기대한다.

생물/보건/의학 연구를 위한 비모수 베이지안 통계모형 (Nonparametric Bayesian Statistical Models in Biomedical Research)

  • 노희상;박진수;심규석;유재은;정연승
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.867-889
    • /
    • 2014
  • 비모수 베이지안 통계 모형은 그 유연성과 계산의 편리성으로 인해 최근 다양한 분야에서 응용되고 있는데, 본 논문에서는 생물/의학/보건 연구에서 사용되는 비모수 베이지안 통계 모형에 대해서 개괄하였다. 본 논문에서는 비모수 베이지안 통계 모델링에서 핵심적으로 사용되는 확률모형들을 소개하고, 다양한 예제들을 통하여 그 모형들이 어떻게 사용되는지 이해를 돕도록 하였다. 특별히, 논의된 예제들은 모수적 통계 모형으로 고찰하기에는 한계가 있는 연구가설들을 포함하고 있어 모수적 모형의 한계점을 지적하고 비모수적 베이지안 모형의 필요성을 강조하는 것들로 정하였다. 크게 확률밀도함수 추정, 군집분석, 임의효과 분포의 추정, 그리고 회귀분석의 4가지 주제로 분류하여 살펴보았다.

인문사회 과학기술 분야 연구의 학제적 동향 분석 : 토픽 모델링과 네트워크 분석의 활용 (Identifying Interdisciplinary Trends of Humanities, Sociology, Science and Technology Research in Korea Using Topic Modeling and Network Analysis)

  • 최재웅;장재혁;김대환;윤장혁
    • 산업경영시스템학회지
    • /
    • 제42권1호
    • /
    • pp.74-86
    • /
    • 2019
  • As many existing research fields are matured academically, researchers have encountered numbers of academic, social and other problems that cannot be addressed by internal knowledge and methodologies of existing disciplines. Earlier, pioneers of researchers thus are following a new paradigm that breaks the boundaries between the prior disciplines, fuses them and seeks new approaches. Moreover, developed countries including Korea are actively supporting and fostering the convergence research at the national level. Nevertheless, there is insufficient research to analyze convergence trends in national R&D support projects and what kind of content the projects mainly deal with. This study, therefore, collected and preprocessed the research proposal data of National Research Foundation of Korea, transforming the proposal documents to term-frequency matrices. Based on the matrices, this study derived detailed research topics through Latent Dirichlet Allocation, a kind of topic modeling algorithm. Next, this study identified the research topics each proposal mainly deals with, visualized the convergence relationships, and quantitatively analyze them. Specifically, this study analyzed the centralities of the detailed research topics to derive clues about the convergence of the near future, in addition to visualizing the convergence relationship and analyzing time-varying number of research proposals per each topic. The results of this study can provide specific insights on the research direction to researchers and monitor domestic convergence R&D trends by year.

COVID-19 '덕분에 챌린지' 전후 간호사 관련 뉴스 기사의 토픽 모델링 및 키워드 네트워크 분석 (Topic Modeling and Keyword Network Analysis of News Articles Related to Nurses before and after "the Thanks to You Challenge" during the COVID-19 Pandemic)

  • 윤은경;김정옥;변혜민;이국근
    • 대한간호학회지
    • /
    • 제51권4호
    • /
    • pp.442-453
    • /
    • 2021
  • Purpose: This study was conducted to assess public awareness and policy challenges faced by practicing nurses. Methods: After collecting nurse-related news articles published before and after 'the Thanks to You Challenge' campaign (between December 31, 2019, and July 15, 2020), keywords were extracted via preprocessing. A three-step method keyword analysis, latent Dirichlet allocation topic modeling, and keyword network analysis was used to examine the text and the structure of the selected news articles. Results: Top 30 keywords with similar occurrences were collected before and after the campaign. The five dominant topics before the campaign were: pandemic, infection of medical staff, local transmission, medical resources, and return of overseas Koreans. After the campaign, the topics 'infection of medical staff' and 'return of overseas Koreans' disappeared, but 'the Thanks to You Challenge' emerged as a dominant topic. A keyword network analysis revealed that the word of nurse was linked with keywords like thanks and campaign, through the word of sacrifice. These words formed interrelated domains of 'the Thanks to You Challenge' topic. Conclusion: The findings of this study can provide useful information for understanding various issues and social perspectives on COVID-19 nursing. The major themes of news reports lagged behind the real problems faced by nurses in COVID-19 crisis. While the press tends to focus on heroism and whole society, issues and policies mutually beneficial to public and nursing need to be further explored and enhanced by nurses.

토픽 모델링을 활용한 스마트시티 연구동향 분석 (A Study on the Research Trends for Smart City using Topic Modeling)

  • 박건철;이치형
    • 인터넷정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.119-128
    • /
    • 2019
  • 본 연구의 목표는 스마트시티에 대한 연구 동향을 파악하고 이를 바탕으로 스마트시티에 대한 정책적 산업적 학술적 방향성을 제시하는 데 있다. 산업화와 더불어 급격하게 진행된 도시화 및 도시인구 증가로 세계 주요 도시들은 대부분 교통, 환경, 주거 등 다양한 도시문제에 직면하고 있다. 세계 각 도시는 이러한 도시문제를 해결하여 시민 삶의 질을 향상시킨다는 공통된 목표를 추구하기 위해 스마트시티의 도입을 서두르고 있다. 하지만 스마트시티에 대한 다양한 개념적 접근은 정책 목표 설정 및 추진전략 수립을 위한 방향성 도출에 불확실성을 야기하고 있다. 본 연구는 이러한 문제 인식하에 스마트시티 정책에 대한 방향성을 제시하고자 Scopus DB 및 Springer DB에서 스마트시티와 관련된 학술논문 11,527건의 제목과 초록, 발행연도 등의 정보를 수집하여 연구현황, 연구주제, 연구분야 추이 등을 LDA기반 토픽모델링 기법을 활용하여 분석하였다. 분석결과, 스마트시티 관련 연구주제는 크게 서비스 및 애플리케이션 분야, 기술 분야, 시민 사용자 관점의 8가지 세부주제로 유형화되었으며, 이중 '시민중심 스마트시티 추진을 통한 지속가능성의 확보'와 관련된 주제가 가장 많이 언급된 주제로 분석되었다. 또한 주제 간 연관관계를 분석한 결과, 데이터와 프라이버시 관련 연구의 중심성이 가장 높게 나타났다. 이는 데이터가 전반적인 스마트시티의 공동기반으로서 역할을 하며 기술, 서비스, 정책과 관련된 다양한 의사결정에 영향을 미치는 한편, 위치정보 등 개인 정보가 수집되는 과정에서 프라이버시 침해 등이 잠재적인 위협요인이 될 수 있음을 암시한다. 스마트시티 연구현황에 대한 객관적 분석을 통해 스마트시티 개념의 발전 방향을 이해하고 향후 대응방안을 모색함으로써, 스마트시티 추진 및 연구에 정책적, 산업적, 학술적 근거자료를 제공할 수 있을 것으로 기대된다.

Public Sentiment Analysis and Topic Modeling Regarding COVID-19's Three Waves of Total Lockdown: A Case Study on Movement Control Order in Malaysia

  • Alamoodi, A.H.;Baker, Mohammed Rashad;Albahri, O.S.;Zaidan, B.B.;Zaidan, A.A.;Wong, Wing-Kwong;Garfan, Salem;Albahri, A.S.;Alonso, Miguel A.;Jasim, Ali Najm;Baqer, M.J.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권7호
    • /
    • pp.2169-2190
    • /
    • 2022
  • The COVID-19 pandemic has affected many aspects of human life. The pandemic not only caused millions of fatalities and problems but also changed public sentiment and behavior. Owing to the magnitude of this pandemic, governments worldwide adopted full lockdown measures that attracted much discussion on social media platforms. To investigate the effects of these lockdown measures, this study performed sentiment analysis and latent Dirichlet allocation topic modeling on textual data from Twitter published during the three lockdown waves in Malaysia between 2020 and 2021. Three lockdown measures were identified, the related data for the first two weeks of each lockdown were collected and analysed to understand the public sentiment. The changes between these lockdowns were identified, and the latent topics were highlighted. Most of the public sentiment focused on the first lockdown as reflected in the large number of latent topics generated during this period. The overall sentiment for each lockdown was mostly positive, followed by neutral and then negative. Topic modelling results identified staying at home, quarantine and lockdown as the main aspects of discussion for the first lockdown, whilst importance of health measures and government efforts were the main aspects for the second and third lockdowns. Governments may utilise these findings to understand public sentiment and to formulate precautionary measures that can assure the safety of their citizens and tend to their most pressing problems. These results also highlight the importance of positive messaging during difficult times, establishing digital interventions and formulating new policies to improve the reaction of the public to emergency situations.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).