• 제목/요약/키워드: User review classification

검색결과 54건 처리시간 0.021초

Robust Sentiment Classification of Metaverse Services Using a Pre-trained Language Model with Soft Voting

  • Haein Lee;Hae Sun Jung;Seon Hong Lee;Jang Hyun Kim
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권9호
    • /
    • pp.2334-2347
    • /
    • 2023
  • Metaverse services generate text data, data of ubiquitous computing, in real-time to analyze user emotions. Analysis of user emotions is an important task in metaverse services. This study aims to classify user sentiments using deep learning and pre-trained language models based on the transformer structure. Previous studies collected data from a single platform, whereas the current study incorporated the review data as "Metaverse" keyword from the YouTube and Google Play Store platforms for general utilization. As a result, the Bidirectional Encoder Representations from Transformers (BERT) and Robustly optimized BERT approach (RoBERTa) models using the soft voting mechanism achieved a highest accuracy of 88.57%. In addition, the area under the curve (AUC) score of the ensemble model comprising RoBERTa, BERT, and A Lite BERT (ALBERT) was 0.9458. The results demonstrate that the ensemble combined with the RoBERTa model exhibits good performance. Therefore, the RoBERTa model can be applied on platforms that provide metaverse services. The findings contribute to the advancement of natural language processing techniques in metaverse services, which are increasingly important in digital platforms and virtual environments. Overall, this study provides empirical evidence that sentiment analysis using deep learning and pre-trained language models is a promising approach to improving user experiences in metaverse services.

Application of Topic Modeling Techniques in Arabic Content: A Systematic Review

  • Maram Alhmiyani;Huda Alhazmi
    • International Journal of Computer Science & Network Security
    • /
    • 제23권6호
    • /
    • pp.1-12
    • /
    • 2023
  • With the rapid increase of user generated data on digital platforms, the task of categorizing and classifying theses huge data has become difficult. Topic modeling is an unsupervised machine learning technique that can be used to get a summary from a large collection of documents. Topic modeling has been widely used in English content, yet the application of topic modeling in Arabic language is limited. Therefore, the aim of this paper is to provide a systematic review of the application of topic modeling algorithms in Arabic content. Using a well-known and trusted databases including ScienceDirect, IEEE Xplore, Springer Link, and Google Scholar. Considering the publication date from 2012 to 2022, we got 60 papers. After refining the papers based on predefined criteria, we resulted in 32 papers. Our result show that unfortunately the application of topic modeling techniques in Arabic content is limited.

감성분석과 Word2vec을 이용한 비정형 품질 데이터 분석 (Informal Quality Data Analysis via Sentimental analysis and Word2vec method)

  • 이진욱;유국현;문병민;배석주
    • 품질경영학회지
    • /
    • 제45권1호
    • /
    • pp.117-128
    • /
    • 2017
  • Purpose: This study analyzes automobile quality review data to develop alternative analytical method of informal data. Existing methods to analyze informal data are based mainly on the frequency of informal data, however, this research tries to use correlation information of each informal data. Method: After sentimental analysis to acquire the user information for automobile products, three classification methods, that is, $na{\ddot{i}}ve$ Bayes, random forest, and support vector machine, were employed to accurately classify the informal user opinions with respect to automobile qualities. Additionally, Word2vec was applied to discover correlated information about informal data. Result: As applicative results of three classification methods, random forest method shows most effective results compared to the other classification methods. Word2vec method manages to discover closest relevant data with automobile components. Conclusion: The proposed method shows its effectiveness in terms of accuracy and sensitivity on the analysis of informal quality data, however, only two sentiments (positive or negative) can be categorized due to human errors. Further studies are required to derive more sentiments to accurately classify informal quality data. Word2vec method also shows comparative results to discover the relevance of components precisely.

Multi-channel Long Short-Term Memory with Domain Knowledge for Context Awareness and User Intention

  • Cho, Dan-Bi;Lee, Hyun-Young;Kang, Seung-Shik
    • Journal of Information Processing Systems
    • /
    • 제17권5호
    • /
    • pp.867-878
    • /
    • 2021
  • In context awareness and user intention tasks, dataset construction is expensive because specific domain data are required. Although pretraining with a large corpus can effectively resolve the issue of lack of data, it ignores domain knowledge. Herein, we concentrate on data domain knowledge while addressing data scarcity and accordingly propose a multi-channel long short-term memory (LSTM). Because multi-channel LSTM integrates pretrained vectors such as task and general knowledge, it effectively prevents catastrophic forgetting between vectors of task and general knowledge to represent the context as a set of features. To evaluate the proposed model with reference to the baseline model, which is a single-channel LSTM, we performed two tasks: voice phishing with context awareness and movie review sentiment classification. The results verified that multi-channel LSTM outperforms single-channel LSTM in both tasks. We further experimented on different multi-channel LSTMs depending on the domain and data size of general knowledge in the model and confirmed that the effect of multi-channel LSTM integrating the two types of knowledge from downstream task data and raw data to overcome the lack of data.

Web에서의 협력 환경 구축 방안 연구 (A Study on the Construction Method of Collaboration Environment for Web)

  • 이재호
    • 정보교육학회논문지
    • /
    • 제1권1호
    • /
    • pp.74-81
    • /
    • 1997
  • 현재 World Wide Web (이하 Web) 자체를 일반 사용자들이 인터넷으로 인식하고 있는 상황에서 잘못된 정보의 전달은 매우 큰 문제이며, 이것은 존재하는 정보를 잘못 가공하는 데에서 기인하게 된다. 잘못 가공된 정보의 전달을 방지하는 방법으로 여러가지가 있으나, 이중 가장 대표적인 것으로 인식되는 것이 바로 CSCW이다. CSCW 환경은 클라이언트-서버 환경과 같은 단일 시스템에서의 공동 작업 공간을 다중의 사용자에게 제공하여 주는 것으로 인터넷 또는 인트라넷 환경과 같은 분산 공유 정보 시스템 환경 즉, 다중의 이질적인 시스템과 다중 사용자 환경에서 사용시는 다수의 추가적 요소를 필요로 하게 된다. 이러한 문제점을 해결하려는 것이 협력으로 폐쇄적인 인터넷인 인트라넷에서의 이질적인 전산환경 특히, 교육, 생산, 마케팅 분야 및 정부에서 사용시 많은 이점이 있다. 본 논문에서는 현재 협력의 골격이 되는 CSCW, 그룹 웨어등의 개념을 먼저 살펴보고, 다음으로 협력의 정의와 분류, 문제점 분석, 그리고 Web에서의 협력 환경 구축 방안에 대하여 기술하겠다.

  • PDF

온라인 고객 리뷰의 분류 항목별 차이 분석: 채널, 제품속성, 가격을 중심으로 (Analysis of Differences between On-line Customer Review Categories: Channel, Product Attributes, and Price Dimensions)

  • 양소영;김형수;김영걸
    • Asia Marketing Journal
    • /
    • 제10권2호
    • /
    • pp.125-151
    • /
    • 2008
  • 기업과 소비자 간의 온라인 커뮤니케이션 활성화로 인하여 기업과 소비자 모두 제품에 대한 경험과 지식을 공유하는 온라인 고객 리뷰에 많은 관심을 기울이고 있다. 본 연구에서는 내용 분석법을 통해 온라인 소비자 리뷰들을 맥락단위로 분류하고 분류항목을 도출함으로써 채널(자사홈페이지/쇼핑몰), 제품속성(탐색재/경험재), 가격(고가/저가)에 따른 차이 분석을 시행하였다. 분류 항목의 도출은 ACSI 모델의 구성 항목들을 근간으로 실제 리뷰의 반복적 분류를 통해 이루어졌으며 총 3단계로 나누어졌다. 1단계에서는 일단 제품과 서비스로 분류하고, 2단계에서는 제품에 대해서 기능, 디자인, 가격, 구매동기, 제안/사용팁, 그리고 추천/재구매를, 그리고 서비스에 대해서 AS/업그레이드, 배송/기타제조사와 유통사 등 총 8개 분류 항목을 도출하였으며, 3단계에서는 실제 제품 리뷰 내용을 바탕으로 2단계 분류 항목의 세부항목으로 작성되었다. 분류 항목별 차이 분석 결과, 총 8개의 분류 항목에서 모두 유의한 차이점을 보였는데, 특히 채널별 차이를 보기 위해 분석한 홈페이지와 쇼핑몰에서의 리뷰 내용이 가장 두드러진 차이를 보이고 있었다. 한편, 쇼핑몰의 특성을 나타내는 가격과 배송/기타 서비스 항목을 제외하고는 맥락단위의 개수가 홈페이지에서 더 많이 나타남으로써 기업 홈페이지 상의 소비자 리뷰가 쇼핑몰 상의 소비자 리뷰보다 더욱 상세하다는 것을 알 수 있었다. 제품에 대한 만족도 역시 홈페이지의 리뷰에서 더 큰 것으로 나타났으며, 탐색재와 경험재로 나누어 보았을 때 디자인, 구매동기, 추천/재구매, AS/업그레이드 서비스, 그리고 배송/기타 서비스 항목에서 서로간의 차이가 있었으나, 전반적인 만족도의 차이는 없었다. 또한, 가격별로 보았을 때는 디자인, 가격, AS/업그레이드 서비스에서 고가와 저가의 차이를 볼 수 있었으나 전반적인 만족도의 차이는 없었다.

  • PDF

화장품 물체 인식을 위한 Two-Stage 딥러닝 기반 알고리즘 (Two-Stage Deep Learning Based Algorithm for Cosmetic Object Recognition)

  • 김종민;서대호
    • 산업경영시스템학회지
    • /
    • 제46권4호
    • /
    • pp.101-106
    • /
    • 2023
  • With the recent surge in YouTube usage, there has been a proliferation of user-generated videos where individuals evaluate cosmetics. Consequently, many companies are increasingly utilizing evaluation videos for their product marketing and market research. However, a notable drawback is the manual classification of these product review videos incurring significant costs and time. Therefore, this paper proposes a deep learning-based cosmetics search algorithm to automate this task. The algorithm consists of two networks: One for detecting candidates in images using shape features such as circles, rectangles, etc and Another for filtering and categorizing these candidates. The reason for choosing a Two-Stage architecture over One-Stage is that, in videos containing background scenes, it is more robust to first detect cosmetic candidates before classifying them as specific objects. Although Two-Stage structures are generally known to outperform One-Stage structures in terms of model architecture, this study opts for Two-Stage to address issues related to the acquisition of training and validation data that arise when using One-Stage. Acquiring data for the algorithm that detects cosmetic candidates based on shape and the algorithm that classifies candidates into specific objects is cost-effective, ensuring the overall robustness of the algorithm.

U-City 주거 환경 서비스의 사용자 가치 분석 : 스마트 홈을 중심으로 (User Requirement Elicitation for U-City Residential Environment : Concentrated on Smart Home Service)

  • 김향숙;김효창;지용구
    • 한국전자거래학회지
    • /
    • 제20권1호
    • /
    • pp.167-182
    • /
    • 2015
  • 고령자, 장애인의 삶의 질을 유지시키기 위한 방법 중 하나로 주목받고 있는 미래의 주거 형태인 스마트 홈은 인간 생활 전반을 지원하기 위한 다양한 기능적 공간이 융합된 곳으로서, 삶의 질에 크게 영향을 끼칠 잠재력을 가진 공간이다. 따라서 삶의 공간에서 만족도를 높이기 위해 사용자의 실제 니즈를 반영하는 것이 매우 중요하며, 스마트 홈 내의 사용자 가치에 대한 연구는 활발히 이루어져 왔다. 그러나 광범위한 스마트 홈 서비스를 명확히 분류하고 서비스 특성에 따라 요구되는 사용자 가치를 제시한 연구는 아직 부족한 실정이다. 이에 본 연구는 스마트 홈 서비스를 사용자 관점에서 분류하고, 서비스의 특성에 따라 요구되는 사용자 가치를 규명하는 것을 목적으로 하였다. 이를 위해 문헌 연구를 통하여 사용자 중심적 관점에서 스마트 홈을 정의하고 이를 토대로 스마트 홈의 기능 및 서비스 분류 체계를 수립하였다. 또한 스마트 홈 서비스의 기술, 서비스 영역에서의 사용자 요구가치를 도출하고, 앞서 수립된 서비스 분류 체계와의 연관관계를 도출하였다. 본 연구를 통해 추후 스마트 홈 서비스 개발에 있어서 사용자에 대한 더 깊은 이해가 가능하도록 도울 수 있다는 의의가 있다.

고등학생의 학습양식과 학교도서관 이용능력의 관계에 대한 연구 (A Study on the Relationship Between Learning Style of High School Student and School Library Skills)

  • 이승길
    • 한국도서관정보학회지
    • /
    • 제42권3호
    • /
    • pp.229-249
    • /
    • 2011
  • 본 연구에서는 인지적 학습양식과 도서관 이용능력과의 관계를 분석해 보았다. 문헌연구를 통해서 학습양식과 도서관 이용능력을 구성하고 있는 요소들을 추출했다. 어느 학습양식에 속하는지 파악하고 도서관 이용능력과의 관계를 T-test를 통하여 검증하였다. 연구결과 전체적 학습양식 유형과 도서관 이용능력의 구성요소인 도서분류에 대한 이해정도, 참고정보원의 이용수준, 도서 구성요소의 이해수준에서 유의미한 관계가 있었다. 따라서 이용자교육을 할 때 각각의 학습양식 유형을 고려해야 하겠다.

다중 센서 데이터 분석을 이용한 동적보정점 결정 기법 (A Dynamic Configuration of Calibration Points using Multidimensional Sensor Data Analysis)

  • 김병섭;김재훈
    • 경영과학
    • /
    • 제33권1호
    • /
    • pp.49-58
    • /
    • 2016
  • Focusing on the drastic increase of smart devices, machine generated data expansion is a general phenomenon in network services and IoT (Internet of Things). Especially, built-in multi sensors in a smart device are used for collection of user status and moving data. Combining the internal sensor data and environmental information, we can determine landmarks that decide a pedestrian's locations. We use an ANOVA method to analyze data acquired from multi sensors and propose a landmark classification algorithm. We expect that the proposed algorithm can achieve higher accuracy of indoor-outdoor positioning system for pedestrians.