• 제목/요약/키워드: Star Rating

검색결과 39건 처리시간 0.024초

F_MixBERT: Sentiment Analysis Model using Focal Loss for Imbalanced E-commerce Reviews

  • Fengqian Pang;Xi Chen;Letong Li;Xin Xu;Zhiqiang Xing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권2호
    • /
    • pp.263-283
    • /
    • 2024
  • Users' comments after online shopping are critical to product reputation and business improvement. These comments, sometimes known as e-commerce reviews, influence other customers' purchasing decisions. To confront large amounts of e-commerce reviews, automatic analysis based on machine learning and deep learning draws more and more attention. A core task therein is sentiment analysis. However, the e-commerce reviews exhibit the following characteristics: (1) inconsistency between comment content and the star rating; (2) a large number of unlabeled data, i.e., comments without a star rating, and (3) the data imbalance caused by the sparse negative comments. This paper employs Bidirectional Encoder Representation from Transformers (BERT), one of the best natural language processing models, as the base model. According to the above data characteristics, we propose the F_MixBERT framework, to more effectively use inconsistently low-quality and unlabeled data and resolve the problem of data imbalance. In the framework, the proposed MixBERT incorporates the MixMatch approach into BERT's high-dimensional vectors to train the unlabeled and low-quality data with generated pseudo labels. Meanwhile, data imbalance is resolved by Focal loss, which penalizes the contribution of large-scale data and easily-identifiable data to total loss. Comparative experiments demonstrate that the proposed framework outperforms BERT and MixBERT for sentiment analysis of e-commerce comments.

Rating Prediction by Evaluation Item through Sentiment Analysis of Restaurant Review

  • So, Jin-Soo;Shin, Pan-Seop
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.81-89
    • /
    • 2020
  • 우리가 SNS상에서 흔하게 접하는 온라인 리뷰에는, 소비자들의 선호도에 영향을 미치는 다양한 평가정보가 복합적으로 포함되어 있지만 이를 매우 간단한 형태의 수치(또는 평점)로 제공하는 것이 일반적이다. 이러한 리뷰에서, 소비자가 원하는 구체적인 정보를 얻고, 이를 구매를 위한 판단에 활용하기란 쉽지 않다. 따라서 본 연구에서는 한국어로 작성된 음식점 리뷰를 대상으로, 감성분석을 수행하여 평가항목별로 세분화된 평점을 제공 가능한 예측 방법론을 제안한다. 이를 위해, 음식점의 주요 평가항목으로 '음식', '가격', '서비스', '분위기'를 선정하고, 평가항목별 맞춤형 감성사전을 새롭게 구축한다. 또한 평가항목별 리뷰 문장을 분류하고 감성분석을 통해 세분화된 평점을 예측하여 소비자가 의사결정에 활용 가능한 추가적인 정보를 제공한다. 마지막으로, MAE와 RMSE를 평가지표로 사용하여 기존의 연구보다 제안기법의 평점 예측 정확도가 향상되었음을 보이며, 제안 방법론의 활용 사례도 제시한다.

온라인 구전량 및 평점과 시기별 영화 흥행과의 관계 (The Periodic Relationship between eWOM Volume/Valence and Box Office Revenue)

  • 장리;최강준;이재영
    • 지식경영연구
    • /
    • 제18권2호
    • /
    • pp.65-83
    • /
    • 2017
  • Word-of-mouth (WOM), the communication between consumers offline, has transformed to include electronic word-of-mouth(eWOM), which has grown in its influence due to the advancements in communication technology. Despite the fact that many researchers have studied the impact of WOM and eWOM on the performance of movies in the movie industry, there still exists much controversy. Therefore, this study investigates the relationship of eWOM's volume and valence with the box office revenue for 2 years in Korean movies industry. The results show that the volume of eWOM, which is expected to related to awareness diffusion, is more important than the valence in the early stage of movie release. And in the later stage, the valence of eWOM which is expected to related to persuasion effect influences the box office revenue. In addition, the relationship of the volume and valence on box office revenue in both early and later stage can be increased through the interaction with the star power which raises the familiarity or the movie genre which causes the high arousal.

텍스트 마이닝을 통한 한국과 중국 시내면세점 만족 속성과 소비자 평점에 미치는 영향 분석 -중국인 관광객을 중심으로 (A Text Mining Analysis of Attributes for Satisfaction and Effect of Consumer Ratings to Korea and China Duty Free Stores - Focusing on Chinese Tourists -)

  • 양다솜;김종욱
    • 디지털융복합연구
    • /
    • 제18권8호
    • /
    • pp.1-9
    • /
    • 2020
  • 본 연구에서는 중국 최대 온라인 리뷰 사이트인 Dazhong Dianping에서 중국인 관광객들은 한국과 중국 시내 면세점의 어떠한 속성들을 중요하게 생각하며 어떠한 Cluster들이 별점 점수(만족도)에 영향을 미치는지에 대해 알아보고자 하였다. 따라서 한국 시내면세점 리뷰 5,659개 중국 산야 시내면세점 리뷰 4,051개 총 9,710개를 R을 활용하여 텍스트 마이닝 분석하였다. 분석 결과, 한국 시내 면세점에서는 Sale, Membership, Food가 총 별점에 정(+)의 영향을 미치는 것으로 나타났다. 중국 시내면세점에서 Sale, Product, Airport, Food, Membership이 총 별점에 정(+)의 영향을 미치는 것으로 나타났다. 면세점 만족도 속성 중 Food라는 속성을 발견하면서 면세점 쇼핑 중 이용할 수 있는 식당 등의 편의 시설 공간을 제공하는 것이 중요함을 알 수 있었다. 이는 면세점 선택 및 만족의 새로운 속성을 찾았다는 점에 기인하여 연구를 확장시킬 수 있었다. 실무적으로 면세점 종사자들에게 식당 등의 편의시설 공간 제공이 중요함을 인식시킬 수 있었다.

The Detection of Well-known and Unknown Brands' Products with Manipulated Reviews Using Sentiment Analysis

  • Olga Chernyaeva;Eunmi Kim;Taeho Hong
    • Asia pacific journal of information systems
    • /
    • 제31권4호
    • /
    • pp.472-490
    • /
    • 2021
  • The detection of products with manipulated reviews has received widespread research attention, given that a truthful, informative, and useful review helps to significantly lower the search effort and cost for potential customers. This study proposes a method to recognize products with manipulated online customer reviews by examining the sequence of each review's sentiment, readability, and rating scores by product on randomness, considering the example of a Russian online retail site. Additionally, this study aims to examine the association between brand awareness and existing manipulation with products' reviews. Therefore, we investigated the difference between well-known and unknown brands' products online reviews with and without manipulated reviews based on the average star rating and the extremely positive sentiment scores. Consequently, machine learning techniques for predicting products are tested with manipulated reviews to determine a more useful one. It was found that about 20% of all product reviews are manipulated. Among the products with manipulated reviews, 44% are products of well-known brands, and 56% from unknown brands, with the highest prediction performance on deep neural network.

Multi-channel CNN 기반 온라인 리뷰 유용성 예측 모델 개발에 관한 연구 (A multi-channel CNN based online review helpfulness prediction model)

  • 이흠철;윤효림;이청용;김재경
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.171-189
    • /
    • 2022
  • 온라인 리뷰는 소비자의 구매 의사결정 과정에서 중요한 역할을 담당하고 있으므로 소비자에게 유용하고 신뢰성이 있는 리뷰를 제공하는 것이 중요하다. 기존의 온라인 리뷰 유용성 예측 관련 연구는 주로 온라인 리뷰의 텍스트와 평점 정보 간의 일관성을 바탕으로 리뷰 유용성을 예측하였다. 그러나 기존 연구는 평점 정보를 스칼라로 표현했기 때문에 표현 수용력이 제한적이거나 평점 정보와 리뷰 텍스트 정보와의 상호작용을 제한적으로 학습하는 한계가 존재한다. 본 연구에서는 기존 연구의 한계점을 보완하기 위해 리뷰 텍스트와 평점 정보 간의 상호작용을 효과적으로 학습할 수 있는 CNN-RHP(CNN based Review Helpfulness Prediction) 모델을 제안하였다. 먼저, 리뷰 텍스트의 의미론적 특성을 추출하기 위해 multi-channel CNN을 적용하였다. 다음으로, 평점 정보는 텍스트 특성과 동일한 차원을 나타내는 독립된 고차원 임베딩 특성 벡터로 변환하였다. 최종적으로 요소별(Element-wise) 연산을 통해 리뷰 텍스트와 평점 정보 간의 일관성을 학습하였다. 본 연구에서는 제안된 CNN-RHP 모델의 성능을 평가하기 위해 Amazom.com에서 수집된 온라인 소비자 리뷰를 사용하였다. 실험 결과, 본 연구에서 제안한 CNN-RHP 모델이 기존 연구에서 제안된 여러 모델과 비교했을 때 우수한 예측 성능을 나타내는 것을 확인하였다. 본 연구의 결과는 온라인 전자상거래 플랫폼에서 소비자들에게 리뷰 유용성 예측 서비스를 제공할 때 유의미한 시사점을 제공할 수 있다.

치킨 리뷰의 이면: 텍스트 마이닝을 통한 리뷰의 탐색적 분석을 중심으로 (BEHIND CHICKEN RATINGS: An Exploratory Analysis of Yogiyo Reviews Through Text Mining)

  • 김준겸;최은솔;윤수현;이유빈;김동환
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.30-40
    • /
    • 2021
  • 코로나 19의 영향으로 배달앱 시장이 빠르게 성장하며, 리뷰와 평점이 더욱 중요해지고 있다. 그러나 급격하게 늘어난 리뷰와 평점의 신뢰도에 의문이 제기되고 있다. 따라서 본 연구는 리뷰와 평점을 탐색적으로 분석하여 배달앱 리뷰의 신뢰도와 유용성을 파악하고, 이를 높일 방법을 탐구하였다. 텍스트 마이닝 기법을 사용하여 도출한 결과는 다음과 같다. 첫째, 요기요와 네이버 지도, 구글 지도의 음식점 평점을 분석한 결과, 요기요는 가장 우편향된 평점 분포를 보여주었다. 둘째, 요기요의 세부 평점 요인(맛, 양, 배달)간에는 모두 강한 양의 상관관계가 있었고, 이는 부정 리뷰의 단어 분석에서도 드러났다. 셋째, 리뷰의 극성에 따라 사용되는 품사와 형태소의 비율이 달랐다. 넷째, 전체 리뷰 데이터에서 367개의 부정어를 선별한 후, 이를 분류하여 치킨 전용 부정어 사전을 제작하였다. 본 연구는 치킨 리뷰의 탐색적 분석을 통해 앞으로 배달앱 리뷰에 대한 연구가 나아가야 할 방향을 제시하였다.

Stand-Alone Wind Energy Conversion System with an Asynchronous Generator

  • Singh, Bhim;Sharma, Shailendra
    • Journal of Power Electronics
    • /
    • 제10권5호
    • /
    • pp.538-547
    • /
    • 2010
  • This paper deals with a stand-alone wind energy conversion system (WECS) with an isolated asynchronous generator (IAG) and voltage and frequency (VF) control feeding three-phase four-wire loads. The reference generator currents are estimated using the instantaneous symmetrical component theory to control the voltage and frequency of an IAG system. A three-leg voltage source converter (VSC) with an isolated star/delta transformer is used as an integrated VSC. An integrated VSC with a battery energy storage system (BESS) is used to control the active and reactive powers of the WECS. The WECS is modeled and simulated in MATLAB using the Simulink and the Sim Power System (SPS) toolboxes. The proposed VF controller functions as a voltage and frequency regulator, a load leveler, a load balancer and a harmonic eliminator in the WECS. A comparison is made on the rating of the VSC with and without ac capacitors connected at the terminals of an IAG. Simulation and test results are presented to verify the control algorithm.

동승석 최고 충돌성능 달성을 위한 액티브 벤트 에어백 기술 개발 (A Development of Active Vent Airbag for the Passenger New NCAP)

  • 유재행;신효섭;김태인;배한일;이성우
    • 자동차안전학회지
    • /
    • 제5권1호
    • /
    • pp.31-36
    • /
    • 2013
  • For the robust passenger NCAP 5star and the stable neck injury performance, a new concept of passenger airbag has been required strongly. Especially, the deployment stability and the vent hole control technology of the passenger airbag should be improved. According to these requirements, the deployment stability technique has been studied and the 'Active Vent' technology has been developed. As a result, these technologies have led to achieve the robust NCAP rating and are applied to the production vehicles.

한국 영화의 개봉전·후 온라인 WOM분석을 통한 영화 흥행에 관한 연구 (A study on Movie Hit through Online WOM Analysis before and after the Release of Korean Movies)

  • 김상목;주용호;조옥희
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.257-267
    • /
    • 2021
  • 본 연구는 영화 시장 수준에서 개봉 전 시장의 기대 수준을 높이는데 지나치게 몰두하는 사전 마케팅이 갖는 위험성을 경고하고, 시장의 기대 불일치 수준이 낮을수록 이상적인 성과를 낼 수 있다는 실무적인 시사점을 제공한다. 본 연구의 핵심 개념은 개봉 전 기대수준과 개봉 후 만족은 각각의 영화 평점으로 측정하였고, 이의 차이를 기대불일치로 산정하였다. 흥행 성적은 영화의 매출액으로 측정하였다. 영화에 대한 온라인 구전을 개봉전과 개봉후로 구분하고 이에 대한 구전효과가 있는지를 검증하였다. 개봉 전 기대 수준을 높이는 데에는 스타 파워와 감독 파워, 전문가평점, 스크린수 중에서 전문가평점이 유의미한 영향력을 갖는 것을 나타났다. 개봉 전 기대수준은 개봉후 평점에 긍정적인 영향을 미치지만, 기대불일치 수준에는 부정적인 영향을 미치는 것으로 확인되었다. 또한 개봉 전 기대수준이 높을수록 기대불일치가 크다는 가설과 기대불일치가 높을수록 흥행수준에 부정적 영향을 미친다는 가설이 지지되면서 기존의 개인 수준에서의 기대불일치 이론을 시장 수준에서 적용가능함을 보여주고 있다. 따라서 개봉 전 기대수준을 높이는 마케팅 전략은 기대불일치를 크게 하여 최종적으로 영화 흥행에 부정적인 영향을 미치는 것을 확인하였다. 이는 영화와 같이 관여도가 낮거나 감성적인 상품을 대상으로 영화관련 실무자들에게 영화의 개봉전이나 개봉후 초기에 실시하는 마케팅에 대한 다양한 시사점을 제공하고 있다.