• 제목/요약/키워드: Yelp.com

검색결과 8건 처리시간 0.019초

텍스트 마이닝을 활용한 고객 리뷰의 유용성 지수 개선에 관한 연구 (A Study on Classifications of Useful Customer Reviews by Applying Text Mining Approach)

  • 이홍주
    • 한국IT서비스학회지
    • /
    • 제14권4호
    • /
    • pp.159-169
    • /
    • 2015
  • Customer reviews are one of the important sources for purchase decision makings in online stores. Online stores have tried to provide useful reviews in product pages to customers. To assess the usefulness of customer reviews before other users have voted enough on the reviews, diverse aspects of reviews were utilized in prevous studies. Style and semantic information were utilized in many studies. This study aims to test diverse alogrithms and datasets for identifying a proper classification method and threshold to classify useful reviews. In particular, most researches utilized ratio type helpfulness index as Amazon.com used. However, there is another type of usefulness index utilized in TripAdviser.com or Yelp.com, count type helpfulness index. There was no proper threshold to classify useful reviews yet for count type helpfulness index. This study used reivews and their usefulness votes on restaurnats from Yelp.com to devise diverse datasets and applied text mining approaches to classify useful reviews. Random Forest, SVM, and GLMNET showed the greater values of accuracy than other approaches.

온라인 리뷰의 감성과 독해 용이성이 리뷰 유용성에 미치는 영향: 가산형 리뷰 유용성 정보 활용 (The Effects of Sentiment and Readability on Useful Votes for Customer Reviews with Count Type Review Usefulness Index)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.43-61
    • /
    • 2016
  • 온라인 쇼핑몰의 상품에 대한 고객 리뷰는 구매자들의 구매 의사결정에 영향을 미치고 있으며 중요한 구전효과의 원천과 의사결정의 정보 원천의 역할을 하고 있다. 한 제품에 대한 리뷰가 무척 많기에 온라인 쇼핑몰들은 고객 리뷰 평가 방안을 도입하였고, 이를 통해 고객들에게 유용하리라고 판단되는 리뷰들을 걸러서 보여주거나 강조할 수 있게 되었다. 리뷰 평가 방안은 해당 리뷰가 도움이 되었는지 혹은 도움이 되지 않았는 지를 리뷰를 읽은 고객이 평가하게 하는 방안이다. Amazon.com은 고객 평가를 바탕으로 총 투표 수 중에서 유용하다는 투표 수의 비율을 리뷰 유용성 지표로 삼고 있으며, Yelp.com은 유용하다는 투표 수 자체를 유용성 지표로 삼고 있다. 본 연구는 고객 리뷰의 감성과 독해 용이성이 리뷰의 유용성에 미치는 영향을 파악하고자 한다. Amazon.com의 고객 리뷰 자료를 활용하여 비율형 유용성 지표를 종속변수로 하는 유사한 연구들이 수행되어 왔다. 본 연구에서는 Yelp.com의 리뷰 자료를 활용하여 가산형 리뷰 유용성 지표인 경우에도 동일한 효과가 존재하는지를 검토하고자 한다. Yelp.com의 음료와 음식 카테고리에 해당하는 업종에 대한 리뷰를 자료로 활용하였으며, 점포의 명성과 인기도 데이터를 파악할 수 있는 170,294개의 리뷰를 분석에 활용하였다. 분석결과는 리뷰의 긍정 정도는 유용 투표수를 늘리는데 음의 영향을 미쳤다. 평가가 긍정적인 리뷰에서는 음의 영향관계가 유의 하였으나, 평가가 부정적인 리뷰에서는 리뷰의 긍정 정도가 유용 투표 수에 미치는 영향은 유의하지 않았다. 독해 용이성은 리뷰가 읽기 어려울 수록 높은 값을 갖으며, 독해의 어려운 정도는 유용 투표수 획득에 음의 영향을 미쳤다. 독해 용이성은 긍정 리뷰, 부정 리뷰 관계없이 모두 음의 영향을 미치는 것으로 분석되었다. 이 결과는 유용 투표수가 0인 리뷰를 포함하여 영과잉 음이항 회귀분석을 수행한 경우와 유용 투표수가 0인 리뷰를 제외하고 음이항 회귀분석을 수행한 경우 모두 동일하게 파악되었다.

온라인 리뷰 유용성에 영향을 미치는 요인: 가격의 조절 효과 (Factors Affecting the Usefulness of Online Reviews: The Moderating Role of Price)

  • 윤지윤;노유나;권보람;장정주
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.153-173
    • /
    • 2022
  • 본 연구는 yelp.com에서 2019년 작성된 온라인 음식점 리뷰를 분석하고, 음식점 소비 의사결정 과정에서 온라인 리뷰의 유용성 결정에 영향을 미치는 요인을 탐색한다. 구체적으로 리뷰 유용성에 영향을 미칠 것으로 예상되는 요인들을 정교화 가능성 모델에 따라 분류하고, 레스토랑의 가격대에 따라 그 영향이 달라질 것이라고 가정하였다. 2020년 2월 yelp.com에서 제공한 데이터 중, 미국 네바다주에 위치한 Food and Restaurant 카테고리에 속하는 업체들의 온라인 리뷰를 분석 대상으로 하였다. 음이항회귀분석 결과, 리뷰 깊이, 가독성을 포함한 중심단서 및 리뷰 일관성, 리뷰어 인기, 리뷰어 노출을 포함한 주변 단서가 리뷰 유용성에 긍정적인 영향을 미치는 것으로 확인되었다. 또한 음식점의 가격대가 높아질수록 리뷰 유용성에 영향을 미치는 선행요인의 영향이 달라지는 것으로 확인되었다. 본 연구는 레스토랑 가격이 리뷰의 유용성에 대한 중심 및 주변 단서의 영향을 조절한다는 것을 밝혔으며, 또한 리뷰 플랫폼과 외식업에 가격에 따라 차별화된 리뷰 관리 전략의 필요성에 대한 시사점을 제공한다.

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

Too Much Information - Trying to Help or Deceive? An Analysis of Yelp Reviews

  • Hyuk Shin;Hong Joo Lee;Ruth Angelie Cruz
    • Asia pacific journal of information systems
    • /
    • 제33권2호
    • /
    • pp.261-281
    • /
    • 2023
  • The proliferation of online customer reviews has completely changed how consumers purchase. Consumers now heavily depend on authentic experiences shared by previous customers. However, deceptive reviews that aim to manipulate customer decision-making to promote or defame a product or service pose a risk to businesses and buyers. The studies investigating consumer perception of deceptive reviews found that one of the important cues is based on review content. This study aims to investigate the impact of the information amount of review on the review truthfulness. This study adopted the Information Manipulation Theory (IMT) as an overarching theory, which asserts that the violations of one or more of the Gricean maxim are deceptive behaviors. It is regarded as a quantity violation if the required information amount is not delivered or more information is delivered; that is an attempt at deception. A topic modeling algorithm is implemented to reveal the distribution of each topic embedded in a text. This study measures information amount as topic diversity based on the results of topic modeling, and topic diversity shows how heterogeneous a text review is. Two datasets of restaurant reviews on Yelp.com, which have Filtered (deceptive) and Unfiltered (genuine) reviews, were used to test the hypotheses. Reviews that contain more diverse topics tend to be truthful. However, excessive topic diversity produces an inverted U-shaped relationship with truthfulness. Moreover, we find an interaction effect between topic diversity and reviews' ratings. This result suggests that the impact of topic diversity is strengthened when deceptive reviews have lower ratings. This study contributes to the existing literature on IMT by building the connection between topic diversity in a review and its truthfulness. In addition, the empirical results show that topic diversity is a reliable measure for gauging information amount of reviews.

레스토랑의 온라인 리뷰를 통해 감성과 감정이 리뷰 유용성에 미치는 영향에 관한 연구 (A Study on the Influence of Sentiment and Emotion on Review Helpfulness through Online Reviews of Restaurants)

  • 야오즈옌;박지영;홍태호
    • 지식경영연구
    • /
    • 제22권1호
    • /
    • pp.243-267
    • /
    • 2021
  • 자극에 대한 변화의 과정을 통해 자신의 상태를 나타내는 감성과 어떤 현상에 대해 느끼는 단순한 심리상태를 나타내는 감정은 혼용되어 사용되는 경향이 있으나 그 의미와 쓰임새는 다르다. 본 연구에서는 온라인 소비자들이 다양한 제품과 서비스를 구매하고 사용한 후에 작성한 온라인 리뷰를 통해 감성과 감정을 구분하여 리뷰의 유용성에 어떠한 영향을 미치는지 알아보고자 한다. 최근 온라인 리뷰는 비즈니스 및 소비자에게 매우 중요한 요소로 자리매김하고 있다. 유용한 리뷰는 잠재 고객들의 의사결정 과정에서 핵심적인 역할을 하고 있으며 리뷰 유용성을 통해 평가될 수 있다. 리뷰 유용성은 소비자 개인의 구매 의사결정 문제뿐만 아니라 비즈니스에서 마케팅 전략에 활용됨으로써 실무적 중요성은 점차 커지고 있으며, 학문적으로도 리뷰 유용성의 영향요인을 찾는 연구의 중요성이 커지고 있다. 본 연구에서는 Yelp.com에서 레스토랑에 대한 리뷰를 확보하여 온라인 리뷰의 감성과 감정이 리뷰의 유용성에 어떠한 영향을 미치는지에 대한 연구를 진행하였다. 선행연구를 기반으로 온라인 리뷰에 대한 감성과 감정을 포함한 연구 모형을 구축하였으며, 텍스트 마이닝을 통해 온라인 리뷰의 감성과 감정이 온라인 리뷰의 유용성에 어떠한 영향을 미치는지 분석하고 감정에 대한 영향의 차이가 있는지를 검증하였다. 연구결과에서 부정적인 감성과 감정이 리뷰 유용성에 미치는 영향이 더 크며 이는 부정 편향성 이론과 일치하는 것으로 나타났다. 그리고 각각의 감정이 리뷰 유용성에 미치는 영향이 서로 차이가 있는 것으로 나타났다.

XAI 기법을 이용한 리뷰 유용성 예측 결과 설명에 관한 연구 (Explainable Artificial Intelligence Applied in Deep Learning for Review Helpfulness Prediction)

  • 류동엽;이흠철;김재경
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.35-56
    • /
    • 2023
  • 정보통신 기술의 발전에 따라 웹 사이트에는 수많은 리뷰가 지속적으로 게시되고 있다. 이로 인해 정보 과부하 문제가 발생하여 사용자들은 본인이 원하는 리뷰를 탐색하는데 어려움을 겪고 있다. 따라서, 이러한 문제를 해결하여 사용자에게 유용하고 신뢰성 있는 리뷰를 제공하기 위해 리뷰 유용성 예측에 관한 연구가 활발히 진행되고 있다. 기존 연구는 주로 리뷰에 포함된 특성을 기반으로 리뷰 유용성을 예측하였다. 그러나, 예측한 리뷰가 왜 유용한지 근거를 제시할 수 없다는 한계점이 존재한다. 따라서 본 연구는 이러한 한계점을 해결하기 위해 리뷰 유용성 예측 모델에 eXplainable Artificial Intelligence(XAI) 기법을 적용하는 방법론을 제안하였다. 본 연구는 Yelp.com에서 수집한 레스토랑 리뷰를 사용하여 리뷰 유용성 예측에 관한 연구에서 널리 사용되는 6개의 모델을 통해 예측 성능을 비교하였다. 그 다음, 예측 성능이 가장 우수한 모델에 XAI 기법을 적용하여 설명 가능한 리뷰 유용성 예측 모델을 제안하였다. 따라서 본 연구에서 제안한 방법론은 사용자의 구매 의사결정 과정에서 유용한 리뷰를 추천할 수 있는 동시에 해당 리뷰가 왜 유용한지에 대한 해석을 제공할 수 있다.

레스토랑 카테고리와 온라인 소비자 리뷰를 이용한 딥러닝 기반 레스토랑 추천 시스템 개발 (Developing a Deep Learning-based Restaurant Recommender System Using Restaurant Categories and Online Consumer Review)

  • 구하은;이청용;김재경
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.27-46
    • /
    • 2023
  • 최근에는 외식 산업의 발달과 레스토랑 수요의 증가로 인해 레스토랑 추천 시스템 연구가 활발하게 제안되고 있다. 기존 레스토랑 추천 시스템 연구는 정량적인 평점 정보 또는 온라인 리뷰의 감성분석을 통해 소비자의 선호도 정보를 추출하였는데 이는 소비자의 의미론적 선호도 정보는 반영하지 못한다는 한계가 존재한다. 또한, 레스토랑이 포함하는 세부적인 속성을 반영한 추천 시스템 연구는 부족한 실정이다. 이를 해결하기 위해 본 연구에서는 소비자의 선호도와 레스토랑 속성 간의 상호작용을 효과적으로 학습할 수 있는 딥러닝 기반 모델을 제안하였다. 먼저, 합성곱 신경망을 온라인 리뷰에 적용하여 소비자의 의미론적 선호도 정보를 추출했고, 레스토랑 정보에 임베딩 기법을 적용하여 레스토랑의 세부적인 속성을 추출했다. 최종적으로 요소별 연산을 통해 소비자 선호도와 레스토랑 속성 간의 상호작용을 학습하여 소비자의 선호도 평점을 예측했다. 본 연구에서 제안한 모델의 추천 성능을 평가하기 위해 Yelp.com의 온라인 리뷰를 사용한 실험 결과, 기존 연구의 다양한 모델과 비교했을때 본 연구의 제안 모델이 우수한 추천 성능을 보이는 것을 확인하였다. 본 연구는 레스토랑 산업의 빅데이터를 활용한 맞춤형 레스토랑 추천 시스템을 제안함으로써 레스토랑 연구 분야와 온라인 서비스 제공자에게 학술적 및 실무적 측면에서 다양한 시사점을 제공할 수 있을 것으로 기대한다.