Abstract
A given product's online product reviews build up to form largely positive or negative reviews or mixed reviews that include both the positive and negative reviews. While the homogeneously positive or negative reviews help readers identify the generally praised or criticized product, the mixed reviews with minority opinions potentially contain valuable information about the product. We present a method of retrieving minority opinions from the online product reviews using the skewness of positive/negative reviews. The proposed method first classifies the positive/negative product reviews using a sentiment dictionary and then calculates the skewness of the classified results to identify minority reviews. Minority review retrieval experiments were conducted on smartphone and movie reviews, and the F1-measures were 24.6% (smartphone) and 15.9% (movie) and the accuracies were 56.8% and 46.8% when the individual reviews' sentiment classification accuracies were 85.3% and 78.8%. The theoretical performance of minority review retrieval is also discussed.
소수 의견을 포함하는 온라인 상품평은 긍정 또는 부정 일변도인 상품평에서는 찾기 어려운 유익한 정보를 내포하기도 한다. 본 논문에서는 주어진 상품평 집합 속에서 소수상품평을 검색하는 방법을 제안한다. 제안방법은 개별 상품평을 먼저 긍정/부정 상품평으로 자동분류한 뒤, 주어진 상품평 집합의 긍정/부정 상품평의 비대칭도를 계산하여 소수상품평을 검색한다. 소수상품평 검색에서는 긍정/부정 자동분류 성능이 소수상품평 검색성능에 영향을 주는데, 본 논문에서는 도메인에 특화된 감성사전과 그렇지 않은 일반적인 감성사전을 가지고 상품평을 긍정/부정으로 감성분류한 뒤 비대칭도를 계산하여 소수상품평 검색성능을 비교한다. 스마트폰과 영화를 다룬 온라인 영문 상품평에 대하여 도메인에 특화된 감성사전을 가지고 소수상품평 검색성능을 평가한 결과, F1점수는 각각 24.6%와 15.9%였고, 정확도는 각각 56.8%와 46.8%였다. 이는 스마트폰과 영화의 개별 상품평 긍정/부정 분류 정확도가 각각 85.3%와 78.8%일 때의 성능이다. 본 논문에서는 또 긍정/부정 자동분류 성능이 주어졌을 때의 이론적인 소수상품평 검색성능에 대해서도 논의한다.