Analyzing Product Reviews by Consumers using Natural Language Processing Techniques

자연어 처리 기법을 이용한 상품평 분석에 관한 연구

  • 전소은 (건국대학교 충주캠퍼스 컴퓨터학과) ;
  • 이영구 (건국대학교 충주캠퍼스 컴퓨터학과) ;
  • 박경철 (건국대학교 충주캠퍼스 컴퓨터학과) ;
  • 백우진 (건국대학교 충주캠퍼스 컴퓨터학과)
  • Published : 2009.02.09

Abstract

Consumers express how they evaluate what they purchased by writing reviews especially when they purchased products online. By analyzing the reviews about a product, it will be possible to find out what the consumers liked and disliked about the product. It will be also possible to identify the general consensus on what matters in purchaing certain product type such as a laptop if many reviews about many instances of a particular product type is analyzed. However, it takes a lot of time to manually analyzing the reviews. Thus, we propose to use two natural language processing oriented computational techniques to analyze a large number of reviews. The techniques are text classification and information extraction. We developed an review analysis system and conducted experiments against the reviews about the laptop computers posted on the Naver information portal.

많은 소비자는 특히 온라인상에서 물건을 구입하고 그 물건에 대하여 자신이 좋아하는 점이나 싫어하는 것을 포함하는 평가를 웹에 올린다. 이 평가를 분석하여 소비자가 물건을 구매할 때 무엇에 관심을 가지고 중요하게 여기는가에 대하여 알 수있다. 에를 들어 노트북을 구매할 때 작성된 평가를 분석하면 어떤 기능이 중요한 구매 결정 요소이며 어떤 것들을 고쳐야 하는지에 대하여 알 수 있다. 하지만 많은 양의 자료를 수동으로 분석하기에는 시간이 많이 걸린다. 따라서 대량의 자료를 쉽게 분석할 수 있는 두 개의 자연어처리 기법을 이용한 자동 분석 방법을 구현하였다. 두 가지 방법은 자동 문서 분류와 자동 정보 추출이다. 네이버 정보 포털에 있는 상품평을 개발한 시스템으로 분석하였고 평가 결과를 도출했다. 자동 분석시스템의 정확율과 재현율 측면에서 유사한 시스템이 다른 자료유형 분석에 적용했을 때와 비교하여 비슷하였다.

Keywords