• 제목/요약/키워드: Product Attribute Extraction

검색결과 5건 처리시간 0.018초

k-Structure를 이용한 한국어 상품평 단어 자동 추출 방법 (Automatic Extraction of Opinion Words from Korean Product Reviews Using the k-Structure)

  • 강한훈;유성준;한동일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.470-479
    • /
    • 2010
  • 감정어 추출과 관련하여 기존 영어권 연구에서 제시된 방법의 대부분은 한국어에 직접 적용이 쉽지 않다. 한국어권 연구에서 제시된 방법 중 수작업에 의한 방법은 감정어 추출에 많은 시간이 걸린다는 문제점이 있다. 영어 시소러스 기반 한국어 감정어 추출 기술은 한국어와 영어 단어간 일대일 부정합에서부터 기인하는 정확도의 저하를 제고해야 하는 과제를 갖고 있다. 한국어 구문 분석기를 기반으로 한 연구는 출현 빈도가 낮은 감정어를 선정하지 못할 수 있는 문제점을 내포하고 있다. 본 논문에서는 한국어 상품평 중 단순한 문장에서 감정어를 자동으로 추출하는 데 있어 기존에 제안된 한국어권 연구에 상호 보완적으로 정확도를 향상시킬 수 있는 k-Structure(k=5 또는 8) 기법을 제안한다. 단순한 문장이라 함은 패턴 길이를 최대 3으로 한다. 이는 평가 대상 상품(예를 들어 '카메라')의 속성 명 f (예를 들어 카메라의 '배터리')를 기준으로 ${\pm}2$의 거리에 감정어가 포함되어 있는 문장을 의미한다. 성능 실험은 국내 주요 쇼핑몰로부터 수집한 1,868개의 상품평을 대상으로 미리 주어진 8개의 속성 명에 대한 감정어를 k-Structure를 이용하여 자동으로 추출하고 그 정확도를 평가하였다. 그 결과, k=5일 경우 평균 79.0%의 재현률, 87.0%의 정확률을 보였고, k=8일 경우 평균 92.35%의 재현률, 89.3%의 정확률을 얻을 수 있었다. 또한, 영어권 연구에서 제안된 방법 중 PMI-IR(Pointwise Mutual Information-Information Retrieval) 기법을 이용하여 실험을 수행하였다. 이 결과, 평균 55%의 재현률과 57%의 정확률을 보였다.

Optimizing E-Commerce with Ensemble Learning and Iterative Clustering for Superior Product Selection

  • Yuchen Liu;Meng Wang;Gangmin Li;Terry R. Payne;Yong Yue;Ka Lok Man
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권10호
    • /
    • pp.2818-2839
    • /
    • 2024
  • With the continuous growth of e-commerce sales, a robust product selection model is essential to maintain competitiveness and meet consumer demand. Current research primarily focuses on single models for sales prediction and lacks an integrated approach to sales forecasting and product selection. This paper proposes a comprehensive framework (VN-CPC) that combines sales forecasting with product selection to address these issues. We integrate a series of classical machine learning models, including Tree Models (XGBoost, LightGBM, CatBoost), Support Vector Machine (SVM), Bayesian Ridge, and Artificial Neural Networks (ANN), using a voting mechanism to determine the optimal weighting scheme. Our method demonstrates a lower Root Mean Square Error (RMSE) on collected Amazon data than individual models and other ensemble models. Furthermore, we employ a three-tiered clustering model: Initial Clustering, Refinement Clustering, and Final Clustering, based on our predictive model to refine product selection to specific categories. This integrated forecasting and selection framework can be more effectively applied in the dynamic e-commerce environment. It provides a robust tool for businesses to optimize their product offerings and stay ahead in a competitive market.

상품평 데이터와 웹 검색엔진을 이용한 상품별 평가항목 자동 추출 (Automatic Product Attribute Extraction from Reviews Using Web Search Engine)

  • 이우철;이현아
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.107-110
    • /
    • 2008
  • 상품평은 인터넷 쇼핑 이용자들의 최종 구매결정에 큰 영향을 미치는 것으로 알려져 있다. 많은 쇼핑몰에서 상품평 활성화를 위해 노력하고 있지만, 상품평을 모으는 것에만 주력할 뿐 기존에 수집된 상품평을 제공하는 방법에 있어서는 원시적인 수준에 그치고 있다. 상품평을 좀 더 효율적으로 제공하려면 사용자들이 상품평에서 찾게 될 평가항목들을 미리 예측하여 그 항목에 따라 상품평을 분류/요약해서 제공하는 방법을 생각할 수 있다. 본 논문에서는 상품평과 웹 검색엔진을 이용하여 각 상품별 평가항목들을 자동으로 추출하는 방법을 제안한다. 상품평 데이터의 특성상 노이즈가 많기 때문에 먼저 데이터를 정제하고, 정제된 상품평 데이터를 형태소 분석하여 후보명사들을 선택한다. 선택된 후보명사를 웹 검색엔진에 질의하여 반환된 결과 값으로 상품 카테고리와 후보명사 간 연관도를 계산하여 평가항목을 추출한다. 실험은 5개 상품 카테고리의 170,294개 실제 상품평을 대상으로 각 카테고리별 평가항목을 추출하였다.

한국어 구문분석을 활용한 이유-감성 패턴 기반의 감성사전 구축 (Sentiment Dictionary Construction Based on Reason-Sentiment Pattern Using Korean Syntax Analysis)

  • 김우현;이희정
    • 산업경영시스템학회지
    • /
    • 제46권4호
    • /
    • pp.142-151
    • /
    • 2023
  • Sentiment analysis is a method used to comprehend feelings, opinions, and attitudes in text, and it is essential for evaluating consumer feedback and social media posts. However, creating sentiment dictionaries, which are necessary for this analysis, is complex and time-consuming because people express their emotions differently depending on the context and domain. In this study, we propose a new method for simplifying this procedure. We utilize syntax analysis of the Korean language to identify and extract sentiment words based on the Reason-Sentiment Pattern, which distinguishes between words expressing feelings and words explaining why those feelings are expressed, making it applicable in various contexts and domains. We also define sentiment words as those with clear polarity, even when used independently and exclude words whose polarity varies with context and domain. This approach enables the extraction of explicit sentiment expressions, enhancing the accuracy of sentiment analysis at the attribute level. Our methodology, validated using Korean cosmetics review datasets from Korean online shopping malls, demonstrates how a sentiment dictionary focused solely on clear polarity words can provide valuable insights for product planners. Understanding the polarity and reasons behind specific attributes enables improvement of product weaknesses and emphasis on strengths. This approach not only reduces dependency on extensive sentiment dictionaries but also offers high accuracy and applicability across various domains.

제품특성 추출을 통한 감성디자인 적용 방법 (MP3 제품을 중심으로) (Regarding a Sensitivity Design Application Method from Product Feature Extraction (Focused on MP3 Player))

  • 권종대
    • 한국콘텐츠학회논문지
    • /
    • 제9권6호
    • /
    • pp.126-133
    • /
    • 2009
  • 본 연구는 제품에 있어서 감성제품의 성공사례를 중심으로 소비자들이 생각하는 감성디자인 제품에 대해 어떠한 요소가 창의적 사고와 관련성이 있는지 조사하였다. 실험에 사용된 디자인 창의성 속성은 2007년 김은주(Kim Eun-Ju)의 디자인 창의성 평가도구 개발에서 밝힌 형태, 기능, 크기가 다양한 MP3를 대상으로 실험하였다. 실험결과, MP3는 차별성, 호감성, 유모성, 편리성과 관련이 있는 것으로 나타났다. 따라서 감성제품에 대한 디자인 창의성 항목의 공통적 특성을 파악하였다. 위의 2가지 실험 내용을 종합해보면 감성디자인은 디자인 창의성 평가 항목 중 독창성의 흥미성 항목과 실용성의 기능성 항목과 관련이 높은 것을 밝혔다. 따라서 향후에는 MP3 이외에 다른 제품의 디자인 창의성 항목간의 공통적 특성을 조사할 필요가 있다.