• 제목/요약/키워드: Review data mining

검색결과 271건 처리시간 0.028초

워드 임베딩을 이용한 아마존 패션 상품 리뷰의 사용자 감성 분석 (User Sentiment Analysis on Amazon Fashion Product Review Using Word Embedding)

  • 이동엽;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제8권4호
    • /
    • pp.1-8
    • /
    • 2017
  • 현대 사회에서 패션 시장의 규모는 해외와 국내 모두 지속적으로 증가하고 있다. 전자상거래를 통해 상품을 구입하는 경우 다른 소비자들이 작성한 상품에 대한 평가 데이터는 소비자가 상품의 구입 여부를 결정하는데에 영향을 미친다. 기업의 입장에서도 상품에 대한 소비자의 평가 데이터를 분석하여 소비자의 피드백을 반영한다면 기업의 성과에 긍정적인 영향을 미칠 수 있다. 이에 본 논문에서는 아마존 패션 상품의 리뷰 데이터를 학습하여 형성된 워드임베딩 공간을 이용하여 사용자의 감성을 분석하는 모델을 구축하는 방법을 제안한다. 실험은 아마존 리뷰 데이터 570만건을 학습하여 형성된 워드임베딩 공간을 이용하여 긍정, 부정 리뷰 데이터의 개수에 따라 총 3개의 SVM 분류기 모델을 학습하는 방식으로 진행하였다. 실험 결과 긍정 리뷰 데이터 5만건, 부정 리뷰데이터 5만건을 이용하여 SVM 분류기를 학습하였을 때 88.0%로 가장 높은 정확도(accuracy)를 나타냈다.

상품 리뷰 분석을 통한 사용자 맞춤형 추천 시스템 (Customized recommendation system through product review analysis)

  • 황도연;배상중;김창수;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.460-461
    • /
    • 2018
  • 전통적인 방식의 추천 시스템은 사용자가 독립적으로 행동한다는 가정하에 개발된 방식이며, 단순하게 상품을 나열하거나 상품의 속성과 사용자의 기호를 연관하는 기능이 부족하여 가독성과 효율성이 떨어지는 문제점이 있다. 이를 해결하기 위해 본 논문에서는 상품 리뷰 데이터를 크롤링을 한 뒤 R을 이용한 텍스트 마이닝 기법을 사용하여 비정형의 리뷰 데이터를 사용자의 구매이력과의 연관 분석을 통해 의미 있는 정보로 가공하여 사용자 맞춤형 정보를 제공하는 시스템을 제안한다. 이를 통해 사용자는 방대한 양의 상품 리뷰 데이터를 분석할 필요 없이 자신에게 필요한 데이터만을 제공받을 수 있게 되어 사용자의 의사결정에 도움 될 것으로 사료된다.

  • PDF

직무 리뷰 분석을 통한 산업군별 직무만족/존속 요인 및 직무불만족/이직 요인에 관한 연구 (A Study on Job Satisfaction/Retention Factors and Job Unsatisfaction/Turnover Factors by Industries using Job Reviews)

  • 이종서;김성근;강주영
    • 한국IT서비스학회지
    • /
    • 제16권1호
    • /
    • pp.1-26
    • /
    • 2017
  • Keeping good, talented people is one of the most significant factors in a company's success. HR analytics is an important area for applying big data analysis techniques to human resources. It provides organizational insight that enables effective management of employees, allowing management to reach their business goals quickly and efficiently. Job satisfaction and employee turnover analysis are the keys to HR analytics. Job review web services have been becoming popular. Because people exchange information about job satisfaction and turnover through these web services, useful information about HR Analytics is accumulated on the job review web sites. In this paper, we identified factors of employee retention by analyzing a Job Satisfaction/Retention group, and the factors of employee turnover by analyzing a Job Unsatisfaction/Turnover group. In order to do this, we first classified employees according to whether their self-reported job satisfaction or turnover was true. We collected and analyzed data from Jobplanet, a popular job review site. Through dominance analysis and LDA topic modeling, we found major factors, topics, and keywords of the classified groups by IT, service, and manufacturing domains. Our approach is a novel model to apply the analysis of reviews and text mining to the HR domain, and it will be practically helpful for setting new strategies that improve job satisfaction.

사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용 (A Collaborative Filtering System Combined with Users' Review Mining : Application to the Recommendation of Smartphone Apps)

  • 전병국;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.1-18
    • /
    • 2015
  • 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. 본 연구는 최근 Web 2.0 시대의 도래로 인해 사용자들이 구입한 상품에 대한 솔직한 의견을 인터넷 상에 자유롭게 표현한다는 점에 착안하여, 사용자가 직접 작성한 리뷰를 참고하여 협업 필터링의 성능을 개선하는 새로운 추천 알고리즘을 제안하고, 이를 스마트폰 앱 추천 시스템에 적용하였다. 정성 정보인 사용자 리뷰를 정량화하기 위해 본 연구에서는 텍스트 마이닝을 활용하였다. 구체적으로 본 연구의 추천시스템은 사용자간 유사도를 산출할 때, 사용자 리뷰의 유사도를 추가로 반영하여 보다 정밀하게 사용자간 유사도를 산출할 수 있도록 하였다. 이 때, 사용자 리뷰의 유사도를 산출하는 접근법으로 중복 사용된 색인어의 빈도로 산출하는 방안과 TF-IDF(Term Frequency - Inverse Document Frequency) 가중치 합으로 산출하는 2가지 방안을 제시한 뒤 그 성능을 비교해 보았다. 실험결과, 제안 알고리즘을 통한 추천, 즉 사용자 리뷰의 유사도를 추가로 반영하는 알고리즘이 평점만을 고려하는 전통적인 협업 필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인할 수 있었다. 아울러, 중복 사용 단어의 TF-IDF 가중치의 합을 고려했을 때, 단순히 중복 사용 단어의 빈도만을 고려했을 때 보다 조금 더 나은 예측정확도를 얻을 수 있음도 함께 확인할 수 있었다.

텍스트 마이닝을 활용한 ASMR 콘텐츠 분야에 따른 소비자 인식 및 구전효과 차이점 분석: ASMR 제품리뷰 및 ASMR How-to 콘텐츠 중심으로 (The User Perception in ASMR Marketing Content through Social Media Text-Mining: ASMR Product Review Content vs ASMR How-to Content)

  • ;최재원
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권4호
    • /
    • pp.1-20
    • /
    • 2021
  • Purpose Nowadays, Autonomous Sensory Meridian Response (ASMR) is rapidly growing in popularity and increasingly appearing in marketing. Not even in TV commercial advertisement, ASMR also fast growing in one-person media communication, many brands and social media influencers used ASMR for their marketing contents. The purpose of this study is to measure consumers' perceptions about the products in ASMR marketing content and compare the differences in communication effect of ASMR content creator between product review and how-to in the same Macro tier influencer - the YouTuber that has 10,000-100,000 subscribers. Design/methodology/approach The research methods selected ASMRtist that do product review content and how-to content, Text comments data was collected from 200 videos of tech-device review videos and beauty-fashion videos. A total of 52,833 text comments were analyzed by applying the LDA topic modeling algorithm and social network analysis. Findings Through the result, we can know that ASMR is good at taking attention of viewers with ASMR triggers. In the Tech device reviews field, ASMR viewers also focus on the product like product's performance and purchase. However, there are many topics related to reaction of ASMR sound, trigger, relaxation. In the Beauty-fashion field, viewers' topics mainly focus on the reaction of the ASMR trigger, response to ASMRtist and other topics are talking about makeup - fashion, product, purchase. From LDA result, many ASMR viewers comment that they feel more comfortable when watching the marketing content that uses ASMR. This result has shown that ASMR marketing contents have a good performance in terms of user watching experience, so applying ASMR can take more consumer intention. And the result of social network analysis showed that product review ASMRtist have a higher communication effectiveness than how-to ASMRtist in the same tier. As an influencer marketing strategy, this study provides information to establish an efficient advertising strategy by using influencers that create ASMR content.

사회 네트워크 분석을 이용한 충성고객과 이탈고객의 구매 특성 비교 연구 (Social Network Analysis to Analyze the Purchase Behavior Of Churning Customers and Loyal Customers)

  • 김재경;최일영;김혜경;김남희
    • 경영과학
    • /
    • 제26권1호
    • /
    • pp.183-196
    • /
    • 2009
  • Customer retention has been a pressing issue for companies to get and maintain the loyal customers in the competing environment. Lots of researchers make effort to seek the characteristics of the churning customers and the loyal customers using the data mining techniques such as decision tree. However, such existing researches don't consider relationships among customers. Social network analysis has been used to search relationships among social entities such as genetics network, traffic network, organization network and so on. In this study, a customer network is proposed to investigate the differences of network characteristics of churning customers and loyal customers. The customer networks are constructed by analyzing the real purchase data collected from a Korean cosmetic provider. We investigated whether the churning customers and the loyal customers have different degree centralities and densities of the customer networks. In addition, we compared products purchased by the churning customers and those by the loyal customers. Our data analysis results indicate that degree centrality and density of the churning customer network are higher than those of the loyal customer network, and the various products are purchased by churning customers rather than by the loyal customers. We expect that the suggested social network analysis is used to as a complementary analysis methodology with existing statistical analysis and data mining analysis.

온라인 리뷰 데이터의 오피니언마이닝을 통한 콘텐츠 만족도 분석 시스템 설계 (A Design of Satisfaction Analysis System For Content Using Opinion Mining of Online Review Data)

  • 김문지;송은정;김윤희
    • 인터넷정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.107-113
    • /
    • 2016
  • 소셜 네트워크 서비스(SNS)의 활성화로 웹상에는 방대한 양의 온라인 리뷰들이 생산되고 있으며, 이러한 온라인 리뷰들은 다양한 콘텐츠들에 대한 의견 데이터로써 콘텐츠 이용자와 제공자들에게 가치 있는 정보로 활용되고 있다. 한편, 온라인 리뷰에 대한 중요도가 높아짐에 따라 온라인 리뷰를 분석하여 글쓴이의 의견이나 평가, 태도, 감정 등을 추출해 내는 오피니언마이닝에 대한 연구가 활발하게 진행되고 있다. 그러나 기존의 오피니언마이닝 연구들에서는 리뷰의 의견 분류에만 초점을 맞추어 감성 분석 기법을 설계하였기 때문에 리뷰 속에 내포되어있는 작성자의 자세한 만족도까지는 알 수 없었으며, 감성 분석 기법이 특정 콘텐츠에 한정되어있어 도메인이 같지 않은 다른 콘텐츠들에는 적용될 수 없다는 문제점이 있었다. 이에 본 연구에서는 기존 의견 분류 방법에 강도를 주어 좀 더 세밀한 감성 분석을 수행하고, 이 결과를 통계적 척도에 적용하여 리뷰에 내포되어 있는 작성자의 자세한 만족도를 도출 할 수 있는 감성 분석 기법을 제안한다, 그리고 제안한 기법을 바탕으로 도메인에 상관없이 다양한 콘텐츠에 적용되어 콘텐츠의 만족도를 분석 할 수 있는 시스템을 설계하였다. 또한 방대한 양의 리뷰 데이터들을 빠르고 효율적으로 처리하기 위해 빅 데이터 처리도구인 하둡을 기반으로 시스템을 구축하였다. 본 시스템을 통해 콘텐츠 이용자는 보다 효율적인 의사결정을, 제공자들은 빠른 반응분석을 할 수 있어 본 시스템은 사용자의 의견을 필요로 하는 다양한 분야에 매우 실용적으로 활용 될 것으로 기대한다.

SNA를 이용한 AI 스피커 지속적 사용에 영향을 미치는 요인 분석 연구: 아마존 에코 리뷰 중심으로 (A Study on the Factors Affecting Continuous Use of AI Speaker Using SNA)

  • 김영범;차경진
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.95-118
    • /
    • 2021
  • 최근 AI 스피커 시장의 규모가 급속도 커지면서 AI 스피커의 다양한 활용 가능성이 크게 주목받고 있다. 소비자들이 다양한 채널을 통해 제품을 사용한 경험을 표현하고 공유하는 환경을 만들어 졌고, 그로 인하여 소비자가 제품을 이용한 경험에 대한 다양하고 솔직한 생각을 남긴 리뷰들의 양이 방대해졌는데, 이러한 리뷰데이터는 소비자의 생각을 분석하는 데에 매우 유용하다고 할 수 있다. 본 연구에서는 이 리뷰데이터를 활용하여 AI 스피커 지속적인 사용에 영향을 미치는 요인에 대하여 분석하고자 하였다. 무엇보다 선행연구를 통하여 도출된 AI 사용의도에 영향을 미치는 7가지 요인들이 실제로 소비자들이 남기는 리뷰에서도 나타나는 요인인지를 확인하고자 하였다. 이를 위해, Amazon.com의 아마존 에코 제품에 대한 고객 리뷰데이터를 기반으로 하여 텍스트마이닝과 사회관계망 분석을 활용하여 분석하였다. 리뷰데이터를 긍정리뷰와 부정리뷰로 분류하고 전처리하여 도출된 단어들 간 연결성을 중심으로 AI 스피커의 지속적인 사용에 영향을 미치는 요인을 분류하고자 연결 중심성 분석을 하였으며, 이를 통해 연결성의 위치가 비슷한 단어들 간 분류를 하기 위하여 CONCOR 분석을 하였다. 긍정 리뷰 연구 결과, 소비자들은 AI 스피커 지속적 사용에 영향을 미치는 요인으로 의인화와 친밀성을 가장 중요하게 보았다. 이 두 요인들은 다른 요인들과도 강한 연결 관계를 보여주었고, 선행연구에서 도출된 요인 외에 연결성도 중요한 요인임을 도출하였다. 또한 추가적으로 부정적인 리뷰 분석 결과, 인식오류와 호환성이 AI 스피커 사용에 있어서 소비자들에게 부정적인 영향을 주는 주요 요인들로 도출되었다. 이러한 연구 결과를 토대로 본 연구에서는 소비자들이 아마존 에코 제품을 지속적으로 사용하게 하는 구체적인 방법에 대하여 제시하고자 한다.

온라인리뷰의 랭킹모델링을 위한 양과 질의 인과모형 분석 (Causal model analysis between quantity and quality for deriving ranking model of Online reviews)

  • 이창용;김근형
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제28권1호
    • /
    • pp.1-16
    • /
    • 2019
  • Purpose The purpose of this study is to analyze causal relationship between quantity and quality for deriving ranking model of Online reviews. Thus, we propose implications for deriving the ranking model for retrieving Online reviews more effectively. Design/methodology/approach We collected Online review from Tripadvisor web sites which might be a kind of world-famous tourism web sites. We transformed the natural text reviews to quantified data which consists of quantified positive opinions, quantified negative opinions, quantified modification opinions, reviews lengths and grade scores by using opinion mining technologies in R package. We executed corelation and regression analysis about the data. Findings According to the empirical analysis result, this study confirmed that the review length influenced positive opinion, negative opinion and modification opinion. We also confirmed that negative opinion and modification opinion influenced the grade score.

상품 리뷰 데이터와 감성 분석 처리 모델링 (Product Review Data and Sentiment Analytical Processing Modeling)

  • 연종흠;이동주;심준호;이상구
    • 한국전자거래학회지
    • /
    • 제16권4호
    • /
    • pp.125-137
    • /
    • 2011
  • 전자 상거래 사이트의 상품 리뷰는 구매 예정자들에게 유용한 정보로 활용될 수 있지만, 방대한 양으로 인해 사용자가 모든 리뷰를 읽는 것은 불가능에 가깝다. 이를 보완하고자 전자 상거래 사이트들은 상품이나 그 특징에 대한 별점 통계, 유용한 리뷰 분류 등을 사용자의 참여나 수작업을 통해 제공하고 있다. 오피니언 마이닝(opinion mining) 혹은 감성 분석(sentiment analysis)은 이러한 일련의 과정을 자동화하는 연구로서, 상품 리뷰의 사용자 의견을 대상으로 그 의견이 긍정적인지, 부정적인지 판단한 후 요약하여 제공한다. 하지만 기존의 감성 분석은 구매예정자에게 유용한 정보, 즉 상품평의 극성을 판별하거나, 상품 특징별 평가 요약 등에만 초점을 맞추고 있어, 상대적으로 의견 정보의 활용도가 낮아지는 문제가 있다. 실제 상품 리뷰에는 상품의 평가 외에도 제품이 가지고 있는 문제점, 고객의 불만 등이 제시되어 있으며, 이를 관리자가 효과적으로 분석하여 의사 결정에 지원에 활용하고자 하는 요구가 늘어나고 있다. 이에 본 논문은 다양한 종류의 의견 정보를 파악하여 데이터 웨어하우스에 저장한 후, 의견 정보를 온라인에서 동적으로 분석하고 통합 처리하는 모델링 방안을 제시한다. 또한 이를 활용하여 실제 전자 상거래 사이트의 한 종류인 어플리케이션 판매 사이트의 리뷰에 대한 분석을 수행하였다.