• 제목/요약/키워드: 리뷰 데이터

검색결과 311건 처리시간 0.033초

리뷰어 평점 이력이 리뷰 조작에 대한 인식 및 리뷰 유용성에 미치는 영향: 여행플랫폼을 중심으로

  • 장문경;이새롬;백현미
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2022년도 추계학술대회
    • /
    • pp.181-185
    • /
    • 2022
  • 고객들은 조작된 온라인 리뷰가 범람하는 가운데 진정성과 가치를 지닌 리뷰를 보고자한다. 귀인 이론(Attribution theory)의 관점에서, 사람들은 리뷰어의 과거 평가 이력을 바탕으로 리뷰가 진정성 있는지를 판단하는 경향이 있다. 이러한 배경에서 본 연구의 목적은 리뷰어의 과거 평점 이력이 조작된 리뷰로 인식하는 것에 어떠한 영향을 미치며, 최종적으로 리뷰 유용성이 어떠한 영향을 미치는지 알아보는 것이다. 제안된 가설을 검증하기 위해 2차 데이터 분석(연구1)과 실험(연구2)을 수행했으며, 두 연구는 일관된 결과를 보여준다. 연구 1은 리뷰어의 과거 평가 이력이 리뷰 유용성에 미치는 영향을 분석하였다. 귀인이론에 근거하면, 사람들은 리뷰를 다른 목적을 가지고 작성되었다고 인식할 경우에 리뷰가 조작되었다고 생각하고, 그 리뷰가 물건이나 서비스의 진정한 가치를 평가하지 않았다고 간주한다. 따라서 해당 리뷰는 유용성이 낮게 평가되는 경향이 있다. 2차 데이터를 분석하기 위해 우리는 Python을 이용한 웹 스크레이퍼를 개발하여 TripAdvisor(TripAdvisor.com)에서 호텔 정보, 리뷰, 리뷰 정보 등의 연구 데이터를 수집하였다. 수집한 890명 리뷰어에 대한 100,621개의 리뷰를 분석하기 위해 음이항 회귀 분석을 수행하였다. 분석 결과, 평균 평점을 낮게 주는 리뷰어의 경우에 리뷰 유용성에 유의미한 영향을 미치지 않는 것으로 나타났다. 사람들은 극단적인 평점을 거의 주지 않는 리뷰어가 작성한 리뷰가 더 도움이 된다고 평가했다. 연구 2는 리뷰어의 과거 평점 이력을 기준으로 리뷰가 조작되었다고 평가하는 사람들의 인식 프로세스를 실험하였다. 실험 결과, 사람들은 리뷰어의 과거 평점 이력이 평균적으로 평점을 낮게 주는 경우에는 리뷰가 의심스럽다고 판단하지 않는 것으로 나타났다. 그리고 사람들은 리뷰어가 대부분 극단적인 평점을 주는 이력이 있다면 해당 리뷰어가 작성한 리뷰가 의심스럽다고 판단하는 것으로 나타났다. 연구2는 사람들이 리뷰어의 과거 평점 이력을 바탕으로 리뷰가 조작되었는지 또는 리뷰가 도움이 되는지 판단하는 경향이 있음을 보여준다. 본 연구는 귀인이론을 바탕으로 리뷰어의 과거 평점 이력이 리뷰 조작성에 대한 인식과 리뷰 유용성에 미치는 영향을 분석하여, 해당 연구분야에 새로운 관점을 추가한 기여점이 있다.

  • PDF

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

소프트웨어 개발과정의 기술 리뷰 평가 방법 (Evaluation Method of Technical Review in Software Development Process)

  • 전희배;양해술
    • 한국산학기술학회논문지
    • /
    • 제9권5호
    • /
    • pp.1234-1241
    • /
    • 2008
  • 소프트웨어의 개발에서 테스트 비용을 적게 하는 유효한 기법중의 하나로 기술 리뷰의 실행이 있다. 본 연구에서는 기술 리뷰에 의한 테스트 비용의 감소율에 주목하여 새로운 리뷰 평가 척도 My를 제안한다. 그리고, 실제의 소프트웨어 개발 과정에서 수집한 데이터를 사용하여 종래의 척도와 비교, 평가를 하였다. 그 결과 종래의 평가척도에 대한 My의 우위성과 유효성이 실험적으로 확인되었다. 또한, 리뷰 공정에서 수집한 데이터와 테스트 공정에서 수집한 데이터와 관계를 조사해서, 리뷰 공정에서 가능한 데이터만을 이용하여 My의 값을 추정하는 방법에 대해서도 기술하였다.

빅데이터를 활용한 영화 흥행에 따른 리뷰길이 변화 (Changes in Review Length Based on the Popularity of Movies Using Big Data)

  • 조용희;박이슬;김혜진
    • 한국콘텐츠학회논문지
    • /
    • 제18권5호
    • /
    • pp.367-375
    • /
    • 2018
  • 본 연구에서는 영화 관람 후 높은 평점을 매긴 집단과 낮은 평점을 매긴 집단 중 어느 집단이 영화에 대해 더 많은 이야기를 하는지, 즉 온라인 리뷰를 길게 작성하는지에 대해 알아보고자 하였다. 이를 위해 네이버 영화 API에서 제공하는 영화 평점과 리뷰 데이터를 수집하였고, 한국영화진흥위원회에서 제공하는 영화 손익분기점 데이터를 이용하여 영화를 흥행성공, 흥행부진, 흥행실패로 구분하여 영화 평점과 리뷰길이 간의 상관관계, 영화 개봉 전과 후, 흥행여부에 따른 리뷰길이의 특성, 마지막으로 영화 평점이 리뷰길이에 영향을 미치는가에 대한 회귀분석을 실시하여 제시하였다.

Social Big Data Analysis for Franchise Stores

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.39-46
    • /
    • 2021
  • 프랜차이즈 스토어를 대상으로 소셜 빅데이터 분석을 수행할 경우, 프랜차이즈에 속한 여러 분점의 리뷰들이 함께 수집될 수 있어 분석 결과가 왜곡될 수 있다. 이 경우 분석 정확도를 높이기 위해서는 분석 대상이 아닌 타 분점의 리뷰들을 적절히 필터링할 수 있어야 한다. 본 논문에서는 프랜차이즈 스토어들의 특성을 반영한 소셜 빅데이터 분석 방법을 제안한다. 제안 방법은 검색어 설정 방법과 리뷰 필터링 방법을 포함한다. 검색어 설정을 위해, 소상공인진흥공단에서 제공하는 공공데이터를 기반으로 검색에 필요한 지역명을 추출한다. 그리고 리뷰 필터링을 위해, 네이버 및 카카오 등에서 제공하는 검색 API를 이용하여 프랜차이즈 분점 정보를 알아내고, 분석 대상이 아닌 타 분점의 리뷰들을 필터링하는데 이용한다. 제안 방법의 검증을 위해 온라인에서 수집된 실제 리뷰를 대상으로 실험을 수행하였으며, 제안 방법의 리뷰 필터링 정확도는 평균 93.6%로 조사되었다.

크라우드소싱 기반 문장재구성 방법을 통한 의견 스팸 데이터셋 구축 및 평가 (A Crowdsourcing-Based Paraphrased Opinion Spam Dataset and Its Implication on Detection Performance)

  • 이성운;김성순;박동현;강재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.338-343
    • /
    • 2016
  • 웹이 정보 교환의 주된 수단으로 사용되면서, 온라인 리뷰의 중요도가 증가하는 동시에 사용자의 올바른 의사결정을 저해하는 의견 스팸 이슈가 부각되고 있으며, 관련 연구가 활발하게 진행되고 있다. 하지만 분석 및 학습에 필요한 기준 데이터셋의 부족함과 한계점들은 관련 연구의 발전을 더디게 하고 있다. 본 논문에서는 사실 리뷰를 모사한 새로운 형태의 Paraphrased Opinion Spam(POS) 데이터셋을 소개한다. 우리는 실제 스패머들이 스팸을 작성할 때 실제 리뷰를 참고한다는 경향에 착안하여, 실제 리뷰어들이 작성한 리뷰를 의역하는 과정을 통하여 본문에 포함되어 있는 사실 정보와 경험을 담은 스팸 데이터 셋을 생성하였다. 실험 결과, 새롭게 생성된 POS 데이터셋이 언어학적으로 실제 리뷰들과 유사하여 스팸 분류 모델을 이용하여 분류 시 기존의 데이터셋들보다 더 분류하기 힘들다는 것을 발견했다. 또한 데이터의 학습량에 따라서 스팸 리뷰의 분류 정확도가 비례적으로 증가하는 것을 확인함으로써, 데이터의 양이 스팸 분류 모델 성능에 중요한 요소로 작용한다는 것을 확인할 수 있었다.

텍스트 마이닝 기반의 온라인 상품 리뷰 추출을 통한 목적별 맞춤화 정보 도출 방법론 연구 (A Study on the Method for Extracting the Purpose-Specific Customized Information from Online Product Reviews based on Text Mining)

  • 김주영;김동수
    • 한국전자거래학회지
    • /
    • 제21권2호
    • /
    • pp.151-161
    • /
    • 2016
  • 개방, 공유, 참여를 특징으로 하는 웹 2.0 시대로 들어서면서 인터넷 사용자들의 데이터 생산 및 공유가 쉬워졌다. 이에 따른 데이터의 기하급수적인 증가와 함께 디지털 정보의 대부분인 비정형적 데이터(Unstructured Data)의 양도 증가하고 있다. 인터넷에서 정해진 형식 없이 자연어 형태로 만들어진 비정형 데이터 중, 특정 상품들에 대해 개인이 평가한 리뷰들은 해당 기업이나 해당 상품에 관심이 있는 잠재적 고객에게 필요한 데이터이다. 많은 양의 리뷰 데이터에서 상품에 대한 유용한 정보를 얻기 위해서는 데이터 수집, 저장, 전처리, 분석, 및 결론 도출의 과정이 필요하다. 따라서 본 연구는 R을 이용한 텍스트 마이닝(Text Mining) 기법을 사용하여 텍스트 형식의 비정형 데이터에서 자연어 처리 기술 및 문서 처리 기술을 적용하여 정형화된 데이터 값을 도출하는 방법에 대해 소개한다. 또한, 도출된 정형화된 리뷰 정보를 데이터 마이닝 기법에 적용하여 목적에 맞게 맞춤화된 리뷰 정보를 도출시키는 방안을 제시하고자 한다.

감성 분석 화장품 사용자 리뷰에 대한 속성기반 감성분석 (Aspect-based Sentiment Analysis on Cosmetics Customer Reviews)

  • 정희원;정영섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.13-16
    • /
    • 2024
  • 온라인상에 인간의 감성을 담은 리뷰 데이터가 꾸준히 축적되어왔다. 이 텍스트 데이터를 분석하고 활용하는 일은 마케팅에 있어서 중요한 자산이 될 것이다. 이와 관련된 Aspect-Based Sentiment Analysis(ABSA) 연구는 한글에 있어서는 데이터 부족을 이유로 거의 선행연구가 없는 실정이다. 본 연구에서는 최근 공개된 데이터 셋을 바탕으로 하여 화장품 도메인에 대한 소비자들의 리뷰 텍스트와 사전 라벨링 된 속성, 감성 극성을 기반으로 ABSA를 진행한다. Klue RoBERTa base 모델을 활용하여 데이터를 학습시키고, Python Kiwipiepy 등으로 전처리한 결과를 대시보드로 시각화하여 분석하기 쉬운 환경을 마련하는 방법을 제시한다.

  • PDF

의미연결망 분석을 활용한 영화 리뷰 시각화 (A Visualization of Movie Reviews based on a Semantic Network Analysis)

  • 김슬기;김장현
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.1-6
    • /
    • 2019
  • 본 연구는 <네이버 영화> 페이지의 리뷰 데이터를 수집하여, 출현 빈도가 높은 단어를 중심으로 영화 관람객의 반응을 시각화하는 작업을 수행하였다. 이를 위해 총 6편의 영화를 선정하여 데이터 수집 및 정제과정을 거쳤으며, 의미연결망 분석(Semantic network analysis)을 활용하여 단어 간 관계성을 파악하고자 하였다. 데이터 시각화 작업에는 UCINET과 함께 패키지화된 NetDraw가 사용되었다. 본 연구의 시사점은 문장으로 작성된 영화 관람객의 리뷰를 키워드 중심으로 시각화하여, 소비자들의 반응을 한 눈에 확인하는 리뷰 인터페이스 구현이 가능한지 탐색하였다는 점이다. 본 연구를 통해 영화 리뷰를 구성하는 키워드를 시각화하고, 리뷰 내용에서 영화별 특성의 차이를 확인하였다는 점에서 본 연구가 의미를 가진다고 하겠다. 후속 연구는 보다 많은 영화의 리뷰를 활용할 필요성이 제기되며, 각 영화별 리뷰의 수도 비슷한 양으로 맞추어 연구에 활용해야 할 것이다.

리뷰분석을 통한 온라인교육자 신뢰도 파악 자동화 시스템 설계 (Designing an automated system to grasp the reliability of online educators through review analysis)

  • 이기훈;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.596-598
    • /
    • 2018
  • 본 논문은 온라인 교육매칭 플랫폼의 교육자에 대한 신뢰도 파악을 위한 리뷰분석 자동화 시스템을 설계한 논문이다. 웹 크롤링을 통해 비정형 데이터인 교육자에 대한 리뷰를 수집 및 파싱을 통해 데이터 베이스화 한다. 수집한 리뷰 데이터와 SO-PMI를 이용해 온라인 교육자 신뢰도 파악을 위한 맞춤형 감성사전을 구축하고자 한다. 구축한 감성사전을 이용해 리뷰를 수치화해 교육자와 피교육자 매칭 시신뢰성 향상에 도움을 주고자 한다.