• 제목/요약/키워드: 사용자 리뷰 분석

검색결과 150건 처리시간 0.031초

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

미디어 리뷰를 이용한 영화 배경 키워드 자동 추출 기법 (Automatic Background Keyword of Movie Extraction Method from Media Reviews)

  • 김형우;조준면;유정주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1149-1151
    • /
    • 2013
  • 본 연구는 영화 콘텐츠의 배경(공간적/시간적)에 해당하는 키워드를 자동으로 추출하는 기법을 제안한다. 제안된 기법은 영화 콘텐츠들의 리뷰 텍스트 데이터를 웹 상으로부터 수집하는 과정, 수집된 텍스트 리뷰 데이터의 전처리 과정에 해당하는 형태소 분석 및 개체명인식 과정, 마지막으로 통계적 기법을 이용하여 최종적으로 배경에 해당하는 단어를 선택하는 과정으로 이루어진다. 자동으로 추출된 배경 정보는 사용자 평가를 통하여 정확도를 측정하였으며, 자동 생성된 배경 정보를 이용하여 영화 콘텐츠의 검색 및 추천 등에 다양하게 사용될 수 있을 것으로 예상된다.

모바일 쇼핑 앱 리뷰를 이용한 시장 포지셔닝 분석 (A Market Positioning Analysis using Mobile Shopping App Reviews)

  • 김용환;박지훈;이승준;김자희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.157-160
    • /
    • 2016
  • 최근 모바일 쇼핑 시장의 거래액 규모는 해마다 기하급수적으로 증가하고 있으며, 기업들은 모바일 애플리케이션의 어떤 특성들이 자사의 매출을 증대시킬 수 있는지에 대해 관심이 있다. 그러므로 본 논문에서는 텍스트 마이닝을 이용하여 사용자들이 많이 쓰는 모바일 쇼핑 애플리케이션의 리뷰에서 자주 쓰는 명사를 추출하고 내용분석을 통해 평가 항목들을 도출한다. 그리고 도출된 평가항목에 레퍼토리 그리드 기법을 적용하여 모바일 쇼핑 애플리케이션을 평가하고 시장 포지셔닝을 실시한다. 이를 통해 모바일 쇼핑 애플리케이션의 어떤 특성이 이용자들의 서비스 선호도에 영향을 미치는지 분석한다.

  • PDF

개인 성향 추출을 위한 딥러닝 기반 SNS 리뷰 분석 방법에 관한 연구 (A Study on SNS Reviews Analysis based on Deep Learning for User Tendency)

  • 박우진;이주오;이형걸;김아연;허승연;안용학
    • 한국융합학회논문지
    • /
    • 제11권11호
    • /
    • pp.9-17
    • /
    • 2020
  • 본 논문에서는 개인의 성향을 추출하기 위한 딥러닝 기반의 SNS 리뷰 분석 방법을 제안한다. 기존의 SNS 리뷰 분석 방법은 대부분이 가장 높은 가중치를 기반으로 처리되기 때문에 여러 관심사에 대한 다양한 의견을 반영하지 못하는 문제점이 있다. 이를 해결하기 위해 제안된 방법은 음식을 대상으로 한 SNS의 리뷰에서 사용자의 개인적인 성향을 추출하기 위한 방법이다. YOLOv3 모델을 사용하여 분류체계를 작성하고, BiLSTM 모델을 통해 감성분석을 수행한 후 집합 알고리즘을 통해 다양한 개인적 성향을 추출한다. 실험 결과, YOLOv3 모델의 경우 Top-1 88.61%, Top-5 90.13%의 성능을 보여주었으며, BiLSTM 모델의 경우 90.99%의 정확도를 보여주었다. 또한, SNS 리뷰 분류에서의 개인 성향에 대한 다양성을 히트맵을 통해 시각화하여 확인하였다. 향후에는 다양한 분야에서의 개인 성향을 추출하여 사용자 맞춤 서비스나 마케팅 등에 활용될 것으로 기대된다.

FPS게임의 사용자 현존감과 플레이어 경험에 대한 키워드 연구 - Steam 리뷰와 게임 이용 시간을 중심으로 (Key words research of players' experience and presence in FPS genre-focusing on game play time and Steam reviews)

  • 최영우;유승호
    • 한국게임학회 논문지
    • /
    • 제21권6호
    • /
    • pp.13-30
    • /
    • 2021
  • 본 논문은 스팀(Steam)의 리뷰 데이터를 활용하여 게임이용시간에 따른 FPS에서의 사용자 현존감 경험과 플레이어 경험을 분석했다. Python을 활용하여 크롤링을 통해 데이터를 얻었다. 분석 결과 게임 이용 시간이 적은 집단에서는 통제 가능한 물리적 현존감과 통제 불가능한 사회적 현존감에 관한 이슈가 나왔고 게임이용시간이 많은 집단에서는 이전 집단에 있던 물리적 현존감 요인이 통제 가능한 사회적 현존감으로 변화한 것을 알 수 있었다. 더 나아가 플레이어 경험 분석을 통해 게임 플레이 요인인 "반동(recoil)"이란 키워드가 중요하다는 것을 알 수 있었다.

텍스트마이닝과 워드 클라우드를 활용한 VR 게임 트렌드 분석 -스팀(steam) 리뷰 데이터를 중심으로- (Analysis of VR Game Trends using Text Mining and Word Cloud -Focusing on STEAM review data-)

  • 나지영
    • 한국게임학회 논문지
    • /
    • 제22권1호
    • /
    • pp.87-98
    • /
    • 2022
  • 4차 산업혁명 관련 기술의 발전과 비대면 서비스 수요 증가로 VR 게임이 주목받고 있다. 본 연구는 VR 게임의 리뷰 데이터를 온라인 게임 플랫폼 스팀(STEAM)에서 수집하고 텍스트 마이닝과 워드 클라우드 분석을 적용해 시대별 트렌드를 분석했다. 연구 결과, 프레즌스와 FPS는 시기와 상관 없이 VR 게임의 특징으로 나타났고, 2016~2017년은 체험과 지각된 비용, 2018~2019년은 FPS와 리듬게임의 수요 증가, 2020~2021년은 스토리와 몰입감이 주요 트렌드로 나타났다. 본 연구는 VR 게임 사용자들이 관심을 보이는 키워드를 시기별로 파악해 VR게임 저변 확대에 기여하고자 한다.

크라우드소싱 기반 문장재구성 방법을 통한 의견 스팸 데이터셋 구축 및 평가 (A Crowdsourcing-Based Paraphrased Opinion Spam Dataset and Its Implication on Detection Performance)

  • 이성운;김성순;박동현;강재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.338-343
    • /
    • 2016
  • 웹이 정보 교환의 주된 수단으로 사용되면서, 온라인 리뷰의 중요도가 증가하는 동시에 사용자의 올바른 의사결정을 저해하는 의견 스팸 이슈가 부각되고 있으며, 관련 연구가 활발하게 진행되고 있다. 하지만 분석 및 학습에 필요한 기준 데이터셋의 부족함과 한계점들은 관련 연구의 발전을 더디게 하고 있다. 본 논문에서는 사실 리뷰를 모사한 새로운 형태의 Paraphrased Opinion Spam(POS) 데이터셋을 소개한다. 우리는 실제 스패머들이 스팸을 작성할 때 실제 리뷰를 참고한다는 경향에 착안하여, 실제 리뷰어들이 작성한 리뷰를 의역하는 과정을 통하여 본문에 포함되어 있는 사실 정보와 경험을 담은 스팸 데이터 셋을 생성하였다. 실험 결과, 새롭게 생성된 POS 데이터셋이 언어학적으로 실제 리뷰들과 유사하여 스팸 분류 모델을 이용하여 분류 시 기존의 데이터셋들보다 더 분류하기 힘들다는 것을 발견했다. 또한 데이터의 학습량에 따라서 스팸 리뷰의 분류 정확도가 비례적으로 증가하는 것을 확인함으로써, 데이터의 양이 스팸 분류 모델 성능에 중요한 요소로 작용한다는 것을 확인할 수 있었다.

개체명 인식과 키워드 네트워크 분석을 활용한 약물 이상 반응 탐지 시스템 개발 (Development of Detection of Adverse Drug Reactions based on Named Entity Recognition and Keyword Network Analysis)

  • 이채연;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.670-672
    • /
    • 2023
  • 본 논문에서는 소셜 미디어 약물 리뷰 데이터로부터 약물 이상 반응을 탐지하는 모델인 FC-BERT 를 기반으로 소셜 네트워크 분석을 활용하여 웹 애플리케이션을 구현하였다. FC-BERT 모델을 거쳐 나온 개체명 인식 결과 중에 같은 의미를 가진 서로 다른 약물 이상 반응 표현들을 MedDRA 부작용 사전을 참고하여 하나의 MedDRA 용어로 표준화하여 매핑했다. 해당 결과에 소셜 네트워크 분석 기법을 적용하여 생성한 상위 15 개의 ADR 동시 출현 그래프를 상위 30 개의 워드 클라우드와 함께 시각화하여 보여주는 웹 애플리케이션을 개발했다. 동시 출현 그래프는 가장 많은 리뷰에서 동시에 나타나는 ADR 쌍을 보여준다. 본 논문에서 제안한 웹 애플리케이션은 사람마다 다르게 나타나는 다양한 약물 이상 반응을 사용자에게 좀 더 접근성이 좋게 제공할 수 있을 것으로 보인다.

사용자 리뷰 데이터를 활용한 모바일 어플리케이션 서비스 평가 척도 개선 (Improving evaluation metric of mobile application service with user review data)

  • 이범국;손창호
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.380-386
    • /
    • 2020
  • 모바일 어플리케이션 시장은 스마트폰의 등장 이후로 지난 10여 년의 성장을 통해 전자기기 소프트웨어 시장에서 가장 큰 시장을 보유하게 되었다. 모바일 어플리케이션 시장의 경쟁이 심화됨에 따라, 사용자의 소비와 사용 양태에 어플리케이션 평가가 끼치는 영향력 역시 큰 폭으로 상승하였다. 이에 따라 모바일 어플리케이션을 평가하기 위한 척도에 관한 연구들이 진행됐으나, 대부분의 연구가 전문가 중심의 인터뷰 또는 설문조사와 같은 정성적인 방법에 의존하였다. 또한, 서비스 사용자의 관점이 아닌 서비스 제공자의 관점에서 평가 척도가 구성되고 있다. 하지만 최근에는 대량의 사용자 리뷰(User Review) 데이터를 통해 실제 사용자들의 어플리케이션 평가의 정량적 분석이 가능해짐에 따라, 연구자의 주관성을 최소화하는 어플리케이션 영역별 분석의 가능성이 커지고 있다. 따라서 본 연구에서는 사용자 리뷰 데이터를 활용하여 모바일 어플리케이션들에 대한 기존의 품질 평가에 대한 문제점을 보완할 수 있는 방법론을 제시하고자 한다. 이를 위해 토픽모델링 기법인 LDA(Latent Dirichlet allocation)을 적용하여, 기존의 평가 척도를 사용자 관점에서 개선하는 방법을 제안한다. 본 연구를 통해 서비스 제공자 및 연구자의 주관성으로 인한 서비스 평가의 편향을 줄이고, 소비자 관점의 모바일 어플리케이션 영역별 평가 척도를 제공할 것으로 예상된다.