• 제목/요약/키워드: 리뷰 분석

검색결과 549건 처리시간 0.028초

사용자 리뷰의 평가기준 별 이슈 식별 방법론: 호텔 리뷰 사이트를 중심으로 (Methodology for Identifying Issues of User Reviews from the Perspective of Evaluation Criteria: Focus on a Hotel Information Site)

  • 변성호;이동훈;김남규
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.23-43
    • /
    • 2016
  • 최근 IT기술의 발전에 따라 많은 사람들이 자신들의 여가활동에 대한 경험을 공유하고 있으며, 역으로 다른 사람들의 여가활동에 대한 경험을 참고하여 더 나은 여가활동을 누릴 수 있는 기회를 얻게 되었다. 이러한 현상은 영화, 숙박, 음식, 여행 등 여가활동 전반에 걸쳐 나타나고 있으며, 그 중심에는 여가활동에 대한 정보를 요약하여 제공하는 수많은 사이트가 있다. 대부분의 여가활동 정보 사이트는 각 상품에 대한 평균 평점뿐만 아니라 상세 리뷰를 제공함으로써, 해당 상품을 구매하고자 하는 잠재고객의 의사결정을 지원하고 있다. 하지만 기존 대부분의 사이트는 한 단계의 평가기준에 따라 평점과 리뷰를 제공하기 때문에, 각 평가기준을 구성하는 세부요소에 대한 특징과 평가기준 별 주요 이슈를 파악하기 위해서는 상당히 많은 수의 리뷰를 직접 읽어야 한다는 불편이 따른다. 즉 사용자는 자신이 중요한 것으로 생각하는 평가기준에 대한 조건을 파악하기 위해, 많은 수의 리뷰를 하나하나 읽어보는 과정에서 많은 시간과 노력을 소비하게 된다. 예를 들어 호텔의 접근성, 객실, 서비스, 음식 등 한 단계의 평가기준만을 사용하여 평점과 리뷰를 제공하는 사이트의 경우, 접근성 중 특히 지하철역과의 거리, 객실 중 특히 욕실의 상태를 살펴보고자 하는 사용자에게 필요한 정보를 충분히 제공하지 못하게 된다. 따라서 본 연구에서는 기존 여가활동 정보 사이트의 한계, 즉 평가기준별로 입력된 리뷰를 신뢰하기 어렵다는 점과 평가기준을 구성하고 있는 세부 내용을 파악하기 어렵다는 점을 극복하기 위한 방안을 제시하고자 한다. 본 연구에서 제안하는 방법론은 사용자가 별도의 구분 없이 입력한 리뷰를 그 내용에 따라 평가기준별로 자동 분류하고, 각 평가 기준 별 주요 이슈를 요약하여 제공한다. 제안 방법론은 최근 텍스트 분석에 활발하게 사용되고 있는 토픽 모델링(Topic Modeling)에 기반을 두고 있으며, 각 리뷰를 하나의 문서 단위로 사용하는 것이 아니라 리뷰를 문장 단위로 끊어 개별 리뷰 유닛(Review Unit)으로 분해한 뒤, 평가기준별로 리뷰 유닛을 재구성하여 분석한다는 측면에서 기존의 토픽 모델링 기반 연구와 큰 차이가 있다고 할 수 있다. 본 논문에서는 제안 방법론을 실제 호텔 정보 사이트에서 수집한 423건의 리뷰 문서에 적용하여 6가지 평가기준에 대해 총 4,860건의 리뷰 유닛을 재구성하고, 이에 대한 분석 결과를 소개함으로써 제안 방법론의 유용성을 간접적으로 보인다.

텍스트 마이닝을 활용한 공공기관 서비스 로봇에 대한 사용자 리뷰 분석 : 안내로봇 사례를 중심으로 (Text Mining Analysis of Customer Reviews on Public Service Robots: With a focus on the Guide Robot Cases)

  • 신효림;최준호;오창훈
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.787-797
    • /
    • 2023
  • 공공기관에서 서비스 로봇, 특히 안내로봇의 사용이 보편화 되며 다양한 곳에서 사람들을 만나고 있다. 그러나 4년이 넘는 시간 동안 사용자가 안내로봇을 만나왔지만, 아직까지 사용자와 안내로봇의 상호작용에 대한 탐구가 부족한 실정이다. 이에 이 연구는 안내로봇에 대한 사용자 경험을 탐구하고자, 가장 오랜 기간 동안 사용자를 만난 안내로봇인 '큐아이'를 연구 대상으로 선정하여 서비스를 시작한 시점부터 작성된 모든 리뷰를 수집하였다, TF-IDF로 주요 키워드를 확인하고 토픽 모델링을 통해 사용자 경험 요인을 도출하였으며 감성 분석을 통해 사용자 경험 저해 요인을 살펴보았다. 분석 결과, 안내로봇의 기능, 외형, 상호작용 방식, 그리고 안내로봇의 문화해설사 역할과 도우미 역할이 핵심 사용자 경험 요인으로 나타났다. 부정적 리뷰를 통해 확인한 저해 요인은 이를 개선할 수 있도록 인터랙션 설계와 멀티모달 인터페이스를 활용한 서비스 디자인, 문화해설사로서의 콘텐츠 개발 등 향후 방향성을 제안하였다. 이 연구는 안내로봇의 사용자 경험을 분석하고 개선방안을 제시한 것에 의의가 있다.

의미 프레임 자질 기반 의견 스팸 분석 (Deep Semantic Feature based Deceptive Opinion Spam Analysis)

  • 김성순;장혁윤;이성운;강재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.1001-1004
    • /
    • 2015
  • 소설미디어의 급증과 함께 온라인 리뷰의 의존성이 급증하는 가운데 사용자의 올바른 의사결정을 저해하는 기만적 의견 스팸 이슈가 새롭게 주목받고 있다. 기존의 의견 스팸 연구는 실제 리뷰와 의견 스팸 간의 차이를 어휘, 품사 또는 감정단어와 같은 표면적 자질을 통해 설명하였으나 그들간의 의미적 연결관계는 고려하지 않았다. 본 논문에서는 1) 의미적 프레임 기반의 텍스트 분석기법을 제안하고, 이를 바탕으로 2) 의견 스팸과 실제 리뷰간의 의미적 차이가 있음을 규명하며 3) 새로운 의미적 프레임 자질을 사용하여 기존의 의견 스팸 분류 성능을 향상시킬 수 있음을 보인다.

공간 결합과 심층신경망을 활용한 관광지 다중 분류 추천 시스템 (Multiple classification recommendation system using spatial combination and deep learning)

  • 안현우;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.43-46
    • /
    • 2019
  • 관광지에 대한 관광객의 평가는 날씨, 계절, 관광객의 밀집 정도 등 다양한 환경적 요소에 따라 변화한다. 각 관광지는 객관적인 관점으로 최상의 관광을 경험하게 할 고유한 컨디션이 존재하며 이를 추출하기 위해선 관광에 영향을 주는 여러 환경들에 대한 다중 요인 분석이 가능할 만큼의 정보가 필요하다. 본 논문에서는 심층신경망을 기반으로 한 문장분석기술을 응용하여 관광지 리뷰에 적용, 평점이 포함되지 않은 리뷰에 평점을 추가하여 기상이나 계절, 휴무일 등의 다양한 분류가 가능할 수준의 데이터를 보충하고 축적/보충된 방대한 평점데이터를 토대로 맞춤 추천이 가능하도록 하는 시스템을 설명한다. 이에 본 논문은 학습 환경 구축, 리뷰와 기상 정보의 결합, 최종 추천 방법 등 전반적인 프로세스에 대한 내용을 설명한다.

시리즈물 리뷰의 긍정 유사도가 흥행에 미치는 영향을 분석하기 위한 텍스트 분류 (Text Classification to Analyze the Effect of Positive Similarity in Series Reviews on the Box Office Performance)

  • 김수진;조형민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.843-846
    • /
    • 2022
  • 오늘날 인터넷이 보편화되었고, 최근에는 최근에는 코로나19 유행으로 사람들이 집에 머무르는 시간이 많아지면서 여러 온라인 플랫폼을 통해 영화, 드라마 등의 프로그램을 시청하는 것에 관심이 많아지고 있다. 또한, 그러한 시대적 흐름에 따라 시즌제 형식의 시리즈물을 통해 보다 퀄리티 높은 콘텐츠를 보고자 하는 소비자 니즈도 증가하고 있다. 시리즈물은 전편과 속편이 유기적으로 연결되기 때문에 전편의 리뷰를 분석하여 관객의 니즈를 파악하고 그것을 속편에 반영하는 것이 중요해 보인다. 따라서 본 연구에서는 텍스트 분류를 통해 시리즈물의 전편과 속편 리뷰의 긍정 유사도를 비교하고, 나아가 긍정 유사도가 흥행 성적에 유의미한 영향을 미치는지 알아보고자 한다.

  • PDF

네티즌의 흥행 영화 리뷰에 포함된 감정 동사 이용 특성 연구 (A Structural Analysis of the Movie Reviews)

  • 박지연;전범수
    • 한국콘텐츠학회논문지
    • /
    • 제14권5호
    • /
    • pp.85-94
    • /
    • 2014
  • 본 연구는 한국 및 외국 흥행 영화에 대한 네티즌 리뷰를 중심으로 네티즌 리뷰에 사용된 감정 동사와 흥행 영화와의 관계를 구조적으로 살펴보고자 하였다. 주요 연구 결과는 다음과 같다. 네티즌 리뷰의 특성은 첫째, 한국 및 외국 흥행 영화 모두 '재미있다'(한국:339회, 외국:452회)의 감정 동사가 가장 많이 사용되었다. 이는 네티즌들이 영화를 판단할 때 재미를 가장 큰 요인으로 생각하고 있다는 것을 나타낸다. 둘째, 한국 및 외국 흥행 영화에 사용된 감정 동사를 군집분석으로 살펴본 결과, 한국 영화는 재미를 기준으로 몰입이나 감동 등 감정적 동사를 기준으로 영화들이 군집되는 것으로 나타났다. 반면, 외국 영화는 재미있다와 없는 영화 등으로 구분되는 것으로 나타났다.

크라우드소싱 기반 문장재구성 방법을 통한 의견 스팸 데이터셋 구축 및 평가 (A Crowdsourcing-Based Paraphrased Opinion Spam Dataset and Its Implication on Detection Performance)

  • 이성운;김성순;박동현;강재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.338-343
    • /
    • 2016
  • 웹이 정보 교환의 주된 수단으로 사용되면서, 온라인 리뷰의 중요도가 증가하는 동시에 사용자의 올바른 의사결정을 저해하는 의견 스팸 이슈가 부각되고 있으며, 관련 연구가 활발하게 진행되고 있다. 하지만 분석 및 학습에 필요한 기준 데이터셋의 부족함과 한계점들은 관련 연구의 발전을 더디게 하고 있다. 본 논문에서는 사실 리뷰를 모사한 새로운 형태의 Paraphrased Opinion Spam(POS) 데이터셋을 소개한다. 우리는 실제 스패머들이 스팸을 작성할 때 실제 리뷰를 참고한다는 경향에 착안하여, 실제 리뷰어들이 작성한 리뷰를 의역하는 과정을 통하여 본문에 포함되어 있는 사실 정보와 경험을 담은 스팸 데이터 셋을 생성하였다. 실험 결과, 새롭게 생성된 POS 데이터셋이 언어학적으로 실제 리뷰들과 유사하여 스팸 분류 모델을 이용하여 분류 시 기존의 데이터셋들보다 더 분류하기 힘들다는 것을 발견했다. 또한 데이터의 학습량에 따라서 스팸 리뷰의 분류 정확도가 비례적으로 증가하는 것을 확인함으로써, 데이터의 양이 스팸 분류 모델 성능에 중요한 요소로 작용한다는 것을 확인할 수 있었다.

의료 서비스 리뷰의 감성 수준이 병원 평가에 미치는 영향 분석 (A Study on Sentiment Score of Healthcare Service Quality on the Hospital Rating)

  • 최지은;김소담;김희웅
    • 경영정보학연구
    • /
    • 제20권2호
    • /
    • pp.111-137
    • /
    • 2018
  • 의료보험 혜택의 증가 및 베이비붐 세대의 노인 인구 증가 등에 기인하여 2020년에는 헬스케어로 소비되는 금액이 미국 GDP의 20%를 차지할 것으로 전망되고 있다. 이처럼 헬스케어 산업이 발전하면서 병원의 의료서비스 간 경쟁도 치열해지며, 의료서비스 품질을 관리하고자 하는 병원의 니즈가 증가해 왔다. 더불어 온라인 리뷰가 병원 품질을 예측하는 하나의 도구로 활용되면서 병원 온라인 리뷰에 대한 관심 또한 증대되었다. 소비자들은 의료서비스 제공자를 선택함에 있어서도 온라인 리뷰를 참고하는 경향을 보이며, 서비스를 제공받은 후 서비스 품질에 대해 온라인상에서 평가를 진행한다. 따라서 본 연구는 온라인 리뷰 사이트인 Yelp의 병원 리뷰를 중심으로 고객이 평가한 서비스 품질 유형의 감성 수준이 병원 평가에 미치는 영향을 파악하는 것을 목적으로 한다. 본 연구는 1차적으로 온라인에서 수집한 대량의 텍스트 데이터를 SERVQUAL 이론의 다섯 가지 서비스 품질 측정 지표로 구분한다. 다음으로 지표 별 감성 수준을 병원 단위로 도출한 뒤, 각 SERVQUAL 지표의 감성 수준이 병원 평가에 미치는 영향을 계량경제학적으로 분석한다. 또한, 병원의 네 가지 특성인 운영 목적(비영리 여부), 병원이 위치한 도시의 인구밀도, 보유 침대 수, 그리고 응급센터로 운영 여부가 병원 평가에 어떠한 상호작용 효과를 나타내는지 분석한다. 본 연구 결과를 통해 병원 경영 실무자들에게 온라인 상의병원 평판을 긍정적으로 형성해 나가려면 어떠한 서비스 품질을 더욱 집중 관리해야 하는지 방향을 제시해 줄 수 있을 것으로 기대한다.

상품 평가 텍스트에 암시된 사용자 관점 추출 (Extracting Implicit Customer Viewpoints from Product Review Text)

  • 장경록;이강욱;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.53-58
    • /
    • 2013
  • 온라인 소비자들은 amazon.com과 같은 온라인 상점 플랫폼에 상품 평가(리뷰: review) 글을 남김으로써 대상 상품에 대한 의견을 표현한다. 이러한 상품 리뷰는 다른 소비자들의 구매 결정에도 큰 영향을 끼친다는 관점에서 볼 때, 매우 중요한 정보원이라고 할 수 있다. 사람들이 남긴 의견 정보(opinion)를 자동으로 추출하거나 분석하고자 하는 연구인 감성 분석(sentiment analysis)분야에서 과거에 진행된 대다수의 연구들은 크게는 문서 단위에서 작게는 상품의 요소(aspect) 단위로 사용자들이 남긴 의견이 긍정적 혹은 부정적 감정을 포함하고 있는지 분석하고자 하였다. 이렇게 소비자들이 남긴 의견이 대상 상품 혹은 상품의 요소를 긍정적 혹은 부정적으로 판단했는지 여부를 판단하는 것이 유용한 경우도 있겠으나, 본 연구에서는 소비자들이 '어떤 관점'에서 대상 상품 혹은 상품의 요소를 평가했는지를 자동으로 추출하는 방법에 초점을 두었다. 본 연구에서는 형용사의 대표적인 성질 중 하나가 자신이 수식하는 명사의 속성에 값을 부여하는 것임에 주목하여, 수식된 명사의 속성을 추출하고자 하였고 이를 위해 WordNet을 사용하였다. 제안하는 방법의 효과를 검증하기 위해 3명의 평가자를 활용하여 실험을 하였으며 그 결과는 본 연구 방향이 감성분석에 있어 새로운 가능성을 열기에 충분하다는 것을 보여주었다.

  • PDF

감성분석 기반 호텔 리뷰의 특성별 극성 분석 및 유저의 선호도 반영 시스템 (Aspect Based Sentiment Analysis System of Hotel Review, Reflecting User's Preference)

  • 심하영;오수진;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.281-284
    • /
    • 2018
  • 인터넷을 통해 정보를 쉽게 공유하게 되면서 소비자는 제품이나 서비스를 이용하기 전 효율적인 의사 결정을 위해 먼저 작성된 다른 사람의 의견을 참고한다. 또한 기업은 이러한 소비자의 의견을 수집하여 제품의 피드백이나 마케팅 등 비즈니스적인 측면으로 활용한다. 수많은 상품평과 후기에서 특정 제품 또는 서비스에 대한 감성을 식별할 수 있다는 점에서, 감성분석은 소비자와 기업 모두에게 주목받고 있는 기술이다. 합리적인 결정을 위해, 소비자는 해당 웹사이트에서 제공하는 데이터를 참고하며, 이 데이터는 웹사이트마다의 기준에 따라 필터링된다. 하지만 제품/서비스에 따라 개인이 중시하는 부분이 다르기 때문에, 실질적으로는 다른 사용자의 의견을 참고하여 합리적인 결정을 내린다. 본 논문은 호텔의 리뷰를 여덟 가지 특성으로 구분하고, 각 특성별로 극성을 분석한다. 또한 사용자가 선호하는 특성에 가중치를 부여하여 순위를 나타내는 시스템을 제안한다. 극성분석 단계에서는 주어진 리뷰를 여덟 가지 특성으로 분류하고, 긍정/부정의 극성으로 분류하는 기계학습 알고리즘을 사용한다. 각각의 특성에 대해 가중치를 적용하여 얻을 수 있는 순서는 기존에 제공되는 순서보다 사용자의 선호도를 정확히 반영한다, 또한 본 논문의 제안을 호텔뿐만 아니라 다양한 제품/서비스에 적용하여 선호도를 반영한 순위 정보를 제공한다면 소비자의 합리적인 의사 결정에 도움을 줄 것이다.