• 제목/요약/키워드: 리뷰분석

검색결과 559건 처리시간 0.026초

Efficient Keyword Extraction from Social Big Data Based on Cohesion Scoring

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.87-94
    • /
    • 2020
  • 블로그나 SNS 피드 등의 소셜 리뷰는 고객 관점의 의견이나 불만 사항을 반영한 키워드를 추출하기 위한 목적으로 광범위하게 활용되고 있으며, 최근 트렌드를 반영한 신조어나 고유명사를 포함하는 경우가 많다. 이들 단어는 사전에 포함되어 있지 않아 기존 형태소 분석기가 잘 인지하지 못하는 경우가 많으며, 동시에 상당한 처리 시간이 소요되어 키워드 분석 결과를 실시간으로 제공하는데 어려움이 있다. 본 논문에서는 응집도 점수 개념을 기반으로 소셜 리뷰로부터 키워드를 효율적으로 추출하기 위한 방법을 제안한다. 응집도 점수는 단어의 빈도수를 기반으로 계산되어 별도의 사전이 필요없다는 장점이 있으나, 띄어쓰기가 되지 않은 입력 데이터에 대해서는 정확도가 떨어질 수 있다. 이와 관련하여 본 논문에서는 단어 트리 구조를 이용하여 기존의 응집도 점수 계산 방법을 개선한 알고리즘을 제시한다. 또한 실험을 통해 제안하는 방법이 15.5%의 오류율을 보이는 동시에, 1,000개의 리뷰를 처리하는데 0.008초 정도 소요됨을 확인하였다.

머신러닝 기반의 기업 리뷰 다중 분류: 부분 문법 적용을 중심으로 (Multi-Label Classification for Corporate Review Text: A Local Grammar Approach)

  • 백혜연;장영균
    • 경영정보학연구
    • /
    • 제25권3호
    • /
    • pp.27-41
    • /
    • 2023
  • 최근 많은 분야에서 기계학습에 대한 연구가 활발히 진행되고 있는데, 상당수의 연구들이 학습 모델의 성능을 개선하는 최신 방법론을 제시하고 있다. 본 연구에서는 방법론의 개발 못지않게 기계학습에 투입되는 훈련용 데이터의 '품질'을 개선하는 것 역시 중요하다는 점에 착안하여, 코퍼스 분석에서 자주 사용되는 '부분 문법' 처리 프로세스를 통해 훈련 데이터의 품질을 향상시키는 방법을 제시한다. 우리나라 100대 기업에 근무하는 재직자들이 채용플랫폼에 게시하는 방대한 양의 비정형 기업 리뷰 텍스트 데이터를 수집하고, 데이터 품질을 부분 문법 프로세스로 개선한 후, 부분 문법이 적용된 분류 모델이 적용되지 않은 모델보다 분류 성능이 우수함을 확인하였다. 분류 카테고리는 직원 몰입의 5가지 요인으로 상정하였는데, 국내 직장인들이 기업 리뷰가 각 유형별로 빈도에 차이가 있는지를 분석하였다. 추가로 리뷰 양상이 코로나 팬데믹 전후로 어떠한 변화가 있었는지도 분석하였다. 본 연구를 통해 국내 직장인들의 생생한 일터 경험들을 자동적으로 식별하고 분류하여, 이직을 포함한 주요한 조직문화 현상의 행태와 유발 원인 등을 유추해 볼 수 있는 근거를 제공한다.

Interactive Morphological Analysis to Improve Accuracy of Keyword Extraction Based on Cohesion Scoring

  • Yu, Yang Woo;Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.145-153
    • /
    • 2020
  • 최근 소셜 빅데이터를 대상으로 한 키워드 분석은 고객 관점의 의견이나 불만 사항을 추출하기 위한 목적으로 광범위하게 활용되고 있다. 이와 관련하여, 이전 연구에서는 키워드 분석의 정확도를 높이기 위해 응집도 점수를 활용한 방법을 제안하였으나, 리뷰의 수가 적을 경우 오류율이 증가하는 문제가 있었다. 본 논문에서는 응집도 점수 기반 알고리즘으로부터 추출된 키워드에 대해 간소화된 형태소 분석 단계를 후처리 형태로 적용함으로써 키워드 추출의 정확도를 개선하고자 하였다. 제안 방법은 입력 데이터가 주어질 때마다 필요한 형태소 분석 규칙을 점증적으로 추가할 수 있도록 지원함으로써, 사전의 크기를 최소화하고 분석의 효율을 높이고자 하였다. 또한 대화형 규칙 입력 시스템을 제공하여 분석 규칙 추가에 드는 노력을 최소화하고자 하였다. 제안 방법을 검증하기 위해 온라인에서 수집된 실제 리뷰를 대상으로 실험을 수행하였으며, 제안 방법을 적용할 경우 오류율이 기존 10%에서 1%로 개선되는 동시에, 5,000개의 리뷰 처리에 450ms가 소요되어 실시간 처리가 가능한 수준임을 확인하였다.

국내 모바일 뱅킹 애플리케이션에 대한 이용자 중요도-만족도 분석(IPA): 구글 플레이스토어 리뷰 데이터를 활용하여 (Importance-Performance Analysis for Korea Mobile Banking Applications: Using Google Playstore Review Data)

  • 김소희;김무건;류민호
    • 한국산업정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.115-126
    • /
    • 2022
  • 본 연구는 국내 모바일 뱅킹 애플리케이션에 대한 이용자 리뷰 데이터에 텍스트 마이닝 기법을 적용하여 중요도-만족도 분석을 시도하고, 개선의 우선순위를 도출하는 것을 목적으로 한다. 분석에는 구글 플레이스토어에서 국내 시중은행(국민은행, 신한은행, 우리은행, 하나은행), 지역은행(경남은행, 부산은행), 인터넷 은행(카카오뱅크, 케이뱅크, 토스)의 모바일 뱅킹 애플리케이션에 대한 이용자 리뷰 데이터를 활용하였으며, 주요 속성 도출 및 각 속성에 대한 중요도와 만족도 측정을 위해 토픽 모델링, 빈도분석 및 감성분석을 진행하였다. 분석 결과 '인증서비스', '기능 개선', '로그인', '속도/연결성', '시스템/업데이트' 그리고 '뱅킹서비스'가 이용자들이 모바일 뱅킹 애플리케이션을 사용할 때 느끼는 중요도가 상대적으로 높은 속성임에도 불구하고 그 만족도가 평균 수준에 미치지 못해 개선이 시급한 속성으로 나타났다.

외국인 관광객 리뷰데이터를 활용한 토픽모델링 기반의 공간분석: 대구광역시를 사례로 (Spatial analysis based on topic modeling using foreign tourist review data: Case of Daegu)

  • 정지우;김서윤;김현유;윤주혁;장원준;김건욱
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.33-42
    • /
    • 2021
  • 스마트폰 기반의 관광 플랫폼들이 활성화되면서 리뷰 데이터를 활용한 정책 수립 및 서비스 고도화가 다양한 분야에서 이루어지고 있다. 관광 리뷰 데이터를 활용한 선행연구들의 경우 국내 관광객 중심의 연구가 대다수 수행되었으며, 외국인 관광객 연구의 경우 일부 언어로 수집된 데이터와 텍스트 마이닝 기법에 한정하여 연구가 수행되었다. 이에 본 연구에서는 온라인 리뷰 사이트를 통해 '대구 명소' 키워드를 지정하여 외국인들이 작성한 리뷰 데이터 3,515건을 수집하였다. 그리고 LDA 기반의 토픽모델링을 수행하여 관광 토픽을 도출하였으며, 각 토픽별 전역 및 국지적 공간 분석을 수행한 점이 선행연구와 차별성이라 할 수 있다. 분석 결과 전역적 공간 자기상관이 존재하며, 외국인들이 주로 방문하는 관광지들이 국지적으로 결집되어 있음을 확인하였다. 또한 대다수 토픽에서 중구를 중심으로 핫스팟이 도출되었으며, 분석 결과를 바탕으로 지자체 외국인 관광정책 수립 및 토픽모델링 기반의 공간분석 연구의 기초연구로 활용되길 기대하며, 본 연구의 한계점 또한 제시하였다.

사용자 리뷰의 평가기준 별 이슈 식별 방법론: 호텔 리뷰 사이트를 중심으로 (Methodology for Identifying Issues of User Reviews from the Perspective of Evaluation Criteria: Focus on a Hotel Information Site)

  • 변성호;이동훈;김남규
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.23-43
    • /
    • 2016
  • 최근 IT기술의 발전에 따라 많은 사람들이 자신들의 여가활동에 대한 경험을 공유하고 있으며, 역으로 다른 사람들의 여가활동에 대한 경험을 참고하여 더 나은 여가활동을 누릴 수 있는 기회를 얻게 되었다. 이러한 현상은 영화, 숙박, 음식, 여행 등 여가활동 전반에 걸쳐 나타나고 있으며, 그 중심에는 여가활동에 대한 정보를 요약하여 제공하는 수많은 사이트가 있다. 대부분의 여가활동 정보 사이트는 각 상품에 대한 평균 평점뿐만 아니라 상세 리뷰를 제공함으로써, 해당 상품을 구매하고자 하는 잠재고객의 의사결정을 지원하고 있다. 하지만 기존 대부분의 사이트는 한 단계의 평가기준에 따라 평점과 리뷰를 제공하기 때문에, 각 평가기준을 구성하는 세부요소에 대한 특징과 평가기준 별 주요 이슈를 파악하기 위해서는 상당히 많은 수의 리뷰를 직접 읽어야 한다는 불편이 따른다. 즉 사용자는 자신이 중요한 것으로 생각하는 평가기준에 대한 조건을 파악하기 위해, 많은 수의 리뷰를 하나하나 읽어보는 과정에서 많은 시간과 노력을 소비하게 된다. 예를 들어 호텔의 접근성, 객실, 서비스, 음식 등 한 단계의 평가기준만을 사용하여 평점과 리뷰를 제공하는 사이트의 경우, 접근성 중 특히 지하철역과의 거리, 객실 중 특히 욕실의 상태를 살펴보고자 하는 사용자에게 필요한 정보를 충분히 제공하지 못하게 된다. 따라서 본 연구에서는 기존 여가활동 정보 사이트의 한계, 즉 평가기준별로 입력된 리뷰를 신뢰하기 어렵다는 점과 평가기준을 구성하고 있는 세부 내용을 파악하기 어렵다는 점을 극복하기 위한 방안을 제시하고자 한다. 본 연구에서 제안하는 방법론은 사용자가 별도의 구분 없이 입력한 리뷰를 그 내용에 따라 평가기준별로 자동 분류하고, 각 평가 기준 별 주요 이슈를 요약하여 제공한다. 제안 방법론은 최근 텍스트 분석에 활발하게 사용되고 있는 토픽 모델링(Topic Modeling)에 기반을 두고 있으며, 각 리뷰를 하나의 문서 단위로 사용하는 것이 아니라 리뷰를 문장 단위로 끊어 개별 리뷰 유닛(Review Unit)으로 분해한 뒤, 평가기준별로 리뷰 유닛을 재구성하여 분석한다는 측면에서 기존의 토픽 모델링 기반 연구와 큰 차이가 있다고 할 수 있다. 본 논문에서는 제안 방법론을 실제 호텔 정보 사이트에서 수집한 423건의 리뷰 문서에 적용하여 6가지 평가기준에 대해 총 4,860건의 리뷰 유닛을 재구성하고, 이에 대한 분석 결과를 소개함으로써 제안 방법론의 유용성을 간접적으로 보인다.

텍스트 마이닝을 활용한 공공기관 서비스 로봇에 대한 사용자 리뷰 분석 : 안내로봇 사례를 중심으로 (Text Mining Analysis of Customer Reviews on Public Service Robots: With a focus on the Guide Robot Cases)

  • 신효림;최준호;오창훈
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.787-797
    • /
    • 2023
  • 공공기관에서 서비스 로봇, 특히 안내로봇의 사용이 보편화 되며 다양한 곳에서 사람들을 만나고 있다. 그러나 4년이 넘는 시간 동안 사용자가 안내로봇을 만나왔지만, 아직까지 사용자와 안내로봇의 상호작용에 대한 탐구가 부족한 실정이다. 이에 이 연구는 안내로봇에 대한 사용자 경험을 탐구하고자, 가장 오랜 기간 동안 사용자를 만난 안내로봇인 '큐아이'를 연구 대상으로 선정하여 서비스를 시작한 시점부터 작성된 모든 리뷰를 수집하였다, TF-IDF로 주요 키워드를 확인하고 토픽 모델링을 통해 사용자 경험 요인을 도출하였으며 감성 분석을 통해 사용자 경험 저해 요인을 살펴보았다. 분석 결과, 안내로봇의 기능, 외형, 상호작용 방식, 그리고 안내로봇의 문화해설사 역할과 도우미 역할이 핵심 사용자 경험 요인으로 나타났다. 부정적 리뷰를 통해 확인한 저해 요인은 이를 개선할 수 있도록 인터랙션 설계와 멀티모달 인터페이스를 활용한 서비스 디자인, 문화해설사로서의 콘텐츠 개발 등 향후 방향성을 제안하였다. 이 연구는 안내로봇의 사용자 경험을 분석하고 개선방안을 제시한 것에 의의가 있다.

의미 프레임 자질 기반 의견 스팸 분석 (Deep Semantic Feature based Deceptive Opinion Spam Analysis)

  • 김성순;장혁윤;이성운;강재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.1001-1004
    • /
    • 2015
  • 소설미디어의 급증과 함께 온라인 리뷰의 의존성이 급증하는 가운데 사용자의 올바른 의사결정을 저해하는 기만적 의견 스팸 이슈가 새롭게 주목받고 있다. 기존의 의견 스팸 연구는 실제 리뷰와 의견 스팸 간의 차이를 어휘, 품사 또는 감정단어와 같은 표면적 자질을 통해 설명하였으나 그들간의 의미적 연결관계는 고려하지 않았다. 본 논문에서는 1) 의미적 프레임 기반의 텍스트 분석기법을 제안하고, 이를 바탕으로 2) 의견 스팸과 실제 리뷰간의 의미적 차이가 있음을 규명하며 3) 새로운 의미적 프레임 자질을 사용하여 기존의 의견 스팸 분류 성능을 향상시킬 수 있음을 보인다.

공간 결합과 심층신경망을 활용한 관광지 다중 분류 추천 시스템 (Multiple classification recommendation system using spatial combination and deep learning)

  • 안현우;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.43-46
    • /
    • 2019
  • 관광지에 대한 관광객의 평가는 날씨, 계절, 관광객의 밀집 정도 등 다양한 환경적 요소에 따라 변화한다. 각 관광지는 객관적인 관점으로 최상의 관광을 경험하게 할 고유한 컨디션이 존재하며 이를 추출하기 위해선 관광에 영향을 주는 여러 환경들에 대한 다중 요인 분석이 가능할 만큼의 정보가 필요하다. 본 논문에서는 심층신경망을 기반으로 한 문장분석기술을 응용하여 관광지 리뷰에 적용, 평점이 포함되지 않은 리뷰에 평점을 추가하여 기상이나 계절, 휴무일 등의 다양한 분류가 가능할 수준의 데이터를 보충하고 축적/보충된 방대한 평점데이터를 토대로 맞춤 추천이 가능하도록 하는 시스템을 설명한다. 이에 본 논문은 학습 환경 구축, 리뷰와 기상 정보의 결합, 최종 추천 방법 등 전반적인 프로세스에 대한 내용을 설명한다.

시리즈물 리뷰의 긍정 유사도가 흥행에 미치는 영향을 분석하기 위한 텍스트 분류 (Text Classification to Analyze the Effect of Positive Similarity in Series Reviews on the Box Office Performance)

  • 김수진;조형민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.843-846
    • /
    • 2022
  • 오늘날 인터넷이 보편화되었고, 최근에는 최근에는 코로나19 유행으로 사람들이 집에 머무르는 시간이 많아지면서 여러 온라인 플랫폼을 통해 영화, 드라마 등의 프로그램을 시청하는 것에 관심이 많아지고 있다. 또한, 그러한 시대적 흐름에 따라 시즌제 형식의 시리즈물을 통해 보다 퀄리티 높은 콘텐츠를 보고자 하는 소비자 니즈도 증가하고 있다. 시리즈물은 전편과 속편이 유기적으로 연결되기 때문에 전편의 리뷰를 분석하여 관객의 니즈를 파악하고 그것을 속편에 반영하는 것이 중요해 보인다. 따라서 본 연구에서는 텍스트 분류를 통해 시리즈물의 전편과 속편 리뷰의 긍정 유사도를 비교하고, 나아가 긍정 유사도가 흥행 성적에 유의미한 영향을 미치는지 알아보고자 한다.

  • PDF