DOI QR코드

DOI QR Code

Identification of sentiment keywords association-based hotel network of hotel review using mapper method in topological data analysis

Topological Data Analysis 기법을 활용한 호텔 리뷰데이터의 감성 키워드 기반 호텔 관계망 구축

  • 전예슬 (연세대학교 응용통계학과) ;
  • 김정재 (다음소프트 인공지능랩)
  • Received : 2019.11.21
  • Accepted : 2020.01.02
  • Published : 2020.02.29

Abstract

Hotel review data can extract various information that includes purchasing factors that lead to consumption, advantages, and disadvantages for hotels. In particular, the sentiment keyword of the review data helps consumers understand the pros and cons of hotels. However, it is not efficient for consumers to read a large number of reviews. Therefore, it is necessary to offer a summary review to customers. In this study, we suggest providing summary information on sentiment keywords association as well as a network of hotels based on sentiment keywords. Based on a sentiment keyword dictionary, the extracted sentiment keywords associations construct the hotel network through topological data analysis based mapper. This hotel network allows a consumer to find some hotels associated with specific sentiment keywords as well as recommends the same related hotels. This summary information provides users with a summarized emotional assessment of hotels and helps hotel marketing teams understand consumers' perceptions of their hotel.

호텔 리뷰 데이터에는 소비를 이끈 구매 요인, 호텔에 대한 장점 및 단점 등 다양한 정보를 추출할 수 있다. 특히, 리뷰 데이터의 감성 키워드는 소비자들이 호텔에 관해 이야기하고 있는 평가 및 반응 등의 주요 내용을 파악하는 데 도움을 준다. 하지만 많은 양의 리뷰 데이터를 소비자가 직접 살펴보기에는 효율성이 떨어진다. 이를 위해 리뷰 데이터를 요약하는 기술이 요구된다. 본 연구에서는 기존의 감성 키워드 관계망을 구축하는 연구에 더 나아가, 이와 관련된 호텔에 대한 정보까지 동시에 제공하고자 한다. 이를 위해 호텔 도메인에 적합한 감성 키워드 사전을 구축하고, 이를 바탕으로 위상학적 데이터 분석 기반의 맵퍼(topological data analysis based mapper)를 통해서 감성 키워드 기반의 호텔 관계망을 구축한다. 구축된 관계망을 통해 유사한 감성을 기반으로 연결된 호텔들을 살펴볼 수 있으며 동시에, 호텔에 대한 감성 정보도 파악할 수 있다. 이러한 리뷰 요약 정보는 사용자들에게 호텔들에 대한 요약된 감성 평가를 제공하며, 호텔 마케팅 및 전략 기획팀에 분석 대상에 대한 소비자들의 인식을 파악할 수 있도록 돕는다.

Keywords

References

  1. Guo, W. and Banerjee, A. G. (2017). Identification of key features using topological data analysis for accurate prediction of manufacturing system outputs, Journal of Manufacturing Systems, 43, 225-234. https://doi.org/10.1016/j.jmsy.2017.02.015
  2. Ha, H. J., Kim, G. N., and Lee, K. W. (2013). A study on analysis of affective words in movie reviews and the situation of watching movies, Design Convergence Study, 12, 17-32.
  3. Jung, M. J., Shin, S. M., and Choi, Y. S. (2019). Creation and clustering of proximity data for text data analysis, The Korean Journal of Applied Statistics, 32, 451-462. https://doi.org/10.5351/KJAS.2019.32.3.451
  4. Kruskal, J. (1964). Nonmetric multidimensional scaling: a numerical method, Psychometrika, 29, 115-129. https://doi.org/10.1007/BF02289694
  5. Maaten, L. V. D. and Hinton, G. (2008). Visualizing data using t-SNE, Journal of Machine Learning Research, 9, 2579-2605.
  6. Singh, G., Memoli, F., and Carlsson, G. E. (2007). Topological methods for the analysis of high dimensional data sets and 3D object recognition, SPBG.
  7. Zomorodian, A. and Carlsson, G. (2005). Computing persistent homology, Discrete and Computational Geometry, 33, 249-274. https://doi.org/10.1007/s00454-004-1146-y