DOI QR코드

DOI QR Code

A study on the aspect-based sentiment analysis of multilingual customer reviews

다국어 사용자 후기에 대한 속성기반 감성분석 연구

  • Sungyoung Ji (Department of Statistics, Hankuk University of Foreign Studies) ;
  • Siyoon Lee (Department of Statistics, Hankuk University of Foreign Studies) ;
  • Daewoo Choi (Department of Statistics, Hankuk University of Foreign Studies) ;
  • Kee-Hoon Kang (Department of Statistics, Hankuk University of Foreign Studies)
  • 지성영 (한국외국어대학교 통계학과) ;
  • 이시윤 (한국외국어대학교 통계학과) ;
  • 최대우 (한국외국어대학교 통계학과) ;
  • 강기훈 (한국외국어대학교 통계학과)
  • Received : 2023.04.02
  • Accepted : 2023.05.30
  • Published : 2023.12.31

Abstract

With the growth of the e-commerce market, consumers increasingly rely on user reviews to make purchasing decisions. Consequently, researchers are actively conducting studies to effectively analyze these reviews. Among the various methods of sentiment analysis, the aspect-based sentiment analysis approach, which examines user reviews from multiple angles rather than solely relying on simple positive or negative sentiments, is gaining widespread attention. Among the various methodologies for aspect-based sentiment analysis, there is an analysis method using a transformer-based model, which is the latest natural language processing technology. In this paper, we conduct an aspect-based sentiment analysis on multilingual user reviews using two real datasets from the latest natural language processing technology model. Specifically, we use restaurant data from the SemEval 2016 public dataset and multilingual user review data from the cosmetic domain. We compare the performance of transformer-based models for aspect-based sentiment analysis and apply various methodologies to improve their performance. Models using multilingual data are expected to be highly useful in that they can analyze multiple languages in one model without building separate models for each language.

전자상거래 시장의 성장과 더불어 소비자들은 상품 및 서비스 구매 시 다른 사용자가 작성한 후기 정보에 기반하여 구매 의사를 결정하게 되며 이러한 후기를 효과적으로 분석하기 위한 연구가 활발히 이루어지고 있다. 특히, 사용자 후기에 대해 단순 긍/부정으로 감성분석하는 것이 아니라 다면적으로 분석하는 속성기반 감성분석 방법이 주목받고 있다. 속성기반 감성분석을 위한 다양한 방법론 중 최신 자연어 처리 기술인 트랜스포머 계열 모델을 활용한 분석 방법이 있다. 본 논문에서는 최신 자연어 처리 기술 모델에 두 가지 실제 데이터를 활용하여 다국어 사용자 후기에 대한 속성기반 감성분석을 진행하였다. 공개된 데이터 셋인 SemEval 2016의 Restaurant 데이터와 실제 화장품 도메인에서 작성된 다국어 사용자 후기 데이터를 활용하여 속성기반 감성분석을 위한 트랜스포머 계열 모델의 성능을 비교하였고 성능 향상을 위한 다양한 방법론도 적용하였다. 다국어 데이터를 활용한 모델을 통해 언어별로 별도의 모델을 구축하지 않고 한가지 모델로 다국어를 분석할 수 있다는 점에서 효용 가치가 클 것으로 예상된다.

Keywords

Acknowledgement

본 연구가 성공적으로 수행될 수 있도록 다각도로 지원해 주신 정보통신산업진흥원(NIPA)에 감사드립니다.

References

  1. Brown T, Mann B, Ryder N et al. (2020). Language models are few-shot learners, Advances in Neural Information Processing Systems, 33, 1-25, Available from: arXiv:2005.14165.
  2. Conneau A, Khandelwal K, Goyal N et al. (2020). Unsupervised cross-lingual representation learning at scale, In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, Seattle, 8440-8451, Available from: arXiv:1911.02116.
  3. Devlin J, Chang MW, Lee L, and Toutanova K (2019). BERT: Pre-training of deep bidirectional transformers for language understanding, Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 1, 4171-4186.
  4. Park HJ and Shin KS (2020). Aspect-based sentiment analysis using BERT: Developing aspect category sentiment classification models, Journal of Intelligence and Information Systems, 26, 1-25.
  5. Pires T, Schlinger E, and Garrette D (2019). How multilingual is multilingual BERT?, In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Florence, Italy, 4996-5001, Available from: arXiv:1906.01502.
  6. SemEval (2016). Restaurant 2016 data, Available from: https://alt.qcri.org/semeval2016/task5/index.php?id=data-and-tools
  7. Sun C, Huang L, and Qiu X (2019). Utilizing BERT for Aspect-Based Sentiment Analysis via Constructing Auxiliary Sentence, Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 1, 380-385, Available from: arXiv:1903.09588.
  8. Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez AN, Kaiser L, and Polosukhin I (2017). Attention is all you need, Advances in Neural Information Processing Systems, 30, 5998-6008.
  9. Zhang W, Li X, Deng Y, Bing L, and Lam W (2022). A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges, Available from: arXiv:2203.01054.