Developing a Korean sentiment lexicon through BPE

BPE를 활용한 한국어 감정사전 제작

  • Park, Ho-Min (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Cheon, Min-Ah (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Nam-Goong, Young (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Choi, Min-Seok (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Yoon, Ho (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Kim, Jae-Kyun (Department of Computer Engineering, Korea Maritime and Ocean University) ;
  • Kim, Jae-Hoon (Department of Computer Engineering, Korea Maritime and Ocean University)
  • 박호민 (한국해양대학교, 컴퓨터정보공학과) ;
  • 천민아 (한국해양대학교, 컴퓨터정보공학과) ;
  • 남궁영 (한국해양대학교, 컴퓨터정보공학과) ;
  • 최민석 (한국해양대학교, 컴퓨터정보공학과) ;
  • 윤호 (한국해양대학교, 컴퓨터정보공학과) ;
  • 김재균 (한국해양대학교, 컴퓨터정보공학과) ;
  • 김재훈 (한국해양대학교, 컴퓨터정보공학과)
  • Published : 2019.10.10

Abstract

감정분석은 텍스트에서 나타난 저자 혹은 발화자의 태도, 의견 등과 같은 주관적인 정보를 추출하는 기술이며, 여론 분석, 시장 동향 분석 등 다양한 분야에 두루 사용된다. 감정분석 방법은 사전 기반 방법, 기계학습 기반 방법 등이 있다. 본 논문은 사전 기반 감정분석에 필요한 한국어 감정사전 자동 구축 방법을 제안한다. 본 논문은 영어 감정사전으로부터 한국어 감정사전을 자동으로 구축하는 방법이며, 크게 세 단계로 구성된다. 첫 번째는 한영 병렬 말뭉치를 이용한 한영 이중언어 사전을 구축하는 단계이고, 두 번째는 한영 이중언어 사전을 통한 한영 이중언어 그래프를 생성하는 단계이며, 세 번째는 영어 단어의 감정값을 한국어 BPE의 감정값으로 전파하는 단계이다. 본 논문에서는 제안된 방법의 유효성을 보이기 위해 사전 기반 한국어 감정분석 시스템을 구축하여 평가하였으며, 그 결과 제안된 방법이 합리적인 방법임을 확인할 수 있었으며 향후 연구를 통해 개선한다면 질 좋은 한국어 감정사전을 효과적인 방법으로 구축할 수 있을 것이다.

Keywords

Acknowledgement

이 논문은 2017년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(NRF-2017M3C4A7068187, 한국어 정보처리 원천 기술 연구 개발)