다양한 앙상블 알고리즘을 이용한 한국어 의존 구문 분석

Korean Dependency Parsing Using Various Ensemble Models

  • 조경철 (가천대학교, 소프트웨어학과) ;
  • 김주완 (가천대학교, 소프트웨어학과) ;
  • 김균엽 (가천대학교, 소프트웨어학과) ;
  • 박성진 (가천대학교, 소프트웨어학과) ;
  • 강상우 (가천대학교, 소프트웨어학과)
  • 발행 : 2019.10.10

초록

본 논문은 최신 한국어 의존 구문 분석 모델(Korean dependency parsing model)들과 다양한 앙상블 모델(ensemble model)들을 결합하여 그 성능을 분석한다. 단어 표현은 미리 학습된 워드 임베딩 모델(word embedding model)과 ELMo(Embedding from Language Model), Bert(Bidirectional Encoder Representations from Transformer) 그리고 다양한 추가 자질들을 사용한다. 또한 사용된 의존 구문 분석 모델로는 Stack Pointer Network Model, Deep Biaffine Attention Parser와 Left to Right Pointer Parser를 이용한다. 최종적으로 각 모델의 분석 결과를 앙상블 모델인 Bagging 기법과 XGBoost(Extreme Gradient Boosting) 이용하여 최적의 모델을 제안한다.

키워드

과제정보

이 연구는 2019년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(No. NRF-2019R1C1C1006299)