Korean Dependency Parsing Using Deep Bi-affine Network and Stack Pointer Network

Deep Bi-affine Network와 스택 포인터 네트워크를 이용한 한국어 의존 구문 분석 시스템

  • Ahn, Hwijeen (Sogang University, Natural Language Processing Lab) ;
  • Park, Chanmin (Sogang University, Natural Language Processing Lab) ;
  • Seo, Minyoung (Sogang University, Natural Language Processing Lab) ;
  • Lee, Jaeha (Sogang University, Natural Language Processing Lab) ;
  • Son, Jeongyeon (Sogang University, Natural Language Processing Lab) ;
  • Kim, Juae (Sogang University, Natural Language Processing Lab) ;
  • Seo, Jeongyeon (Sogang University, Natural Language Processing Lab)
  • 안휘진 (서강대학교, 자연어처리 연구실) ;
  • 박찬민 (서강대학교, 자연어처리 연구실) ;
  • 서민영 (서강대학교, 자연어처리 연구실) ;
  • 이재하 (서강대학교, 자연어처리 연구실) ;
  • 손정연 (서강대학교, 자연어처리 연구실) ;
  • 김주애 (서강대학교, 자연어처리 연구실) ;
  • 서정연 (서강대학교, 자연어처리 연구실)
  • Published : 2018.10.12

Abstract

의존 구문 분석은 자연어 이해 영역의 대표적인 과제 중 하나이다. 본 논문에서는 한국어 의존 구분 분석의 성능 향상을 위해 Deep Bi-affine Network 와 스택 포인터 네트워크의 앙상블 모델을 제안한다. Bi-affine 모델은 그래프 기반 방식, 스택 포인터 네트워크의 경우 그래프 기반과 전이 기반의 장점을 모두 사용하는 모델로 서로 다른 모델의 앙상블을 통해 성능 향상을 기대할 수 있다. 두 모델 모두 한국어 어절의 특성을 고려한 자질을 사용하였으며 세종 의존 구문 분석 데이터에 대해 UAS 90.60 / LAS 88.26(Deep Bi-affine Network), UAS 92.17 / LAS 90.08(스택 포인터 네트워크) 성능을 얻었다. 두 모델에 대한 앙상블 기법 적용시 추가적인 성능 향상을 얻을 수 있었다.

Keywords