Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2018.10a
- /
- Pages.689-691
- /
- 2018
- /
- 2005-3053(pISSN)
Korean Dependency Parsing Using Deep Bi-affine Network and Stack Pointer Network
Deep Bi-affine Network와 스택 포인터 네트워크를 이용한 한국어 의존 구문 분석 시스템
- Ahn, Hwijeen (Sogang University, Natural Language Processing Lab) ;
- Park, Chanmin (Sogang University, Natural Language Processing Lab) ;
- Seo, Minyoung (Sogang University, Natural Language Processing Lab) ;
- Lee, Jaeha (Sogang University, Natural Language Processing Lab) ;
- Son, Jeongyeon (Sogang University, Natural Language Processing Lab) ;
- Kim, Juae (Sogang University, Natural Language Processing Lab) ;
- Seo, Jeongyeon (Sogang University, Natural Language Processing Lab)
- 안휘진 (서강대학교, 자연어처리 연구실) ;
- 박찬민 (서강대학교, 자연어처리 연구실) ;
- 서민영 (서강대학교, 자연어처리 연구실) ;
- 이재하 (서강대학교, 자연어처리 연구실) ;
- 손정연 (서강대학교, 자연어처리 연구실) ;
- 김주애 (서강대학교, 자연어처리 연구실) ;
- 서정연 (서강대학교, 자연어처리 연구실)
- Published : 2018.10.12
Abstract
의존 구문 분석은 자연어 이해 영역의 대표적인 과제 중 하나이다. 본 논문에서는 한국어 의존 구분 분석의 성능 향상을 위해 Deep Bi-affine Network 와 스택 포인터 네트워크의 앙상블 모델을 제안한다. Bi-affine 모델은 그래프 기반 방식, 스택 포인터 네트워크의 경우 그래프 기반과 전이 기반의 장점을 모두 사용하는 모델로 서로 다른 모델의 앙상블을 통해 성능 향상을 기대할 수 있다. 두 모델 모두 한국어 어절의 특성을 고려한 자질을 사용하였으며 세종 의존 구문 분석 데이터에 대해 UAS 90.60 / LAS 88.26(Deep Bi-affine Network), UAS 92.17 / LAS 90.08(스택 포인터 네트워크) 성능을 얻었다. 두 모델에 대한 앙상블 기법 적용시 추가적인 성능 향상을 얻을 수 있었다.