Comparison of Pointer Network-based Dependency Parsers Depending on Attention Mechanisms

Attention Mechanism에 따른 포인터 네트워크 기반 의존 구문 분석 모델 비교

  • Han, Mirae (Konkuk University, Department of Artificial Intelligence) ;
  • Park, Seongsik (Konkuk University, Department of Artificial Intelligence) ;
  • Kim, Harksoo (Konkuk University, Computer Science and Engineering)
  • 한미래 (건국대학교 인공지능학과) ;
  • 박성식 (건국대학교 인공지능학과) ;
  • 김학수 (건국대학교 컴퓨터공학부)
  • Published : 2021.10.14

Abstract

의존 구문 분석은 문장 내 의존소와 지배소 사이의 관계를 예측하여 문장 구조를 분석하는 자연어처리 태스크이다. 최근의 딥러닝 기반 의존 구문 분석 연구는 주로 포인터 네트워크를 사용하는 방법으로 연구되고 있다. 포인터 네트워크는 내부적으로 사용하는 attention 기법에 따라 성능이 달라질 수 있다. 따라서 본 논문에서는 포인터 네트워크 모델에 적용되는 attention 기법들을 비교 분석하고, 한국어 의존 구문 분석 모델에 가장 효과적인 attention 기법을 선별한다. KLUE 데이터 셋을 사용한 실험 결과, UAS는 biaffine attention을 사용할 때 95.14%로 가장 높은 성능을 보였으며, LAS는 multi-head attention을 사용했을 때 92.85%로 가장 높은 성능을 보였다.

Keywords

Acknowledgement

이 논문은 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No. 2013-0-00131, (엑소브레인-총괄/1세부) 휴먼 지식 증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발). 또한 본 연구는 과학기술정보통신부 및 정보통신기획평가원의 대학ICT연구센터육성지원사업의 연구결과로 수행되었음(IITP-2021-2016-0-00465)