Dependency parsing applying reinforced dominance-dependency constraint rule: Combination of deep learning and linguistic knowledge

강화된 지배소-의존소 제약규칙을 적용한 의존구문분석 모델 : 심층학습과 언어지식의 결합

  • JoongMin Shin (Dept. of Information Convergence Engineering Pusan National University) ;
  • Sanghyun Cho (Dept. of Information Convergence Engineering Pusan National University) ;
  • Seunglyul Park (Dept. of Information Convergence Engineering Pusan National University) ;
  • Seongki Choi (Dept. of Information Convergence Engineering Pusan National University) ;
  • Minho Kim (Dept. of Software, Catholic University of Pusan) ;
  • Miyeon Kim (KT Corporation) ;
  • Hyuk-Chul Kwon (Dept. of Information Convergence Engineering Pusan National University)
  • 신중민 (부산대학교 정보융합공학과) ;
  • 조상현 (부산대학교 정보융합공학과) ;
  • 박승렬 (부산대학교 정보융합공학과) ;
  • 최성기 (부산대학교 정보융합공학과) ;
  • 김민호 (부산카톨릭대학교 소프트웨어학과) ;
  • 김미연 (주식회사 KT) ;
  • 권혁철 (부산대학교 정보융합공학과)
  • Published : 2022.10.18

Abstract

의존구문분석은 문장을 의존관계(의존소-지배소)로 분석하는 구문분석 방법론이다. 현재 사전학습모델을 사용한 전이 학습의 딥러닝이 좋은 성능을 보이며 많이 연구되지만, 데이터셋에 의존적이며 그로 인한 자료부족 문제와 과적합의 문제가 발생한다는 단점이 있다. 본 논문에서는 언어학적 지식에 기반한 강화된 지배소-의존소 제약규칙 에지 알고리즘을 심층학습과 결합한 모델을 제안한다. TTAS 표준 가이드라인 기반 모두의 말뭉치로 평가한 결과, 최대 UAS 96.28, LAS 93.19의 성능을 보였으며, 선행연구 대비 UAS 2.21%, LAS 1.84%의 향상된 결과를 보였다. 또한 적은 데이터셋으로 학습했음에도 8배 많은 데이터셋 학습모델 대비 UAS 0.95%의 향상과 11배 빠른 학습 시간을 보였다. 이를 통해 심층학습과 언어지식의 결합이 딥러닝의 문제점을 해결할 수 있음을 확인하였다.

Keywords

Acknowledgement

이 논문은 2022년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No. 2013-2-00131, (엑소브레인-총괄/1세부) 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발)