Korean Relation Extraction Using Pre-Trained Language Model and GCN

사전학습 언어모델과 GCN을 이용한 한국어 관계 추출

  • Je-seung Lee (Dept. of Computer Engineering and Interdisciplinary Major of Maritime AI Convergence, Korea Maritime & Ocean University) ;
  • Jae-hoon Kim (Dept. of Computer Engineering and Interdisciplinary Major of Maritime AI Convergence, Korea Maritime & Ocean University)
  • 이제승 (한국해양대학교, 컴퓨터공학과 및 해양인공지능융합전공) ;
  • 김재훈 (한국해양대학교, 컴퓨터공학과 및 해양인공지능융합전공)
  • Published : 2022.10.18

Abstract

관계 추출은 두 개체 간의 관계를 식별하는 작업이며, 비정형 텍스트를 구조화시키는 역할을 하는 작업 중 하나이다. 현재 관계 추출에서 다양한 모델에 대한 연구들이 진행되고 있지만, 한국어 관계 추출 모델에 대한 연구는 영어에 비해 부족하다. 따라서 본 논문에서는 NE(Named Entity)태그 정보가 반영된 TEM(Typed Entity Marker)과 의존 구문 그래프를 이용한 한국어 관계 추출 모델을 제안한다. 모델의 학습과 평가 말뭉치는 KLUE에서 제공하는 관계 추출 학습 말뭉치를 사용하였다. 실험 결과 제안 모델이 68.57%의 F1 점수로 실험 모델 중 가장 높은 성능을 보여 NE태그와 구문 정보가 관계 추출 성능을 향상시킬 수 있음을 보였다.

Keywords