Korean Named Entity Recognition Using ELECTRA and Label Attention Network

ELECTRA와 Label Attention Network를 이용한 한국어 개체명 인식

  • Kim, Hong-Jin (Kangwon National University Department of Computer and Communications Engineering) ;
  • Oh, Shin-Hyeok (Kangwon National University Department of Computer and Communications Engineering) ;
  • Kim, Hark-Soo (Konkuk University Department of Artificial Inteligence)
  • 김홍진 (강원대학교 컴퓨터정보통신공학전공) ;
  • 오신혁 (강원대학교 컴퓨터정보통신공학전공) ;
  • 김학수 (건국대학교 인공지능학과)
  • Published : 2020.10.14

Abstract

개체명 인식이란 문장에서 인명, 지명, 기관명 등과 같이 고유한 의미를 갖는 단어를 찾아 개체명을 분류하는 작업이다. 딥러닝을 활용한 연구가 수행되면서 개체명 인식에 RNN(Recurrent Neural Network)과 CRF(Condition Random Fields)를 결합한 연구가 좋은 성능을 보이고 있다. 그러나 CRF는 시간 복잡도가 분류해야 하는 클래스(Class) 개수의 제곱에 비례하고, 최근 RNN과 Softmax 모델보다 낮은 성능을 보이는 연구도 있었다. 본 논문에서는 CRF의 단점을 보완한 LAN(Label Attention Network)와 사전 학습 언어 모델인 음절 단위 ELECTRA를 활용하는 개체명 인식 모델을 제안한다.

Keywords

Acknowledgement

이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (No. 2020R1F1A1069737).