Korean Pre-trained Model KE-T5-based Automatic Paper Summarization

한국어 사전학습 모델 KE-T5 기반 자동 논문 요약

  • Seo, Hyeon-Tae (Korea Electronics Technology Institute) ;
  • Shin, Saim (Korea Electronics Technology Institute) ;
  • Kim, San (Korea Electronics Technology Institute)
  • 서현태 (한국전자기술연구원) ;
  • 신사임 (한국전자기술연구원) ;
  • 김산 (한국전자기술연구원)
  • Published : 2021.10.14

Abstract

최근 인터넷에서 기하급수적으로 증가하는 방대한 양의 텍스트를 자동으로 요약하려는 연구가 활발하게 이루어지고 있다. 자동 텍스트 요약 작업은 다양한 사전학습 모델의 등장으로 인해 많은 발전을 이루었다. 특히 T5(Text-to-Text Transfer Transformer) 기반의 모델은 자동 텍스트 요약 작업에서 매우 우수한 성능을 보이며, 해당 분야의 SOTA(State of the Art)를 달성하고 있다. 본 논문에서는 방대한 양의 한국어를 학습시킨 사전학습 모델 KE-T5를 활용하여 자동 논문 요약을 수행하고 평가한다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.2021-0-00354, 비정형 텍스트를 학습하여 쟁점별 사실과 논리적 근거 추론이 가능한 인공지능 원천기술)