Multi-task learning for entity-centric fact correction on machine summaries

기계 요약의 개체명 사실 수정을 위한 다중 작업 학습 방법 제안

  • Shin, JeongWan (Kyungpook National University, School of Computer Science and Engineering) ;
  • Noh, Yunseok (Kyungpook National University, School of Computer Science and Engineering) ;
  • Park, SangHeon (Kyungpook National University, School of Computer Science and Engineering) ;
  • O, YoungSun (Kyungpook National University, School of Computer Science and Engineering) ;
  • Park, Seyoung (Kyungpook National University, School of Computer Science and Engineering)
  • 신정완 (경북대학교 컴퓨터학부) ;
  • 노윤석 (경북대학교 컴퓨터학부) ;
  • 박상헌 (경북대학교 컴퓨터학부) ;
  • 오영선 (경북대학교 컴퓨터학부) ;
  • 박세영 (경북대학교 컴퓨터학부)
  • Published : 2021.10.14

Abstract

기계요약의 사실 불일치는 생성된 요약이 원문과 다른 사실 정보를 전달하는 현상이며, 특히 개체명이 잘못 사용되었을 때 기계요약의 신뢰성을 크게 훼손한다. 개체명의 수정을 위해서는 두 가지 작업을 수행해야한다. 먼저 요약 내 각 개체명이 올바르게 쓰였는지 판별을 해야하며, 이후 잘못된 개체명을 맞게 고치는 작업이 필요하다. 본 논문에서는 두 가지 작업 모두 각 개체명을 문맥적으로 이해함으로써 해결할 수 있다고 가정하고, 이에 따라 두 작업에 대한 다중 작업 학습 방법을 제안한다. 제안한 방법을 통해 학습한 모델은 생성된 기계요약에 대한 후처리 교정을 수행할 수 있다. 제안 모델을 평가하기 위해 강제적으로 개체명을 훼손시킨 요약데이터와 기계 요약 데이터에 대해서 성능을 평가 하였으며, 다른 개체명 수정 모델과 비교하였다. 제안모델은 개체명 수준에서 92.9%의 교정 정확도를 달성했으며, KoBART 요약모델이 만든 기계요약의 사실 정확도 4.88% 포인트 향상시켰다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.2016-0-00145, 어떤 주제에 대한 빅데이터를 스마트 보고서로 요약하는 기술 개발)