Two-step Document Summarization using Deep Learning and Maximal Marginal Relevance

딥러닝과 Maximal Marginal Relevance를 이용한 2단계 문서 요약

  • Jeon, Jaewon (Kangwon National University Dept. of Computer Science) ;
  • Hwang, Hyunsun (Kangwon National University Dept. of Computer Science) ;
  • Lee, Changki (Kangwon National University Dept. of Computer Science)
  • 전재원 (강원대학교 컴퓨터과학과) ;
  • 황현선 (강원대학교 컴퓨터과학과) ;
  • 이창기 (강원대학교 컴퓨터과학과)
  • Published : 2019.10.10

Abstract

문서 요약은 길이가 긴 원본 문서의 의미는 유지한 채 원본보다 짧은 문서나 문장을 생성하는 자연어 처리 태스크이다. 본 논문에서는 Maximal Marginal Relevance(MMR)를 이용한 sequence-to-sequence 문장 추출 모델을 이용하여 의미가 중복되는 문장을 최소화하는 문장을 추출하고 추출된 문장을 sequence-to-sequence 모델을 통해 요약문을 생성하는 2단계 문서 요약 모델을 제안한다. 실험 결과 MMR을 활용하지 않았던 기존의 방법론보다 Rouge 성능이 향상되었다.

Keywords

Acknowledgement

이 논문은 SK주식회사C&C의 지원을 받아 연구되었음.