DOI QR코드

DOI QR Code

Intelligent Korean Sentence Summarization Technique Combining KoBART and GSG

KoBART와 GSG를 결합한 지능형 한국어 문장 요약 기법

  • 심현솔 (숭실대학교 소프트웨어학부) ;
  • 박현빈 (숭실대학교 소프트웨어학부) ;
  • 박지영 (숭실대학교 소프트웨어학부) ;
  • 신재원 (숭실대학교 소프트웨어학부) ;
  • 김영종 (숭실대학교 소프트웨어학부)
  • Published : 2023.05.18

Abstract

본 논문에서는 한국어 데이터와 모델링, 추가 평가 지표를 통해 Text Summarization 분야에서 한국어로 좋은 성능을 내기 위한 방식을 제안한다. KoBART의 크기를 키우고 PEGASUS의 GSG를 사용하는 KoBART-GSG 모델을 제안한다. 이때 ASR 모델을 사용하여 한국어 데이터를 구축하고 추가 학습을 진행한다. 또한, 생성된 요약문과 원문에서 Attention 기법으로 키워드와 핵심 문장을 추출하여 지능형 텍스트를 구성하는 새로운 방식을 제안한다. ASR Open API와 제안한 방식을 사용하여 오디오 파일을 텍스트로 변환하고 요약하는 강의나 회의 등 학계와 산업에서 사용할 수 있는 서비스를 제공한다.

Keywords