한국정보처리학회:학술대회논문집 (Annual Conference of KIPS)
- 한국정보처리학회 2023년도 추계학술발표대회
- /
- Pages.518-521
- /
- 2023
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
사전 학습 언어 모델을 이용한 한국어 문서 추출 요약 비교 분석
A Comparative Study on the Korean Text Extractive Summarization using Pre-trained Language Model
- Young-Rae Cho (T3Q(주)) ;
- Kwang-Hyun Baek (T3Q(주)) ;
- Min-Ji Park (T3Q(주)) ;
- Byung Hoon Park (T3Q(주)) ;
- Sooyeon Shin (Center for Creative Convergence Education, Hanyang University(Seoul))
- 발행 : 2023.11.02
초록
오늘날 과도한 정보의 양 속에서 디지털 문서 내 중요한 정보를 효율적으로 획득하는 것은 비용 효율의 측면에서 중요한 요구사항이 되었다. 문서 요약은 자연어 처리의 한 분야로서 원본 문서의 핵심적인 정보를 유지하는 동시에 중요 문장을 추출 또는 생성하는 작업이다. 이 중 추출요약은 정보의 손실 및 잘못된 정보 생성의 가능성을 줄이고 요약 가능하다. 그러나 여러 토크나이저와 임베딩 모델 중 적절한 활용을 위한 비교가 미진한 상황이다. 본 논문에서는 한국어 사전학습된 추출 요약 언어 모델들을 선정하고 추가 데이터셋으로 학습하고 성능 평가를 실시하여 그 결과를 비교 분석하였다.
키워드