DOI QR코드

DOI QR Code

Korean Text Automatic Summarization using Semantically Expanded Sentence Similarity

의미적으로 확장된 문장 간 유사도를 이용한 한국어 텍스트 자동 요약

  • Kim, Heechan (Dept. of Computer Science, Soongsil University) ;
  • Lee, Soowon (Dept. of Computer Science, Soongsil University)
  • 김희찬 (숭실대학교 컴퓨터학과) ;
  • 이수원 (숭실대학교 컴퓨터학과)
  • Published : 2014.11.05

Abstract

텍스트 자동 요약은 수많은 텍스트 데이터를 처리함에 있어 중요한 연구 분야이다. 이중 추출요약은 현재 가장 많이 연구가 되고 있는 자동 요약 분야이다. 본 논문은 추출 요약의 선두 연구인 TextRank는 문장 간 유사도를 계산할 때 문장 내 단어 간의 의미적 유사성을 충분히 고려하지 못하였다. 본 연구에서는 의미적 유사성을 고려한 새로운 단어 간 유사도 측정 방법을 제안한다. 추출된 문장 간 유사도는 그래프로 표현되며, TextRank의 랭킹 알고리즘과 동일한 랭킹 알고리즘을 사용하여 실험적으로 평가하였다. 그 결과 문장 간 유사성을 고려할 때 단어의 의미적 요소를 충분히 고려하여 정보의 유실을 최소화하여야 한다는 것을 실험 결과로써 확인할 수 있었다.

Keywords