Generic Summarization Using Generic Important of Semantic Features

의미특징의 포괄적 중요도를 이용한 포괄적 문서 요약

  • Park, Sun (Department of Computer Engineering, Honam University) ;
  • Lee, Jong-Hoon (Department of Multimedia & Film, Honam University)
  • 박선 (호남대학교 컴퓨터공학과) ;
  • 이종훈 (호남대학교 다매체영상학과)
  • Received : 2008.09.16
  • Accepted : 2008.10.30
  • Published : 2008.10.31

Abstract

With the increased use of the internet and the tremendous amount of data it transfers, it is more necessary to summarize documents. We propose a new method using the Non-negative Semantic Variable Matrix (NSVM) and the generic important of semantic features obtained by Non-negative Matrix Factorization (NMF) to extract the sentences for automatic generic summarization. The proposed method use non-negative constraints which is more similar to the human's cognition process. As a result, the proposed method selects more meaningful sentences for summarization than the unsupervised method used the Latent Semantic Analysis (LSA) or clustering methods. The experimental results show that the proposed method archives better performance than other methods.

인터넷의 급속한 확산과 대량 정보의 이동은 문서요약을 더욱 필요 하고 있다. 본 논문은 비음수 행렬 인수분해로 얻어진 비음수 의미 가변 행렬과 의미특징의 포괄적 중요도를 이용하여 문장을 추출하여서 포괄적 문서요약을 하는 새로운 방법을 제안하였다. 제안된 방법은 인간의 인식 과정과 유사한 비음수 제약을 사용한다. 이 결과 주제의 군집방법이나 잠재의미분석을 사용한 비지도 학습방법에 비해 더욱 의미 있는 문장을 선택하여 문서를 요약할 수 있다. 실험결과 제안방법이 다른 방법들에 비하여 좋은 성능을 보인다.

Keywords