Query-Based Summarization using Non-negative Matrix Factorization

비음수 행렬 인수분해를 이용한 질의 기반의 문서 요약

  • Park Sun (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Lee Ju-Hong (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Ahn Chan-Min (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Park Tae-Su (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Kim Deok-Hwan (School of Electronic and Electrical Engineering, Inha University)
  • 박선 (인하대학교 컴퓨터정보공학과) ;
  • 이주홍 (인하대학교 컴퓨터정보공학과) ;
  • 안찬민 (인하대학교 컴퓨터정보공학과) ;
  • 박태수 (인하대학교 컴퓨터정보공학과) ;
  • 김덕환 (인하대학교 전자전기공학부)
  • Published : 2006.06.01

Abstract

기존 질의기반의 문서요약은 질의와 문서간의 사전 학습으로 요약의 질을 높이거나, 문서의 고유 구조(inherent structure)를 반영하여 요약의 정확도를 높이기 위하여 문서를 그래프로 변환한다. 본 논문은 비음수 행렬 인수분해 (NMF, Non-negative Matrix Factorization)를 이용하여 질의 기반의 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 질의와 문서간에 사전학습이 필요 없다. 또한 문서를 그래프로 변형시키는 복잡한 처리 없이 NMF에 의해 얻어진 의미 특징(semantic feature)과 의미 변수(semantic variable)로 문서의 고유 구조를 반영하여 요약의 정확도를 높일 수 있다. 마지막으로 단순한 방법으로 문장을 쉽게 요약 할 수 있다.

Keywords