Query-Based Text Summarization Using Cosine Similarity and NMF

NMF 와 코사인유사도를 이용한 질의 기반 문서요약

  • Park Sun (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Lee Ju-Hong (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Ahn Chan-Min (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Park Tae-Su (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Song Jae-Won (Dept. of Computer Science and Information Engineering, Inha University) ;
  • Kim Deok-Hwan (School of Electronic and Electrical Engineering. Inha University)
  • 박선 (인하대학교 컴퓨터정보공학과) ;
  • 이주홍 (인하대학교 컴퓨터정보공학과) ;
  • 안찬민 (인하대학교 컴퓨터정보공학과) ;
  • 박태수 (인하대학교 컴퓨터정보공학과) ;
  • 송재원 (인하대학교 컴퓨터정보공학과) ;
  • 김덕환 (인하대학교 전자전기공학부)
  • Published : 2006.05.01

Abstract

인터넷의 발달로 인하여 정보의 양은 시간이 지날수록 폭발적으로 증가하고 있다. 이러한 방대한 정보로부터 정보검색시스템은 사용자에게 너무 많은 검색결과를 제시하여 사용자가 원하는 정보를 찾기 위해 너무 많은 시간을 소요하게 하는 정보의 과적재 문제가 있다. 질의 기반의 문서요약은 정보의 사용자가 원하는 정보의 검색시간을 줄임으로써 정보의 과적재 문제를 해결하는 방법으로서 점차 중요성이 증가하고 있다. 본 논문은 비음수 행렬 인수분해 (NMF, Non-negative Matrix Factorization)과 코사인 유사도를 이용하여 질의 기반의 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 질의와 문서 간에 사전학습이 필요 없다. 또한 문서를 그래프로 변형시키는 복잡한 처리 없이 NMF 에 의해 얻어진 의미 특징(semantic feature)과 의미 변수(semantic variable)로 문서의 고유 구조를 반영하여 요약의 정확도를 높일 수 있다. 마지막으로 단순한 방법으로 문장을 쉽게 요약할 수 있다.

Keywords