DOI QR코드

DOI QR Code

문서의 의미특징을 이용한 주제 기반의 다중문서 요약

Topic-Based Multi-Document Summarization using Semantic Features of Documents

  • 박선 (전북대학교 전자정보공학부) ;
  • 안동언 (전북대학교 전자정보공학부) ;
  • 김철원 (호남대학교 컴퓨터공학과)
  • Park, Sun (Division of Electronic & Information Engineering, Chonbuk National University) ;
  • An, Dong Un (Division of Electronic & Information Engineering, Chonbuk National University) ;
  • Kim, Chul-Won (Dept of Computer Engineering, Honam University)
  • 발행 : 2009.11.13

초록

인터넷의 발전은 대량의 정보를 양산하였고, 이러한 대량의 정보 집합 내에서는 비슷한 정보가 재활용 되거나 반복되는 정보중복문제를 가지고 있다. 중복되는 정보들로부터 사용자에게 원하는 정보를 신속히 검색할 수 있도록 하는 정보 요약에 대한 필요성은 점차 증가하고 있다. 본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)에 의한 문서의 의미특징을 이용하여 주제기반의 다중문서를 요약하는 새로운 방법을 제안한다. 본 논문에서는 다중문서가 포함하고 있는 문서들 간의 고유구조를 문서요약에 이용하여서 요약의 질을 높일 수 있고, 주제와 문장 간의 유사성과 다양성 고려하여서 쉽게 과잉정보를 제거하여 문장을 요약할 수 있는 장점을 갖는다.

키워드