한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2009년도 추계학술발표대회
- /
- Pages.715-716
- /
- 2009
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
문서의 의미특징을 이용한 주제 기반의 다중문서 요약
Topic-Based Multi-Document Summarization using Semantic Features of Documents
- Park, Sun (Division of Electronic & Information Engineering, Chonbuk National University) ;
- An, Dong Un (Division of Electronic & Information Engineering, Chonbuk National University) ;
- Kim, Chul-Won (Dept of Computer Engineering, Honam University)
- 발행 : 2009.11.13
초록
인터넷의 발전은 대량의 정보를 양산하였고, 이러한 대량의 정보 집합 내에서는 비슷한 정보가 재활용 되거나 반복되는 정보중복문제를 가지고 있다. 중복되는 정보들로부터 사용자에게 원하는 정보를 신속히 검색할 수 있도록 하는 정보 요약에 대한 필요성은 점차 증가하고 있다. 본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)에 의한 문서의 의미특징을 이용하여 주제기반의 다중문서를 요약하는 새로운 방법을 제안한다. 본 논문에서는 다중문서가 포함하고 있는 문서들 간의 고유구조를 문서요약에 이용하여서 요약의 질을 높일 수 있고, 주제와 문장 간의 유사성과 다양성 고려하여서 쉽게 과잉정보를 제거하여 문장을 요약할 수 있는 장점을 갖는다.
키워드