Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)
- 2003.10a
- /
- Pages.493-495
- /
- 2003
- /
- 1598-5164(pISSN)
Measuring Improvement of Sentence-Redundancy in Multi-Document Summarization
다중 문서요약에서 문장의 중복도 측정방법 개선
Abstract
다중문서요약에서는 단일문서요약과 달리 문장간의 중복도를 측정하는 방법이 요구된다. 기존에는 중복된 단어의 빈도수를 이용하거나, 구문트리 구조를 이용한 방법이 있으나, 중복도를 측정하는데 도움이 되지 못하는 단어와, 구문분석기 성능에 따라서 중복도 측정에 오류를 발생시킨다. 본 논문은 주절 종속절의 구분, 문장성분, 주절 용언의 의미를 이용하는 문장간 중복도 측정방법을 제안한다. 위의 방법으로 구현된 시스템은 기존의 중복된 단어 빈도수 방식에 비해 정확율에서 56%의 성능 향상이 있었다.
Keywords