다중문서 요약에서 적응 기법을 이용한 문장 추출

Sentence Extraction Using Adapting Method in Multi-Document Summarization

  • 임정민 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과 첨단기술연구센터) ;
  • 강인수 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과 첨단기술연구센터) ;
  • 배재학 (울산대학교 컴퓨터정보통신공학부) ;
  • 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과 첨단기술연구센터)
  • Lim, Jung-Min (Dept. of Computer Science and Engineering, Division of Electrical and Computer Engineering Pohang University of Science and Technology and Advanced Information Technology Research(AITrc)) ;
  • Kang, In-Su (Dept. of Computer Science and Engineering, Division of Electrical and Computer Engineering Pohang University of Science and Technology and Advanced Information Technology Research(AITrc)) ;
  • Bae, Jae-Hak J. (School of Computer Engineering and Information Technology, University of Ulsan) ;
  • Lee, Jong-Hyeok (Dept. of Computer Science and Engineering, Division of Electrical and Computer Engineering Pohang University of Science and Technology and Advanced Information Technology Research(AITrc))
  • 발행 : 2004.10.08

초록

기존의 다중 문서요약은 전체 대상문서에 대해서 한번에 요약문을 생산하지만, 본 논문은 요약 대상문서 집합에서 핵심내용을 갖는 문서를 기본 문서로 선택, 임시 요약문장을 추출하고 대상문서 집합에서 순차적으로 문서를 입력받아 중요문장을 추출, 이전에 구축된 요약문장과 현재 추출된 문장을 비교하면서 요약에 필요한 문장을 선택하는 적응 기법을 제안한다. 제안한 방법으로 구현한 시스템은 NTCIR TSC 3에서 사용된 29개의 다중 문서집합을 통해서 성능을 평가하였다. 적응 기법 시스템은 TSC3의 baseline시스템인 Lead 방법보다는 높은 성능을 나타냈지만, TSC 3에 참가한 시스템들과의 비교에서는 월등한 성능 우위를 나타내지 못했다.

키워드