Setences Extraction System using Automatic Division of Paragraph

단락 자동 구분을 통한 중요 문장 추출

  • Kim, Kye-Sung (Dept. of Computer Engineering, Kyungpook Nat'l University) ;
  • Lee, Hyun-Ju (Dept. of Computer Engineering, Kyungpook Nat'l University) ;
  • Jung, Young-Giu (Dept. of Computer Engineering, Kyungpook Nat'l University) ;
  • Seo, Youn-Kyoung (Dept. of Computer Engineering, Kyungpook Nat'l University) ;
  • Son, Ki-Jun (Dept. of Computer Engineering, Kyungpook Nat'l University) ;
  • Lee, Sang-Jo (Dept. of Computer Engineering, Kyungpook Nat'l University)
  • 김계성 (경북대학교 컴퓨터공학과) ;
  • 이현주 (경북대학교 컴퓨터공학과) ;
  • 정영규 (경북대학교 컴퓨터공학과) ;
  • 서연경 (경북대학교 컴퓨터공학과) ;
  • 손기준 (경북대학교 컴퓨터공학과) ;
  • 이상조 (경북대학교 컴퓨터공학과)
  • Published : 2000.10.13

Abstract

본 논문은 단락의 자동 구분을 통한 중요 문장 추출 시스템을 제안한다. 먼저 어휘의 재출현 여부와 어휘의 일치도, 어휘의 역할 변화를 파악하여 재출현 어휘에 대한 양상을 분석하고 이를 통하여 문장 간의 긴밀도를 정량적으로 계산한다. 다음으로 측정된 문장 간 긴밀도룰 이용하여 사용자의 추출 범위에 따라 단락을 구분하고, 각 단락의 대표 문장을 선정하여 최종문을 생성한다. 제안한 방법은 문서 제목, 문장의 위치, 수사 구조 등의 정보를 이용하지 않으며, 단순히 어휘의 출현 빈도만을 이용하던 기존의 통계적인 방법보다 질 높은 요약문을 생성할 수 있다. 또한 제안한 방법론은 본 논문이 대상으로 삼고 있는 신문기사의 영역뿐만 아니라 다른 영역으로의 적용이 가능하다.

Keywords