Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2007.10a
- /
- Pages.165-168
- /
- 2007
- /
- 2005-3053(pISSN)
Unsupervised News Article Summarization Using VNA Sets
VNA 집합을 이용한 뉴스기사의 중요문장 추출
- Na, Jong-Yeol (Division of Computer Science, Semantic Web Research Center, KAIST) ;
- Sin, Ji-Ae (Division of Computer Science, Semantic Web Research Center, KAIST) ;
- Choe, Gi-Seon (Division of Computer Science, Semantic Web Research Center, KAIST)
- 나종열 (한국과학기술원 전자전산학과 전산학전공 시맨틱웹첨단연구센터) ;
- 신지애 (한국과학기술원 전자전산학과 전산학전공 시맨틱웹첨단연구센터) ;
- 최기선 (한국과학기술원 전자전산학과 전산학전공 시맨틱웹첨단연구센터)
- Published : 2007.10.12
Abstract
본 연구에서는 문서의 문장들을 순위화하여 추출하는 일반적인 문서 요약 방법론을 소개한다. 첫 번째 단계는 주제와 관련되는 동사, 명사, 형용사(VNA) 단어들의 집합을 구하여 각 문장의 주제 관련성 정도를 결정하며, 두 번째 단계는 단어들의 의존관계를 통해 각 문장의 정보 함유량을 판단한다. 두 개의 방법은 모두 주제와 관련된 정보를 많이 내포하는 문장에 중요도를 부여하고 있다. 이러한 방법은 주제와 연관성이 높고 정보전달성이 높은 문서요약을 만들기 위함이다. 생성된 문서요약본의 성능평가는 문서요약의 결과로 추출된 문장들과 설문에 의해 추출된 문장들의 일치율에 의해 시행되었으며 68%의 일치율을 보였다.
Keywords