Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2014.10a
- /
- Pages.175-178
- /
- 2014
- /
- 2005-3053(pISSN)
Search Resulted News Summarization using Word Discriminability
단어 분별도에 기반한 뉴스 검색 문서 요약
- Lee, Sang-Keon (Dept. of Software Engineering, Kumoh National Institute of Technology) ;
- Lee, Hye-Min (Dept. of Software Engineering, Kumoh National Institute of Technology) ;
- Kim, Gi-Ryeong (Dept. of Software Engineering, Kumoh National Institute of Technology) ;
- Seo, Duc-Ho (Dept. of Software Engineering, Kumoh National Institute of Technology) ;
- Lee, Hyun Ah (Dept. of Software Engineering, Kumoh National Institute of Technology)
- 이상건 (금오공과대학교 컴퓨터소프트웨어공학과) ;
- 이혜민 (금오공과대학교 컴퓨터소프트웨어공학과) ;
- 김기령 (금오공과대학교 컴퓨터소프트웨어공학과) ;
- 서덕호 (금오공과대학교 컴퓨터소프트웨어공학과) ;
- 이현아 (금오공과대학교 컴퓨터소프트웨어공학과)
- Published : 2014.10.07
Abstract
다양한 언론사로부터 기사를 제공받아 서비스하는 인터넷 포털의 뉴스에서는 수많은 중복 기사가 실시간으로 등록된다. 이로 인하여 인터넷 포털에서 관심 있는 주제의 기사를 검색하여 찾아보려는 경우 검색키워드를 포함한 기사의 수가 지나치게 많아 원하는 정보를 적절하게 얻기 어렵다. 본 논문에서는 이러한 문제점을 해결하기 위해서 검색 기사 중 유사한 문서를 군집화하고 군집에 대한 다중문서요약을 사용자에게 제시하여 검색된 기사를 효율적으로 활용할 수 있는 방법을 제시한다. 다중문서 요약에서는 뉴스 기사에 적합한 단어 가중치인 분별도(discriminability)를 제안하여 사용하여 군집화된 기사로부터 유사 문장을 군집한다. 시스템에서는 군집된 기사의 대표 문장 군집에서 대표 문장, 즉 키워드에 대한 주제별 기사의 요약문을 결과로 제시하여, 효율적인 뉴스 검색을 지원한다.