Document clustering based on summarized document using K-means algorithm

요약 문서 기반 문서 클러스터링

  • Oh, Hyung-Jin (Dept. of Computer, Engineering, Chonbuk National University) ;
  • Ko, Ji-Hyun (Dept. of Information-Communication, Chonbuk National University) ;
  • An, Dong-Un (Dept. of Computer, Engineering, Chonbuk National University) ;
  • Chung, Sung-Jong (Dept. of Computer, Engineering, Chonbuk National University)
  • 오형진 (전북대학교 컴퓨터공학과) ;
  • 고지현 (전북대학교 정보통신공학과) ;
  • 안동언 (전북대학교 컴퓨터공학과) ;
  • 정성종 (전북대학교 컴퓨터공학과)
  • Published : 2002.04.12

Abstract

정보검색 시스템에서 문서 클러스터링 기법은 사용자 질의에 대하여 검색된 문서를 문서간의 관련도에 따라 클러스터로 구성하고 사용자에게 검색 결과로 보여주는 것이다. 본 논문에서는 사용자의 질의에 대하여 검색된 문서를 자동 문서 요약기를 통해 얻은 요약 문서와 문서 전문을 문서들간의 유사도를 기반으로 동적으로 클러스터링 한다. 구현한 시스템의 클러스터링 효과를 검증한 결과 검색된 문서 전문을 클러스터링 한 방식에 비해 요약 문서를 클러스터링 한 방식이 정확률 측면에서 더 나은 성능을 보였다.

Keywords