DOI QR코드

DOI QR Code

유전자 알고리즘을 이용한 문서 클러스터링 연구

A Study on Clustering using Genetic Algorithm

  • 쏭웨이 (전북대학교 전자정보 공학과) ;
  • 최임천 (전북대학교 전자정보 공학과) ;
  • 박순철 (전북대학교 전자정보 공학과)
  • Song, Wei (Dept of Computer Engineering, Chonbuk National University) ;
  • Choi, Lim Cheon (Dept of Computer Engineering, Chonbuk National University) ;
  • Park, Soon Cheol (Dept of Computer Engineering, Chonbuk National University)
  • 발행 : 2009.11.13

초록

본 논문에서는 효율적인 인공지능 알고리즘인 유전자 알고리즘(GA)을 이용한 문서 클러스터링 시스템을 제안한다. 일반적으로 클러스터링 알고리즘에 가장 많이 사용되는 K-Means는 임의로 결정되는 초기 센트로이드 벡터에 따라 그 성능이 많이 달라지는 것을 볼 수 있다. 이에 본 논문에서는 유전자 알고리즘을 이용하여 안정적이면서도 높은 성능을 보여주는 클러스터링 알고리즘을 개발하였다. 제안한 클러스터링 알고리즘의 성능 평가를 위하여 HANTEC 2.0과 문서 범주화 집단 데이터 셋을 사용하였다. 제안된 방법은 효율적이고 빠른 K-Means를 이용한 클러스터링 알고리즘에 비하여 훨씬 뛰어난 성능을 보였다.

키워드