한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2009년도 추계학술발표대회
- /
- Pages.325-326
- /
- 2009
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
유전자 알고리즘을 이용한 문서 클러스터링 연구
A Study on Clustering using Genetic Algorithm
- Song, Wei (Dept of Computer Engineering, Chonbuk National University) ;
- Choi, Lim Cheon (Dept of Computer Engineering, Chonbuk National University) ;
- Park, Soon Cheol (Dept of Computer Engineering, Chonbuk National University)
- 발행 : 2009.11.13
초록
본 논문에서는 효율적인 인공지능 알고리즘인 유전자 알고리즘(GA)을 이용한 문서 클러스터링 시스템을 제안한다. 일반적으로 클러스터링 알고리즘에 가장 많이 사용되는 K-Means는 임의로 결정되는 초기 센트로이드 벡터에 따라 그 성능이 많이 달라지는 것을 볼 수 있다. 이에 본 논문에서는 유전자 알고리즘을 이용하여 안정적이면서도 높은 성능을 보여주는 클러스터링 알고리즘을 개발하였다. 제안한 클러스터링 알고리즘의 성능 평가를 위하여 HANTEC 2.0과 문서 범주화 집단 데이터 셋을 사용하였다. 제안된 방법은 효율적이고 빠른 K-Means를 이용한 클러스터링 알고리즘에 비하여 훨씬 뛰어난 성능을 보였다.
키워드