한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2010년도 추계학술발표대회
- /
- Pages.490-493
- /
- 2010
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
클러스터 측정과 유전자 알고리즘을 이용한 문서 클러스터링
Document Clustering using Generic Algorithm and Cluster Measurement
- Choi, Lim Cheon (Dept of Computer Engineering, Chonbuk National University) ;
- Park, Soon Cheol (Dept of Computer Engineering, Chonbuk National University)
- 발행 : 2010.11.12
초록
본 논문에서는 클러스터 측정(Cluster Measurement)과 유전자 알고리즘을 이용한 문서 클러스링 알고리즘을 제안한다. 유전자 알고리즘의 요소를 클러스터링에 대입하고 클러스터 측정을 적합도 함수에 대입하여 문서 클러스터링을 구현하였다. 성능 평가를 위하여 한국일보-20000/한국일보-40075 문서범주화 실험문서집합의 데이터 셋을 이용하였다. 클러스터링 성능 평가 결과 AS Index가 DB Index, RS Index 보다 좋은 성능을 보여준다. 또한 제안한 알고리즘이 K-means 클러스터링 알고리즘에 비교해 안정적으로 좋은 성능을 보여준다.
키워드