Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)
- 2014.11a
- /
- Pages.750-752
- /
- 2014
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
A Study on Initial Seeds Selection of K-Means for Big Data Clustering
빅데이터 클러스터링을 위한 K-Means 초기 중심 선정 연구
- Kim, Yeong-Ju (Dept of Computer Engineering, Mok-po University) ;
- Heo, Yu-Gyeong (Dept of Computer Engineering, Mok-po University) ;
-
Back, Jong-Sang
(Dept of Information & Electronic Engineering, Mok-po University) ;
-
Jeong, Hwan-Jong
(Dept of Information & Electronic Engineering, Mok-po University) ;
-
Lee, Sung-Ro
(Dept of Information & Electronic Engineering, Mok-po University) ;
-
Jung, Min-A
(Dept of Computer Engineering, Mok-po University)
- 김영주 (목포대학교 컴퓨터공학과) ;
- 허유경 (목포대학교 컴퓨터공학과) ;
-
백종상
(목포대학교 정보전자공학과) ;
-
정환종
(목포대학교 정보전자공학과) ;
-
이성로
(목포대학교 정보전자공학과) ;
-
정민아
(목포대학교 컴퓨터공학과)
- Published : 2014.11.05
Abstract
K-Means 알고리즘은 구현이 쉽고, 패턴수가 n일 때 시간 복잡도가 O(n)인 장점을 가져 대용량 데이터에서 널리 이용된다. 그러나, K-Means 알고리즘은 초기 클러스터 중심을 어떻게 선정하는가에 따라 할당-재계산 횟수, 클러스터링 결과를 결정짓는다. 본 논문에서는 K-Means 알고리즘에서 클러스터 초기 중심 선정 연구를 살펴보고 계통임의추출법을 적용하여 K-Means 초기 중심 선정 방법을 제안한다. 제안한 방법은 대용량 데이터의 클러스터링 시간을 감소하고 정확도를 향상시킬 수 있다.
Keywords