A Study on Initial Seeds Selection of K-Means for Big Data Clustering

Kim, Yeong-Ju;Heo, Yu-Gyeong;Back, Jong-Sang;Jeong, Hwan-Jong;Lee, Sung-Ro;Jung, Min-A;

doi:10.3745/PKIPS.y2014m11a.750

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

2014.11a
/
Pages.750-752
/
2014
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

A Study on Initial Seeds Selection of K-Means for Big Data Clustering

빅데이터 클러스터링을 위한 K-Means 초기 중심 선정 연구

Kim, Yeong-Ju (Dept of Computer Engineering, Mok-po University) ;
Heo, Yu-Gyeong (Dept of Computer Engineering, Mok-po University) ;
Back, Jong-Sang (Dept of Information & Electronic Engineering, Mok-po University) ;
Jeong, Hwan-Jong (Dept of Information & Electronic Engineering, Mok-po University) ;
Lee, Sung-Ro (Dept of Information & Electronic Engineering, Mok-po University) ;
Jung, Min-A (Dept of Computer Engineering, Mok-po University)

김영주 (목포대학교 컴퓨터공학과) ;
허유경 (목포대학교 컴퓨터공학과) ;
백종상 (목포대학교 정보전자공학과) ;
정환종 (목포대학교 정보전자공학과) ;
이성로 (목포대학교 정보전자공학과) ;
정민아 (목포대학교 컴퓨터공학과)

Published : 2014.11.05

https://doi.org/10.3745/PKIPS.y2014m11a.750 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

K-Means 알고리즘은 구현이 쉽고, 패턴수가 n일 때 시간 복잡도가 O(n)인 장점을 가져 대용량 데이터에서 널리 이용된다. 그러나, K-Means 알고리즘은 초기 클러스터 중심을 어떻게 선정하는가에 따라 할당-재계산 횟수, 클러스터링 결과를 결정짓는다. 본 논문에서는 K-Means 알고리즘에서 클러스터 초기 중심 선정 연구를 살펴보고 계통임의추출법을 적용하여 K-Means 초기 중심 선정 방법을 제안한다. 제안한 방법은 대용량 데이터의 클러스터링 시간을 감소하고 정확도를 향상시킬 수 있다.

Proceedings of the Korea Information Processing Society Conference (한국정보처리학회:학술대회논문집)

A Study on Initial Seeds Selection of K-Means for Big Data Clustering

빅데이터 클러스터링을 위한 K-Means 초기 중심 선정 연구

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)