• 제목/요약/키워드: k-means clustering Algorithm

검색결과 547건 처리시간 0.028초

휴리스틱 진화에 기반한 효율적 클러스터링 알고리즘 (An Efficient Clustering Algorithm based on Heuristic Evolution)

  • 류정우;강명구;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.80-90
    • /
    • 2002
  • 클러스터링이란 한 군집에 포함된 데이터들 간의 유사한 성질을 갖도록 데이터들을 묶는 것으로 패턴인식, 영상처리 등의 공학 분야에 널리 적용되고 있을 뿐만 아니라, 최근 많은 관심의 대상이 되고 있는 데이터 마이닝의 주요 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 K-means나 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 개선하였으며, 클러스터링의 특성을 분산도와 분리도로 정의하였다. 분산도는 임의의 클러스터의 중심으로부터 포함된 데이터들이 어느 정도 흩어져 있는지를 나타내는 척도인 반면, 분리도는 임의의 데이터와 모든 클러스터 중심간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터 중심간의 거리를 나타내는 척도이다. 이 두 척도를 이용하여 자동으로 적절한 클러스터 개수를 결정하게 하였다. 또한 진화알고리즘의 문제점인 탐색공간의 확대에 따른 수행시간의 증가는 휴리스틱 연산을 적용함으로써 크게 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 이차원과 다차원 실험데이타를 사용하여 실험한 결과 제안한 알고리즘의 성능이 우수함을 나타내었다.

주성분 분석의 K 평균 알고리즘을 통한 XML 문서 군집화 기법 (XML Document Clustering Technique by K-means algorithm through PCA)

  • 김우생
    • 정보처리학회논문지D
    • /
    • 제18D권5호
    • /
    • pp.339-342
    • /
    • 2011
  • 최근 들어 인터넷에서 많이 사용되는 XML 문서들을 효율적으로 접근, 질의, 저장하는 방법들이 연구된다. 본 논문은 XML 문서들을 효율적으로 군집화 하는 새로운 기법을 제안한다. XML 문서를 대응하는 트리 구조의 원소들의 이름과 레벨로 표현하여 특징 벡터 공간상의 벡터로 나타내고 주성분 분석을 통한 k 평균 알고리즘 기법을 사용하여 군집화를 시도한다. 실험 결과를 통하여 제안하는 기법이 좋은 결과를 얻을 수 있음을 보였다.

무선 센서 네트워크에서의 머신러닝을 활용한 에너지 효율적인 클러스터 라우팅 방안 연구 (Energy Efficient Cluster Routing Method Using Machine Learning in WSN)

  • 강미영
    • 한국정보통신학회논문지
    • /
    • 제27권1호
    • /
    • pp.124-130
    • /
    • 2023
  • 본 논문에서는 K-평균 군집화 알고리즘을 사용하는 머신러닝을 활용하여 무선 센서 네트워크에서 센서 노드의 에너지 효율성을 향상시켜 네트워크의 수명을 향상시키고자 한다. 무선 센서 네트워크는 물리적인 센서로 배터리를 포함한 물리적 장치를 무선 네트워크로 구성한 것으로 센서 노드의 특성 상 에너지 소비를 최소화하여 네트워크 수 명을 최대화하기 위해 모든 자원을 효율적으로 사용해야 한다. 클러스터기반 접근 방식은 상대적으로 많은 수의 노 들로 구성된 그룹을 관리하는데 사용된다. 제안된 프로토콜에서는 기존의 LEACH 알고리즘을 개선하여 클러스터 기반 접근방식과 위치기반 접근 방식을 사용하여 클러스터 헤드를 선정하는 클러스터링 알고리즘을 제안한다. 개선 하고자 했던 성능 결과를 Matlab 시뮬레이션을 이용하여 측정하였다. 실험 결과를 통해 에너지 효율성 부분에 대해 K-means 클러스터링을 적용함으로써 에너지 효율이 개선되어 젠체 네트워크의 수명이 연장됨을 확인한다.

A Fuzzy Clustering Method based on Genetic Algorithm

  • Jo, Jung-Bok;Do, Kyeong-Hoon;Linhu Zhao;Mitsuo Gen
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.1025-1028
    • /
    • 2000
  • In this paper, we apply to a genetic algorithm for fuzzy clustering. We propose initialization procedure and genetic operators such as selection, crossover and mutation, which are suitable for solving the problems. To illustrate the effectiveness of the proposed algorithm, we solve the manufacturing cell formation problem and present computational comparisons to generalized Fuzzy c-Means algorithm.

  • PDF

비지도 학습 기법을 사용한 RF 위협의 분포 분석 (Analysis on the Distribution of RF Threats Using Unsupervised Learning Techniques)

  • 김철표;노상욱;박소령
    • 한국군사과학기술학회지
    • /
    • 제19권3호
    • /
    • pp.346-355
    • /
    • 2016
  • In this paper, we propose a method to analyze the clusters of RF threats emitting electrical signals based on collected signal variables in integrated electronic warfare environments. We first analyze the signal variables collected by an electronic warfare receiver, and construct a model based on variables showing the properties of threats. To visualize the distribution of RF threats and reversely identify them, we use k-means clustering algorithm and self-organizing map (SOM) algorithm, which are belonging to unsupervised learning techniques. Through the resulting model compiled by k-means clustering and SOM algorithms, the RF threats can be classified into one of the distribution of RF threats. In an experiment, we measure the accuracy of classification results using the algorithms, and verify the resulting model that could be used to visually recognize the distribution of RF threats.

Differential Evolution with Multi-strategies based Soft Island Model

  • Tan, Xujie;Shin, Seong-Yoon
    • Journal of information and communication convergence engineering
    • /
    • 제17권4호
    • /
    • pp.261-266
    • /
    • 2019
  • Differential evolution (DE) is an uncomplicated and serviceable developmental algorithm. Nevertheless, its execution depends on strategies and regulating structures. The combination of several strategies between subpopulations helps to stabilize the probing on DE. In this paper, we propose a unique k-mean soft island model DE(KSDE) algorithm which maintains population diversity through soft island model (SIM). A combination of various approaches, called KSDE, intended for migrating the subpopulation information through SIM is developed in this study. First, the population is divided into k subpopulations using the k-means clustering algorithm. Second, the mutation pattern is singled randomly from a strategy pool. Third, the subpopulation information is migrated using SIM. The performance of KSDE was analyzed using 13 benchmark indices and compared with those of high-technology DE variants. The results demonstrate the efficiency and suitability of the KSDE system, and confirm that KSDE is a cost-effective algorithm compared with four other DE algorithms.

차분 진화 알고리즘을 이용한 Fuzzy Prototype Classifier 최적화 (The Optimization of Fuzzy Prototype Classifier by using Differential Evolutionary Algorithm)

  • 안태천;노석범;김용수
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.161-165
    • /
    • 2014
  • 본 논문에서는 입력 공간의 부분 영역의 특성을 기술하기 위하여 각 부분 영역을 대표하는 prototype을 정의하고 정의된 Prototype 에 가중치를 적용하여 각 부분 영역이 각 클래스의 경계면에 미치는 영향을 차등화 하는 Fuzzy Prototype 분류기를 제안 한다. 제안된 패턴 분류기의 Prototype은 퍼지 클러스터링 알고리즘인 Fuzzy C-Means Clustering 알고리즘을 사용하여 결정한다. 또한, 각 부분 영역의 가중치를 결정하기 위하여 유전자 알고리즘에서 파생된 차분 진화 알고리즘을 적용하여 각각의 퍼지 규칙의 가중치를 최적화 한다. 또한 퍼지 규칙 기반 시스템 기반 패턴 분류기의 경우 각각의 퍼지 규칙의 후반부 구조인 다항식의 계수를 추정하기 위하여 Linear Discriminant Analysis를 사용한다. 마지막으로, 본 논문에서 제안한 패턴 분류기의 패턴 분류 특성 및 성능을 평가하기위하여 기계 학습 데이터를 사용한다.

악 조건 환경에서의 강건한 차선 인식 방법 (Robust Lane Detection Method Under Severe Environment)

  • 임동혁;;조상복
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.224-230
    • /
    • 2013
  • 운전자 보조 시스템에서 차선 경계 검출은 매우 중요하다. 본 연구는 악조건인 환경에서 차선 경계를 검출하기 위한 강건한 방법을 제안한다. 첫 번째로 원래의 image에서 iVMD(improve Vertical Mean Distribution) Method를 이용하여 수평선을 검출하고, 수평선 하위영역 image를 결정하며, 두 번째로 Canny edge detector를 사용하여 하위 영역에서 차선 표시를 추출한다. 마지막으로, RANSAC algorithm을 이용하여 각각에 맞는 line model을 적용하기 전에, k-means clustering algorithm을 이용하여 오른쪽 왼쪽 차선을 분류 한다. 제안된 알고리즘은 변종조명, 갈라진 도로, 복잡한 차선 표시, 교통신호에 관하여 상당히 정확한 차선 검출 기능을 나타낸다. 실험결과는 제안된 방법이 악조건인 환경하에서 실시간으로 효율적인 요구 사항을 충족함을 보여준다.

Clustering Algorithm for Time Series with Similar Shapes

  • Ahn, Jungyu;Lee, Ju-Hong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권7호
    • /
    • pp.3112-3127
    • /
    • 2018
  • Since time series clustering is performed without prior information, it is used for exploratory data analysis. In particular, clusters of time series with similar shapes can be used in various fields, such as business, medicine, finance, and communications. However, existing time series clustering algorithms have a problem in that time series with different shapes are included in the clusters. The reason for such a problem is that the existing algorithms do not consider the limitations on the size of the generated clusters, and use a dimension reduction method in which the information loss is large. In this paper, we propose a method to alleviate the disadvantages of existing methods and to find a better quality of cluster containing similarly shaped time series. In the data preprocessing step, we normalize the time series using z-transformation. Then, we use piecewise aggregate approximation (PAA) to reduce the dimension of the time series. In the clustering step, we use density-based spatial clustering of applications with noise (DBSCAN) to create a precluster. We then use a modified K-means algorithm to refine the preclusters containing differently shaped time series into subclusters containing only similarly shaped time series. In our experiments, our method showed better results than the existing method.

Assessment of Premature Ventricular Contraction Arrhythmia by K-means Clustering Algorithm

  • Kim, Kyeong-Seop
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권5호
    • /
    • pp.65-72
    • /
    • 2017
  • Premature Ventricular Contraction(PVC) arrhythmia is most common abnormal-heart rhythm that may increase mortal risk of a cardiac patient. Thus, it is very important issue to identify the specular portraits of PVC pattern especially from the patient. In this paper, we propose a new method to extract the characteristics of PVC pattern by applying K-means machine learning algorithm on Heart Rate Variability depicted in Poinecare plot. For the quantitative analysis to distinguish the trend of cluster patterns between normal sinus rhythm and PVC beat, the Euclidean distance measure was sought between the clusters. Experimental simulations on MIT-BIH arrhythmia database draw the fact that the distance measure on the cluster is valid for differentiating the pattern-traits of PVC beats. Therefore, we proposed a method that can offer the simple remedy to identify the attributes of PVC beats in terms of K-means clusters especially in the long-period Electrocardiogram(ECG).