• 제목/요약/키워드: Fuzzy c-means clustering method

검색결과 180건 처리시간 0.026초

클러스터 중심 왜곡 저감을 위한 클러스터링 기법 (Clustering Method for Reduction of Cluster Center Distortion)

  • 정혜천;서석태;이인근;권순학
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.354-359
    • /
    • 2008
  • 클러스터링은 주어진 임의의 데이터 중에서 유사한 성질을 지닌 데이터를 복수개의 그룹으로 조직화하는 기법이다. 이를 위해 K-Means, Fuzzy C-Means(FCM), Mountain Method(MM) 등과 같은 많은 기법들이 제안되었고 또한 널리 사용되어지고 있다. 그러나 이러한 기법들은 초기값에 따라 클러스터링 결과가 크게 달라지는 단점이 있다. 특히 가장 널리 사용되는 FCM 기법은 잡음 데이터에 취약하며, 주어진 입력 데이터의 클러스터 내부분산을 최소화 하는 방법을 사용하기 때문에 클러스터링 중심의 왜곡 현상이 발생한다. 본 논문에서는 데이터 가중치에 근거한 비례적 근접데이터 병합을 통하여 클러스터 중심 왜곡을 저감하며 초기값에 영향을 받지 않는 클러스터링 기법을 제안한다. 그리고 FCM으로 얻어진 클러스터 중심과 제안기법을 적용하여 얻어진 클러스터 중심에 대한 비교 검토를 통하여 제안기법의 효용성을 확인한다.

커널 밀도 추정을 이용한 Fuzzy C-Means의 초기화 (Initialization of Fuzzy C-Means Using Kernel Density Estimation)

  • 허경용;김광백
    • 한국정보통신학회논문지
    • /
    • 제15권8호
    • /
    • pp.1659-1664
    • /
    • 2011
  • Fuzzy C-Means (FCM)는 군집화를 위해 널리 사용되는 알고리듬 중 하나로 다양한 응용 분야에서 성공적으로 사용되어 왔다. 하지만 FCM은 여러 가지 단점을 가지고 있으며 초기 원형 설정이 그 중 하나이다. FCM은 국부 최적해에 수렴하므로 초기 원형 설정에 따라 군집화의 결과가 달라진다. 따라서 초기 원형의 설정은 군집화 결과 향상을 위해 중요하다. 이 논문에서는 이러한 FCM의 초기 원형 설정 문제를 해결하는 방안으로 커널 밀도 추정을 활용하는 방법을 제안한다. 커널 밀도 추정은 비모수적 분포들에도 사용할 수 있어 국부적인 데이터 밀도 추정에 유용하다. 제안한 방법에서는 커널 밀도 추정을 수행한 후 밀도가 높은 지역에 클러스터의 초기 원형을 설정하고 원형이 설정된 영역의 밀도를 감소시키는 과정을 반복함으로써 효율적으로 초기 원형을 선택할 수 있다. 제안된 방법이 일반적으로 사용되는 무작위 초기화 방법에 비해 효율적이라는 사실은 실험 결과를 통해 확인할 수 있다.

개선된 FCM 클러스터링 영상 분할 (Improved FCM Clustering Image Segmentation)

  • 이광규
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.127-131
    • /
    • 2020
  • 클러스터링을 이용한 대표적인 영상 분할 방법으로 Fuzzy C-Means(FCM) 알고리즘을 많이 사용하는데, FCM은 영상의 공간을 픽셀 값이 비슷한 클러스터 영역으로 분할하므로 분할 시간이 많이 소요된다. 특히 웹이 보편화된 현재 사용자들의 다양한 패턴을 분석하기 위한 처리 속도 문제는 더욱 중요하다. 이러한 속도 문제를 해결하기 위해 본 논문에서는 Otsu의 영상 히스토그램의 임계값과 FCM으로 영상을 분할하는 개선된 FCM(Improved FCM : IFCM) 알고리즘을 제안한다. 제안방법은 Otsu의 클래스 간의 분산을 최대화 시키는 임계값을 결정하여 FCM에 적용하고 영상을 분할하였다. IFCM은 기존의 FCM에 비해 영상 분할 시간을 단축시켜 성능이 향상되었음을 실험을 통해 보인다.

GA 기반 TSK 퍼지 분류기의 설계와 응용 (A Design of GA-based TSK Fuzzy Classifier and Its Application)

  • 곽근창;김승석;유정웅;김승석
    • 한국지능시스템학회논문지
    • /
    • 제11권8호
    • /
    • pp.754-759
    • /
    • 2001
  • 본 논문은 주성분분석기법, 퍼지 클러스터링, ANFIS(Adaptive Neuro-Fuzzy Inference System)와 하이브리드 GA(Hybrid Genetic Algorithm)를 이용하여 GA 기반 TSK(Takagi-Sugeno-Kang) 퍼지 분류기를 제안한다. 먼저 구조동정은 주성분분석기법을 이용하여 데이터 성분간의 상관관계가 제거하도록 입력데이터를 변환하고, FCM(Fuzzy c-means) 클러스터링과 ANFIS의 융합을 통해 초기 TSK 퍼지 분류기를 구축한다. 구축된 초기 분류기의 파라미터를 초기집단으로 발생시켜 AGA(Adaptive GA)와 RLSE(Recursive Least Square Estimate)에 의해 파라미터 동정을 수행한다. 이렇게 함으로서 퍼지 클러스터링의 효율적인 입력공간분할로 ANFIS의 문제점을 해결할 수 있고, AGA에 의해 집단의 다양성 유지와 전역적인 최적해의 수렴을 가속화할 수 있다. 마지막으로, 제안된 방법은 Iris 데이터 분류문제에 적용하여 이전의 다른 논문에 비해 좋은 성능을 보임을 알 수 있었다.

  • PDF

유전자 알고리즘과 하중값을 이용한 퍼지 시스템의 최적화 (Optimization of Fuzzy Systems by Means of GA and Weighting Factor)

  • 박병준;오성권;안태천;김현기
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제48권6호
    • /
    • pp.789-799
    • /
    • 1999
  • In this paper, the optimization of fuzzy inference systems is proposed for fuzzy model of nonlinear systems. A fuzzy model needs to be identified and optimized by means of the definite and systematic methods, because a fuzzy model is primarily acquired by expert's experience. The proposed rule-based fuzzy model implements system structure and parameter identification using the HCM(Hard C-mean) clustering method, genetic algorithms and fuzzy inference method. Two types of inference methods of a fuzzy model are the simplified inference and linear inference. in this paper, nonlinear systems are expressed using the identification of structure such as input variables and the division of fuzzy input subspaces, and the identification of parameters of a fuzzy model. To identify premise parameters of fuzzy model, the genetic algorithms is used and the standard least square method with the gaussian elimination method is utilized for the identification of optimum consequence parameters of fuzzy model. Also, the performance index with weighting factor is proposed to achieve a balance between the performance results of fuzzy model produced for the training and testing data set, and it leads to enhance approximation and predictive performance of fuzzy system. Time series data for gas furnace and sewage treatment process are used to evaluate the performance of the proposed model.

  • PDF

밀도에 무관한 클러스터링 기법의 개선 (Improvement on Density-Independent Clustering Method)

  • 김성훈;허경용
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.967-973
    • /
    • 2017
  • 클러스터링은 균일한 특성을 가지는 데이터를 클러스터로 묶기 위해 사용되는 비교사 학습 방법 중 하나로 다양한 응용에 사용되고 있으며 FCM(Fuzzy C-Means)이 대표적인 방법 중 하나이다. 하지만 FCM에서 주로 사용되는 유클리드 거리 척도는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미쳐 밀도가 높은 쪽으로 클러스터의 중심을 위치시키는 문제가 있으며, 이를 해결하기 위한 방법 중 하나가 클러스터 중심 사이의 거리가 가능한 멀어지도록 하는 밀도 무관 클러스터링이다. 하지만 밀도 무관 클러스터링 역시 클러스터 중심 사이의 거리를 정확히 제어하기가 어렵다. 이 논문에서는 클러스터 중심 사이의 거리가 멀어지도록 할뿐만이 아니라 클러스터 중심이 밀도가 높은 곳에 위치하도록 하는 항을 추가한 개선된 밀도 무관 클러스터링 방법을 제안한다. 제안하는 방법은 FCM이나 밀도 무관 클러스터링에 비해 실제 클러스터 중심으로 수렴하는 경우가 더 많다는 것을 실험 결과를 통해 확인할 수 있다.

Possibilistic C-mean 클러스터링과 영역 확장을 이용한 칼라 영상 분할 (Color image segmentation using the possibilistic C-mean clustering and region growing)

  • 엄경배;이준환
    • 전자공학회논문지S
    • /
    • 제34S권3호
    • /
    • pp.97-107
    • /
    • 1997
  • Image segmentation is teh important step in image infromation extraction for computer vison sytems. Fuzzy clustering methods have been used extensively in color image segmentation. Most analytic fuzzy clustering approaches are derived from the fuzzy c-means (FCM) algorithm. The FCM algorithm uses th eprobabilistic constraint that the memberships of a data point across classes sum to 1. However, the memberships resulting from the FCM do not always correspond to the intuitive concept of degree of belongingor compatibility. moreover, the FCM algorithm has considerable trouble above under noisy environments in the feature space. Recently, the possibilistic C-mean (PCM) for solving growing for color image segmentation. In the PCM, the membersip values may be interpreted as degrees of possibility of the data points belonging to the classes. So, the problems in the FCM can be solved by the PCM. The clustering results by just PCM are not smoothly bounded, and they often have holes. So, the region growing was used as a postprocessing. In our experiments, we illustrated that the proposed method is reasonable than the FCM in noisy enviironments.

  • PDF

퍼지 클러스터링과 스트링 매칭을 통합한 형상 인식법 (Pattern Recognition Method Using Fuzzy Clustering and String Matching)

  • 남원우;이상조
    • 대한기계학회논문집
    • /
    • 제17권11호
    • /
    • pp.2711-2722
    • /
    • 1993
  • Most of the current 2-D object recognition systems are model-based. In such systems, the representation of each of a known set of objects are precompiled and stored in a database of models. Later, they are used to recognize the image of an object in each instance. In this thesis, the approach method for the 2-D object recognition is treating an object boundary as a string of structral units and utilizing string matching to analyze the scenes. To reduce string matching time, models are rebuilt by means of fuzzy c-means clustering algorithm. In this experiments, the image of objects were taken at initial position of a robot from the CCD camera, and the models are consturcted by the proposed algorithm. After that the image of an unknown object is taken by the camera at a random position, and then the unknown object is identified by a comparison between the unknown object and models. Finally, the amount of translation and rotation of object from the initial position is computed.

정보 입자화를 통한 방사형 기저 함수 기반 다항식 신경 회로망의 진화론적 설계 (Evolutionary Design of Radial Basis Function-based Polynomial Neural Network with the aid of Information Granulation)

  • 박호성;진용하;오성권
    • 전기학회논문지
    • /
    • 제60권4호
    • /
    • pp.862-870
    • /
    • 2011
  • In this paper, we introduce a new topology of Radial Basis Function-based Polynomial Neural Networks (RPNN) that is based on a genetically optimized multi-layer perceptron with Radial Polynomial Neurons (RPNs). This study offers a comprehensive design methodology involving mechanisms of optimization algorithms, especially Fuzzy C-Means (FCM) clustering method and Particle Swarm Optimization (PSO) algorithms. In contrast to the typical architectures encountered in Polynomial Neural Networks (PNNs), our main objective is to develop a design strategy of RPNNs as follows : (a) The architecture of the proposed network consists of Radial Polynomial Neurons (RPNs). In here, the RPN is fully reflective of the structure encountered in numeric data which are granulated with the aid of Fuzzy C-Means (FCM) clustering method. The RPN dwells on the concepts of a collection of radial basis function and the function-based nonlinear (polynomial) processing. (b) The PSO-based design procedure being applied at each layer of RPNN leads to the selection of preferred nodes of the network (RPNs) whose local characteristics (such as the number of input variables, a collection of the specific subset of input variables, the order of the polynomial, and the number of clusters as well as a fuzzification coefficient in the FCM clustering) can be easily adjusted. The performance of the RPNN is quantified through the experimentation where we use a number of modeling benchmarks - NOx emission process data of gas turbine power plant and learning machine data(Automobile Miles Per Gallon Data) already experimented with in fuzzy or neurofuzzy modeling. A comparative analysis reveals that the proposed RPNN exhibits higher accuracy and superb predictive capability in comparison to some previous models available in the literature.

A Simple Tandem Method for Clustering of Multimodal Dataset

  • Cho C.;Lee J.W.;Lee J.W.
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2003년도 춘계공동학술대회
    • /
    • pp.729-733
    • /
    • 2003
  • The presence of local features within clusters incurred by multi-modal nature of data prohibits many conventional clustering techniques from working properly. Especially, the clustering of datasets with non-Gaussian distributions within a cluster can be problematic when the technique with implicit assumption of Gaussian distribution is used. Current study proposes a simple tandem clustering method composed of k-means type algorithm and hierarchical method to solve such problems. The multi-modal dataset is first divided into many small pre-clusters by k-means or fuzzy k-means algorithm. The pre-clusters found from the first step are to be clustered again using agglomerative hierarchical clustering method with Kullback- Leibler divergence as the measure of dissimilarity. This method is not only effective at extracting the multi-modal clusters but also fast and easy in terms of computation complexity and relatively robust at the presence of outliers. The performance of the proposed method was evaluated on three generated datasets and six sets of publicly known real world data.

  • PDF