• 제목/요약/키워드: initial cluster center

검색결과 40건 처리시간 0.022초

개선된 밀도 기반의 퍼지 C-Means 알고리즘을 이용한 클러스터 합병 (Cluster Merging Using Enhanced Density based Fuzzy C-Means Clustering Algorithm)

  • 한진우;전성해;오경환
    • 한국지능시스템학회논문지
    • /
    • 제14권5호
    • /
    • pp.517-524
    • /
    • 2004
  • 1960년대 퍼지 이론이 소개된 이후 데이터 마이닝을 포함한 기계 학습 분야의 군집화 작업에서 퍼지 이론이 폭넓게 사용되었다. 퍼지 C-평균 알고리즘은 가장 많이 사용되는 퍼지 군집화 알고리즘이다. 이 알고리즘은 하나의 데이터 개체가 서로 다른 소속 정도를 가지고 각 군집에 할당될 수 있도록 한다. 퍼지 C-평균 알고리즘도 K-평균 알고리즘과 같은 일반적인 군집화 알고리즘과 마찬가지로 초기 군집수와 군집 중심의 위치에 의해 최종 군집 결과의 성능 차이가 나타난다. 군집화를 위한 이러한 초기 설정은 주관적이며 이 때문에 적절치 못한 결과를 얻게 될 수도 있다. 본 논문에서는 이 문제를 해결할 수 있는 방법으로 주어진 학습 데이터의 속성을 기반으로 한 초기 군집수와 군집 중심을 결정하는 개선된 밀도 기반의 퍼지 C-평균 알고리즘을 제안하였다. 제안 방법은 격자를 사용하여 초기 군집 중심의 위치와 군집수를 결정하였다. 기존에 많이 이용되었던 객관적인 기계 학습 데이터를 이용하여 제안 알고리즘의 성능비교를 수행하였다.

유전 알고리즘을 이용한 FCM 알고리즘의 초기 군집 중심 선택 (A initial cluster center selection in FCM algorithm using the Genetic Algorithms)

  • 오종상;정순원;박귀태
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1996년도 추계학술대회 학술발표 논문집
    • /
    • pp.290-293
    • /
    • 1996
  • This paper proposes a scheme of initial cluster center selection in FCM algorithm using the genetic algorithms. The FCM algorithm often fails in the search for global optimum because it is local search techniques that search for the optimum by using hill-climbing procedures. To solve this problem, we search for a hypersphere encircling each clusters whose parameters are estimated by the genetic algorithms. Then instead of a randomized initialization for fuzzy partition matrix in FCM algorithm, we initialize each cluster center by the center of a searched hypersphere. Our experimental results show that the proposed initializing scheme has higher probabilities of finding the global or near global optimal solutions than the traditional FCM algorithm.

  • PDF

슈퍼픽셀과 FCM을 이용한 클러스터 초기값 설정 및 칼라영상분할 (A Setting of Initial Cluster Centers and Color Image Segmentation Using Superpixels and Fuzzy C-means(FCM) Algorithm)

  • 이정환
    • 한국멀티미디어학회논문지
    • /
    • 제15권6호
    • /
    • pp.761-769
    • /
    • 2012
  • 본 논문에서는 슈퍼픽셀과 FCM을 이용한 클러스터 초기값 설정방법과 이를 사용한 칼라영상분할을 연구한다. 클러스터링을 이용한 대표적인 칼라영상분할 방법으로 Fuzzy C-menas (FCM) 알고리즘을 많이 사용한다. FCM은 하나의 데이터가 각 클러스터에 서로 다른 소속도를 갖도록 한다. 그러나 FCM은 초기값 설정에 따라 국부적인 수렴문제가 발생한다. 따라서 초기값 설정문제는 매우 중요한데 본 연구에서는 슈퍼픽셀을 이용하여 클러스터의 초기값을 구하는 방법을 제안한다. 슈퍼픽셀은 원 영상에서 특성이 비슷한 화소들의 묶음으로 표현되는데 먼저 원 영상으로부터 슈퍼픽셀을 구하고 이를 $La^*b^*$ 칼라특징공간에 투영하여 클러스터 초기값을 구한다. 제안방법에서 슈퍼픽셀의 수는 원영상의 화소 수보다 일반적으로 매우 적어서 클러스터 초기값 설정을 위한 고속처리가 가능하다. 제안된 알고리즘의 성능평가를 위해 다양한 칼라영상을 사용하여 컴퓨터 모의실험을 수행하였으며 실험결과 제안방법이 기존방법에 비해 영상분할 성능이 우수함을 알 수 있었다.

계층적 클러스터링을 이용한 장면 전환점 검출 (Shot-change Detection using Hierarchical Clustering)

  • 김종성;홍승범;백중환
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1507-1510
    • /
    • 2003
  • We propose UPGMA(Unweighted Pair Group Method using Average distance) as hierarchical clustering to detect abrupt shot changes using multiple features such as pixel-by-pixel difference, global and local histogram difference. Conventional $\kappa$-means algorithm which is a method of the partitional clustering, has to select an efficient initial cluster center adaptively UPGMA that we propose, does not need initial cluster center because of agglomerative algorithm that it starts from each sample for clusters. And UPGMA results in stable performance. Experiment results show that the proposed algorithm works not only well but also stably.

  • PDF

Pixel Intensity Histogram Method for Unresolved Stars: Case of the Arches Cluster

  • Shin, Jihye;Kim, Sungsoo S.
    • 천문학회보
    • /
    • 제39권1호
    • /
    • pp.58.2-58.2
    • /
    • 2014
  • The Arches cluster is a young (2-4 Myr), compact (~1 pc), and massive (${\sim}2{\times}10^4M_{\odot}$) star cluster located ~30 pc away from the Galactic center (GC) in projection. Being exposed to the extreme environment of the GC such as elevated temperature and turbulent velocities in the molecular clouds, strong magnetic fields, and larger tidal forces, the Arches cluster is an excellent target for understanding the effects of star-forming environment on the initial mass function (IMF) of the star cluster. However, resolving stars fainter than ~1 $M_{\odot}$ in the Arches cluster partially will have to wait until an extremely large telescope with adaptive optics in the infrared is available. Here we devise a new method to estimate the shape of the low-end mass function where the individual stars are not resolved, and apply it to the Arches cluster. This method involves histograms of pixel intensities in the observed images. We find that the initial mass function of the Arches cluster should not be too different from that for the Galactic disk such as the Kroupa IMF.

  • PDF

Improved dynamical modeling of the Arches cluster

  • Lee, Joowon;Kim, Sungsoo S.;Shin, Jihye
    • 천문학회보
    • /
    • 제39권2호
    • /
    • pp.76.2-76.2
    • /
    • 2014
  • The Arches cluster is one of the compact, young, massive star clusters near the center of our galaxy. Since it is located only ~30 pc away in projection from the galactic center (GC), the cluster is an excellent target for studying the effects of star forming environment on, for example, the initial mass function under the extreme condition of GC. To estimate the initial condition of the Arches cluster, we compare our calculation results from the anisotropic Fokker-Planck method with the most recent observational data sets for the surface density and velocity dispersion profiles and the present-day mass function.

  • PDF

군집의 효율향상을 위한 휴리스틱 알고리즘 (Heuristic algorithm to raise efficiency in clustering)

  • 이석환;박승헌
    • 대한안전경영과학회지
    • /
    • 제11권3호
    • /
    • pp.157-166
    • /
    • 2009
  • In this study, we developed a heuristic algorithm to get better efficiency of clustering than conventional algorithms. Conventional clustering algorithm had lower efficiency of clustering as there were no solid method for selecting initial center of cluster and as they had difficulty in search solution for clustering. EMC(Expanded Moving Center) heuristic algorithm was suggested to clear the problem of low efficiency in clustering. We developed algorithm to select initial center of cluster and search solution systematically in clustering. Experiments of clustering are performed to evaluate performance of EMC heuristic algorithm. Squared-error of EMC heuristic algorithm showed better performance for real case study and improved greatly with increase of cluster number than the other ones.

클러스터 중심 왜곡 저감을 위한 클러스터링 기법 (Clustering Method for Reduction of Cluster Center Distortion)

  • 정혜천;서석태;이인근;권순학
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.354-359
    • /
    • 2008
  • 클러스터링은 주어진 임의의 데이터 중에서 유사한 성질을 지닌 데이터를 복수개의 그룹으로 조직화하는 기법이다. 이를 위해 K-Means, Fuzzy C-Means(FCM), Mountain Method(MM) 등과 같은 많은 기법들이 제안되었고 또한 널리 사용되어지고 있다. 그러나 이러한 기법들은 초기값에 따라 클러스터링 결과가 크게 달라지는 단점이 있다. 특히 가장 널리 사용되는 FCM 기법은 잡음 데이터에 취약하며, 주어진 입력 데이터의 클러스터 내부분산을 최소화 하는 방법을 사용하기 때문에 클러스터링 중심의 왜곡 현상이 발생한다. 본 논문에서는 데이터 가중치에 근거한 비례적 근접데이터 병합을 통하여 클러스터 중심 왜곡을 저감하며 초기값에 영향을 받지 않는 클러스터링 기법을 제안한다. 그리고 FCM으로 얻어진 클러스터 중심과 제안기법을 적용하여 얻어진 클러스터 중심에 대한 비교 검토를 통하여 제안기법의 효용성을 확인한다.

A Hill-Sliding Strategy for Initialization of Gaussian Clusters in the Multidimensional Space

  • Park, J.Kyoungyoon;Chen, Yung-H.;Simons, Daryl-B.;Miller, Lee-D.
    • 대한원격탐사학회지
    • /
    • 제1권1호
    • /
    • pp.5-27
    • /
    • 1985
  • A hill-sliding technique was devised to extract Gaussian clusters from the multivariate probability density estimates of sample data for the first step of iterative unsupervised classification. The underlying assumption in this approach was that each cluster possessed a unimodal normal distribution. The key idea was that a clustering function proposed could distinguish elements of a cluster under formation from the rest in the feature space. Initial clusters were extracted one by one according to the hill-sliding tactics. A dimensionless cluster compactness parameter was proposed as a universal measure of cluster goodness and used satisfactorily in test runs with Landsat multispectral scanner (MSS) data. The normalized divergence, defined by the cluster divergence divided by the entropy of the entire sample data, was utilized as a general separability measure between clusters. An overall clustering objective function was set forth in terms of cluster covariance matrices, from which the cluster compactness measure could be deduced. Minimal improvement of initial data partitioning was evaluated by this objective function in eliminating scattered sparse data points. The hill-sliding clustering technique developed herein has the potential applicability to decomposition of any multivariate mixture distribution into a number of unimodal distributions when an appropriate diatribution function to the data set is employed.

GEMINI NEAR-IR PHOTOMETRY OF THE ARCHES CLUSTER NEAR THE GALACTIC CENTER

  • YANG YUJIN;PARK HONG SOO;LEE MYUNG GYOON;LEE SANG-GAK
    • 천문학회지
    • /
    • 제35권3호
    • /
    • pp.131-141
    • /
    • 2002
  • We present Near-IR photometry of the Arches cluster, a young and massive stellar cluster near the Galactic center. We have analyzed the high resolution (FWHM $\~$ 0.2") Hand K' band images in the Galactic Center Demonstration Science Data Set, which were obtained with the Gemini/Hokupa's adaptive optics (AO) system. We present the color-magnitude diagram, the luminosity function and the initial mass function (IMF) of the stars in the Arches cluster in comparison with the HST/NICMOS data. The IMF slope for the range of 1.0 < log (M/M$\bigodot$) < 2.1 is estimated to be ${\Gamma} = -0.79 {\pm} 0.16$, in good agreements with the earlier result based on the HST/NICMOS data [Figer et al. 1999, ApJ, 525, 750]. These results strengthen the evidence that the IMF of the bright. stars close to the Galactic center is much flatter than that for the solar neighborhood. This is also consistent with a recent finding that the IMFs of the bright stars in young clusters in M33 get flatter as the galactocentric distance decreases [Lee et al. 2001, astro-ph 0109258]. It is found that the power of the Gemini/ AO system is comparable, with some limits, to that of the HST/NICMOS.