• 제목/요약/키워드: Means

검색결과 31,854건 처리시간 0.051초

영상분할을 위한 밀도추정 바탕의 Fuzzy C-means 알고리즘 (A Density Estimation based Fuzzy C-means Algorithm for Image Segmentation)

  • 고정원;최병인;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.196-201
    • /
    • 2007
  • Fuzzy C-Means (FCM) 알고리즘은 probabilitic 멤버쉽을 사용하는 클러스터링 방법으로서 널리 쓰이고 있다. 하지만 이 방법은 노이즈에 대하여 민감한 성질을 가진다는 단점이 있다. 따라서 본 논문에서는 이러한 노이즈에 민감한 성질을 보완하기 위해서 데이터의 밀도추정을 이용하여 새로운 FCM 알고리즘을 제안한다. 본 논문에서 제안된 알고리즘은 FCM과 비슷한 성능의 클러스터링 수행이 가능하며, 노이즈가 포함된 데이터에서는 FCM보다 더 나은 성능을 보여준다.

퍼지 C-Means 클러스터링을 이용한 요부 초음파 영상의 양자화 (The Quantization of Lumbar Ultrasonographic Images using Fuzzy C-Means Clustering)

  • 홍동진;김광백
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.301-302
    • /
    • 2013
  • 본 논문에서는 초음파 영상에서 퍼지 C-Means 클러스터링을 이용한 양자화 기법을 제안한다. 제안된 방법은 초음파 영상에서 나타난 명암도를 이용하여 n개의 그룹으로 클러스터링한다. 그리고 각 클러스터의 중심 값을 기준으로 정렬한 뒤, 각 그룹에 지정된 색상을 요부 초음파 영상에서 나타낸다. 본 논문에서 제안하는 기법을 적용한 요부 초음파 영상과 일반적으로 자주 이용되는 히스토그램 기반 양자화 기법을 적용한 요부 초음파 영상을 비교하였을 때, 본 논문에서 제안하는 퍼지 C-Means 클러스터링을 이용한 양자화를 적용한 영상이 근육 내의 지방을 분석하는데 효과적인 것을 확인할 수 있었다.

  • PDF

K-means Clustering for Environmental Indicator Survey Data

  • Park, Hee-Chang;Cho, Kwang-Hyun
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2005년도 춘계학술대회
    • /
    • pp.185-192
    • /
    • 2005
  • There are many data mining techniques such as association rule, decision tree, neural network analysis, clustering, genetic algorithm, bayesian network, memory-based reasoning, etc. We analyze 2003 Gyeongnam social indicator survey data using k-means clustering technique for environmental information. Clustering is the process of grouping the data into clusters so that objects within a cluster have high similarity in comparison to one another. In this paper, we used k-means clustering of several clustering techniques. The k-means clustering is classified as a partitional clustering method. We can apply k-means clustering outputs to environmental preservation and environmental improvement.

  • PDF

Variable Selection and Outlier Detection for Automated K-means Clustering

  • Kim, Sung-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제22권1호
    • /
    • pp.55-67
    • /
    • 2015
  • An important problem in cluster analysis is the selection of variables that define cluster structure that also eliminate noisy variables that mask cluster structure; in addition, outlier detection is a fundamental task for cluster analysis. Here we provide an automated K-means clustering process combined with variable selection and outlier identification. The Automated K-means clustering procedure consists of three processes: (i) automatically calculating the cluster number and initial cluster center whenever a new variable is added, (ii) identifying outliers for each cluster depending on used variables, (iii) selecting variables defining cluster structure in a forward manner. To select variables, we applied VS-KM (variable-selection heuristic for K-means clustering) procedure (Brusco and Cradit, 2001). To identify outliers, we used a hybrid approach combining a clustering based approach and distance based approach. Simulation results indicate that the proposed automated K-means clustering procedure is effective to select variables and identify outliers. The implemented R program can be obtained at http://www.knou.ac.kr/~sskim/SVOKmeans.r.

모의실험 분석중 구간평균기법의 개선을 위한 연구 (A Study on the Improvement of the Batch-means Method in Simulation Analysis)

  • 천영수
    • 한국시뮬레이션학회논문지
    • /
    • 제5권2호
    • /
    • pp.59-72
    • /
    • 1996
  • The purpose of this study is to make an improvement to the batch-means method, which is a procedure to construct a confidence interval(c.i.) for the steady-state process mean of a stationary simulation output process. In the batch-means method, the data in the output process are grouped into batches. The sequence of means of the data included in individual batches is called a batch-menas process and can be treated as an independently and identically distributed set of variables if each batch includes sufficiently large number of observations. The traditional batch-means method, therefore, uses a batch size as large as possible in order to. destroy the autocovariance remaining in the batch-means process. The c.i. prodedure developed and empirically tested in this study uses a small batch size which can be well fitted by a simple ARMA model, and then utilizes the dependence structure in the fitted model to correct for bias in the variance estimator of the sample mean.

  • PDF

K-means Clustering using a Center Of Gravity for grid-based sample

  • 박희창;이선명
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2004년도 춘계학술대회
    • /
    • pp.51-60
    • /
    • 2004
  • K-means clustering is an iterative algorithm in which items are moved among sets of clusters until the desired set is reached. K-means clustering has been widely used in many applications, such as market research, pattern analysis or recognition, image processing, etc. It can identify dense and sparse regions among data attributes or object attributes. But k-means algorithm requires many hours to get k clusters that we want, because it is more primitive, explorative. In this paper we propose a new method of k-means clustering using a center of gravity for grid-based sample. It is more fast than any traditional clustering method and maintains its accuracy.

  • PDF

K-Means 클러스터링 성능 향상을 위한 최대평균거리 기반 초기값 설정 (Refining Initial Seeds using Max Average Distance for K-Means Clustering)

  • 이신원;이원휘
    • 인터넷정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.103-111
    • /
    • 2011
  • 대규모 데이터에 대한 특성에 따라 몇 개의 클러스터로 군집화하는 클러스터링 기법은 계층적 클러스터링이나 분할 클러스터링 등 다양한 기법이 있는데 그 중에서 K-Means 알고리즘은 구현이 쉬우나 할당-재계산에 소요되는 시간이 증가하게 된다. 본 논문에서는 초기 클러스터 중심들 간의 거리가 최대가 되도록 하여 초기 클러스터 중심들이 고르게 분포되도록 함으로써 할당-재계산 횟수를 줄이고 전체 클러스터링 시간을 감소시키고자 한다.

Pattern Analysis and Performance Comparison of Lottery Winning Numbers

  • Jung, Yong Gyu;Han, Soo Ji;kim, Jae Hee
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제6권1호
    • /
    • pp.16-22
    • /
    • 2014
  • Clustering methods such as k-means and EM are the group of classification and pattern recognition, which are used in management science and literature search widely. In this paper, k-means and EM algorithm are compared the performance using by Weka. The winning Lottery numbers of 567 cases are experimented for our study and presentation. Processing speed of the k-means algorithm is superior to the EM algorithm, which is about 0.08 seconds faster than the other. As the result it is summerized that EM algorithm is better than K-means algorithm with comparison of accuracy, precision and recall. While K-means is known to be sensitive to the distribution of data, EM algorithm is probability sensitive for clustering.

DNA칩 데이터 분석을 위한 유전자발연 통합분석 프로그램의 개발 (Program Development of Integrated Expression Profile Analysis System for DNA Chip Data Analysis)

  • 양영렬;허철구
    • KSBB Journal
    • /
    • 제16권4호
    • /
    • pp.381-388
    • /
    • 2001
  • DNA칩의 유전자 발현 데이터의 통합적 분석을 위하여 매트랩을 기반으로 한 통합분석 프로그램을 구축하였다. 이 프로그램은 유전자 발현 분석을 위해 일반적으로 많이 쓰는 방법인 Hierarchical clustering(HC), K-means, Self-organizing map(SOM), Principal component analysis(PCA)를 지원하며, 이외에 Fuzzy c-means방법과 최근에 발표된 Singular value decomposition(SVD) 분석 방법도 지원하고 있다. 통합분석프로그램의 성능을 알아보기 위하여 효모의 포자형성(sporulation)과 정의 유전자발현 데이터를 사용하였으며, 각 분석 방법에 따른 분석 결과를 제시하였으며, 이 프로그램이 유전자 발현데이타의 통합적인 분석을 위해 효과적으로 사용될 수 있음을 제시하였다.

  • PDF

고객가치 극대화를 위한 전자상거래 구매의사결정 요인에 관한 연구 (Constructing the Purchasing Decision-making Factors to Maximize Customer Value on the Electronic Commerce)

  • 이현규;박영식
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제15권1호
    • /
    • pp.121-144
    • /
    • 2006
  • For constructing the purchasing decision-making model to maximize customer value on the electronic commerce, Means-Ends Network model was used for identifying means and fundamental objectives and their relationships were analyzed by the structural equation. A questionnaire survey of 481 customers in their internet shopping experiences was conducted to extract valid means and fundamental objectives' factors. As a result, 6 means objectives shopping travel, shipping errors, vendor trust, online payment, product choice, and recommender systems and 3 fundamental objectives-shopping convenience, internet ecology, and customer support were founded. Using these 9 factors, structural equation was analyzed 4 times to ensure statistical validities and to establish new interrelationships among them. The results showed that fundamental objectives are affected by the strong relationships within means objectives. This interrelationship with mens and fundamental objectives is interpreted as the purchasing decision-making model to maximize customer value on the electronic commerce in this paper.

  • PDF