• Title/Summary/Keyword: 최적의 클러스터 수

Search Result 155, Processing Time 0.038 seconds

A Selection Method of an Optimal Number of Clusters Using a Fuzzy Cluster Validity Measure (퍼지 클러스터 타당성 척도를 이용한 최적 클러스터 수의 선택방법)

  • 이현숙;오경환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1996.10a
    • /
    • pp.133-136
    • /
    • 1996
  • 클러스터의 타당성 정도를 계산하기 위한 측정자로서, 퍼지 분할된 데이터의 서로 다른 클래스 사이의 분리성과 한 클래스안에서의 밀접성의 비율, G를 정의하였다. 본 논문에서는 이렇게 정의된 G로부터, 각 클러스터가 가지는 데이터 수의 차이점을 고려하여 하나의 데이터 집합에 대하여 서로 다른 분할들을 비교할 수 있도록 하기 위하여, IG를 재정의하였다. 기존의 클러스터 타당성 전략은 클러스터 수의 함수로서, 주어진 척도의 값을 계산하여 기록한 후 그 값의 변화가 가장 큰 경우를 최적의 클러스터의 수로서 선택하였다. 이때 그 값의 변화를 고려하기 위한 주관적인 해석이 필요하게 된다. 본 논문에서는 주관적인 해석 없이 IG를 이용하여 최적의 클러스터 수를 결정하기 위한 방법을 제안하고자 한다. 제안된 방법은 널리 알려진 Iris data와 서로 다른 클러스터 인구수를 가지는 가상의 데이터 집합에 적용하여 그 타당성을 보인다.

  • PDF

Fast Search Algorithm for Determining the Optimal Number of Clusters using Cluster Validity Index (클러스터 타당성 평가기준을 이용한 최적의 클러스터 수 결정을 위한 고속 탐색 알고리즘)

  • Lee, Sang-Wook
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.9
    • /
    • pp.80-89
    • /
    • 2009
  • A fast and efficient search algorithm to determine an optimal number of clusters in clustering algorithms is presented. The method is based on cluster validity index which is a measure for clustering optimality. As the clustering procedure progresses and reaches an optimal cluster configuration, the cluster validity index is expected to be minimized or maximized. In this Paper, a fast non-exhaustive search method for finding the optimal number of clusters is designed and shown to work well in clustering. The proposed algorithm is implemented with the k-mean++ algorithm as underlying clustering techniques using CB and PBM as a cluster validity index. Experimental results show that the proposed method provides the computation time efficiency without loss of accuracy on several artificial and real-life data sets.

A Convex Cluster Merging Algorithm using Support Vector Machines (Support Vector Machines를 이용한 Convex 클러스터 결합 알고리즘)

  • 최병인;이정훈
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.267-270
    • /
    • 2002
  • 본 논문에서는 Support Vector Machines (SVM) 을 이용하여, 빠르고 정확한 두 convex한 클러스터 간의 거리 측정 방법을 제시한다 제시된 방법에서는, SVM에 의해서 생성되는 최적 다차원 평면이 두 클러스터간의 최소 거리를 계산하는데 사용된다. 또한, 본 논문에서는 이러한 두 클러스터 간의 최적의 거리를 사용하여, Fuzzy Convex Clustering (FCC) 방법 (1) 에 의해서 생성되는 Convex 클러스터들을 묶어주는 효과적인 클러스터 결합 알고리즘을 제시하였다. 그러므로, 데이터의 부적절한 표현을 유발하지 않고도 클러스터들의 개수를 좀 더 줄일 수 있었다. 제시한 방법의 타당성을 위하여 여러 실험 결과를 제시하였다

An efficient heuristics for determining the optimal number of cluster using clustering balance (클러스터링 균형을 사용하여 최적의 클러스터 개수를 결정하기 위한 효율적인 휴리스틱)

  • Lee, Sangwook
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2009.05a
    • /
    • pp.792-796
    • /
    • 2009
  • Determining the optimal number of cluster is an important issue in research area of data clustering. It is choosing the cluster validity method and finding the cluster number where it optimizes the cluster validity. In this paper, an efficient heuristic for determining optimal number of cluster using clustering balance is proposed. The experimental results using k-means at artificial and real-life data set show that proposed algorithm is excellent in aspect of time efficiency.

  • PDF

Study on Reinforcement Leaning based Resource Allocation of Cluster-edge Environments (강화학습 기반 클러스티-엣지 자원 할당 연구)

  • Youn, Joosang
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.317-318
    • /
    • 2022
  • 본 논문에서는 클러스터 기반 엣지 모델에서 자원을 효율적으로 사용할 수 있는 지능형 엣지 자원 할당 정책 모델을 제안한다. 최근 쿠버네틱스 기반 클러스터 엣지 시스템 개발 연구 다양한 방향에서 진행 중이다. 따라서, 본 논문에서는 클러스터-엣지 모델 구조를 소개하고 이 모델에서 컴퓨팅 자원을 가진 워커에 컴퓨팅 오프로딩 서비스를 효율적으로 사용할 수 있는 최적의 지능형 클러스터-엣지 컴퓨팅 자원 정책을 생성하는 구조 및 알고리즘을 제안한다.

  • PDF

Bayesian Validation Method based on Fuzzy c-Means Algorithm for Analysis of Optimal Gene Clustering (최적의 유전자 클러스터 분석을 위한 퍼지 c-Means 알고리즘 기반의 베이지안 검증 방법)

  • 유시호;원홍희;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.736-738
    • /
    • 2003
  • 수천 개의 유전자 발현 정보를 가지고 있는 DNA 마이크로어레이 기술의 발달로 대량의 생물정보를 빠른 시간 내에 분석하는 것이 가능하게 되었다. 유전자를 분석하는 방법 중 하나인 클러스터링 방법은 비슷한 기능을 가진 유전자들을 집단화시켜서 집단내의 유전자들의 기능을 밝히거나, 미지의 유전자를 분석하는데 이용되고 있다. 본 논문에서는 유전자 데이터를 분석하기 위한 퍼지 클러스터링 방법과 이를 효과적으로 검증할 수 있는 베이지안 검증 방법을 제안한다. 퍼지 c-means 알고리즘을 사용하여 클러스터를 생성하고, 클러스터 결과를 기존의 퍼지 클러스터 검증 방법들과 본 논문에서 제안하는 베이지안 검증 방법을 사용하여 비교 평가한다. 베이지안 검증 방법은 각 유전자의 클러스터 멤버쉽을 확률로 이용하여 각 클러스터에 속할 확률을 계산하고, 이 값을 가장 크게 해주는 클러스터 집단을 선택한다. 이 방법은 기존의 퍼지 클러스터 검증 방법들과는 달리 클러스터 수에 무관한 평가가 가능한 장점을 가지고 있다. Serum과 Yeast 데이터에 대한 실험 결과, 베이지안 검증 방법의 유용성을 확인할 수 있었다.

  • PDF

The database construction of a classification system using an optimal cluster analysis model (최적 클러스터 분석 모델을 이용한 분류시스템의 데이터베이스 구축)

  • 이현숙
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.23 no.4
    • /
    • pp.1045-1050
    • /
    • 1998
  • Classification techniques are often an importand component of intelligent systems and are use for both deta preprocessing and decision making. In the design of a classification system, the labled samples must be given to provide a priori information for the classification. Moreover, the number of classes to be categorized must be known a priori information, called OFCAM. In OFCAM, an unsupervised by OFCAM, the database of a classification system, called PCSDB, is constructed. Then, PCSDB can be effectively used in the decision process of the system.

  • PDF

Energy-Efficient Optimal Clustering Size for Wireless Sensor Networks (무선 센서 네트워크에서 에너지 효율적인 최적 클러스터 크기)

  • 박병창;이성렬;송유경;김종권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.16-18
    • /
    • 2004
  • 무선 센서 네트워크는 센서들을 무선으로 연결하여 데이터 교환을 통해 다양한 환경에서 정보를 수집할 수 있도록 하는 유용한 도구이다. 센서노드 간의 통신은 센서노드의 제한된 에너지를 효율적으로 이용하도록 만들어져야만 한다. 클러스터링에 기반한 계층적 라우팅 기법은 클러스터 내의 노드들은 클러스터헤드와만 통신을 하게하고 클러스터헤드가 한꺼번에 싱크에게 통합된 정보를 보내게 하여 에너지를 절약하는 기법이다. 본 연구에서는 이러한 클러스터링 기반의 라우팅에서 에너지 효율을 높이기 위해 싱크와 클러스터헤드 사이의 거리에 따른 최적 클러스터 크기를 계산하고, 원형의 전체 토폴로지에서 계산된 값과 일치됨을 확인해 보았다.

  • PDF

Enhanced Weighted Factoring Algorithm For Load-Sharing In Heterogeneous Clustering Systems (이기종 클러스터 환경에서 부하공유를 위한 Enhanced Weighted Factoring 알고리즘)

  • 최인복;이재동
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.355-357
    • /
    • 2002
  • 최근 인터넷이 발달하면서 인터넷 상의 다양한 컴퓨터들을 연결함으로써 이기종 클러스터 환경 구축이 용이해졌다. 이러한 이기종 클러스터 환경에서 알고리즘의 이식성을 높이기 위해서는 네트워크의 특성 및 노드의 이질성에 따른 부하 불균형에 효과적으로 적응할 수 있어야 한다 본 논문에서는 이기종 클러스터 환경에서 Message Passing 방식을 이용한 고성능 클러스터 컴퓨팅 작업 시 최적의 효율을 얻을 수 있는 Enhanced-WF 알고리즘을 제시한다 Enhanced-WF 알고리즘은 부하공유를 위하여 Weighted Factoring 알고리즘을 기반으로 적응할당정책을 적용하는 동시에 네트워크 통신시간과 계산시간을 겹치게 한다. Enhanced-WF 알고리즘의 성능을 측정하기 위해 이기종 PC클러스터 환경에서 PVM을 이용한 행렬곱셈 프로그램을 이용하였다. 그 결과, Enhanced-WF 알고리즘이 이기종 클러스터 환경에서 Send, GSS, Weighted Factoring 알고리즘과 같은 기존의 부하공유 알고리즘보다 효과적임을 보였다.

  • PDF

Optimal number of spares for highly available(n,k) cluster systems based on waiting time performance (대기시간에 근거한 고가용도(n,k) 클러스터 시스템의 최적 여분 서버 수)

  • 박기진;김성수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.541-543
    • /
    • 2001
  • 일정 수준의 시스템 성능을 제공하기 위해 다수의 서버를 클러스터로 연결하여 동시에 가동할 경우, 서버의 가동 대수가 증가함으로 인해 발생하는 가용도 저하 문제를 해결해야 하며, 이를 위해서는 시스템의 성능 변화를 반영할 수 있는 가용 성능에 대한 명확한 정의가 요구된다. 본 논문에서는 비용 효율적인 결함허용을 위해 n 대의 주서버가 k 대의 여분서버로 구성된 클러스터 시스템에서 대기시간을 일정 수준이하로 만족시키는 새로운 가용도 척도에 근거한 최적 여분 서버 수를 계산하였다.