• 제목/요약/키워드: 최적의 클러스터 수

검색결과 155건 처리시간 0.029초

퍼지 클러스터 타당성 척도를 이용한 최적 클러스터 수의 선택방법 (A Selection Method of an Optimal Number of Clusters Using a Fuzzy Cluster Validity Measure)

  • 이현숙;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1996년도 추계학술대회 학술발표 논문집
    • /
    • pp.133-136
    • /
    • 1996
  • 클러스터의 타당성 정도를 계산하기 위한 측정자로서, 퍼지 분할된 데이터의 서로 다른 클래스 사이의 분리성과 한 클래스안에서의 밀접성의 비율, G를 정의하였다. 본 논문에서는 이렇게 정의된 G로부터, 각 클러스터가 가지는 데이터 수의 차이점을 고려하여 하나의 데이터 집합에 대하여 서로 다른 분할들을 비교할 수 있도록 하기 위하여, IG를 재정의하였다. 기존의 클러스터 타당성 전략은 클러스터 수의 함수로서, 주어진 척도의 값을 계산하여 기록한 후 그 값의 변화가 가장 큰 경우를 최적의 클러스터의 수로서 선택하였다. 이때 그 값의 변화를 고려하기 위한 주관적인 해석이 필요하게 된다. 본 논문에서는 주관적인 해석 없이 IG를 이용하여 최적의 클러스터 수를 결정하기 위한 방법을 제안하고자 한다. 제안된 방법은 널리 알려진 Iris data와 서로 다른 클러스터 인구수를 가지는 가상의 데이터 집합에 적용하여 그 타당성을 보인다.

  • PDF

클러스터 타당성 평가기준을 이용한 최적의 클러스터 수 결정을 위한 고속 탐색 알고리즘 (Fast Search Algorithm for Determining the Optimal Number of Clusters using Cluster Validity Index)

  • 이상욱
    • 한국콘텐츠학회논문지
    • /
    • 제9권9호
    • /
    • pp.80-89
    • /
    • 2009
  • 클러스터링 알고리즘에서 최적의 클러스터 수를 결정하기 위한 효율적인 고속 탐색 알고리즘을 소개한다. 제안하는 방법은 클러스터링 적합도의 척도로 사용되는 클러스터 타당성 평가기준을 토대로 한다. 데이터 집합에 클러스터링 프로세스를 진행하여 최적의 클러스터 형상에 도달하게 되면 클러스터 타당성 평가기준은 최대 혹은 최소값을 가질 것으로 기대한다. 본 논문에서는 최적의 클러스터 개수를 찾기 위한 고속의 비소모적 탐색 방법을 설계하고 실제 클러스터링과 접목한다. 제안하는 알고리즘은 k-means++ 클러스터링 알고리즘에 적용하였고, 클러스터 타당성 평가기준으로써 CB 및 PBM 타당성 평가기준 방법을 사용하였다. 몇몇의 가상 데이터 집합과 실제 데이터 집합에 실험한 결과, 제안하는 방법은 정확도의 손실 없이 계산 효율을 획기적으로 증가시킴을 보여주었다.

Support Vector Machines를 이용한 Convex 클러스터 결합 알고리즘 (A Convex Cluster Merging Algorithm using Support Vector Machines)

  • 최병인;이정훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.267-270
    • /
    • 2002
  • 본 논문에서는 Support Vector Machines (SVM) 을 이용하여, 빠르고 정확한 두 convex한 클러스터 간의 거리 측정 방법을 제시한다 제시된 방법에서는, SVM에 의해서 생성되는 최적 다차원 평면이 두 클러스터간의 최소 거리를 계산하는데 사용된다. 또한, 본 논문에서는 이러한 두 클러스터 간의 최적의 거리를 사용하여, Fuzzy Convex Clustering (FCC) 방법 (1) 에 의해서 생성되는 Convex 클러스터들을 묶어주는 효과적인 클러스터 결합 알고리즘을 제시하였다. 그러므로, 데이터의 부적절한 표현을 유발하지 않고도 클러스터들의 개수를 좀 더 줄일 수 있었다. 제시한 방법의 타당성을 위하여 여러 실험 결과를 제시하였다

클러스터링 균형을 사용하여 최적의 클러스터 개수를 결정하기 위한 효율적인 휴리스틱 (An efficient heuristics for determining the optimal number of cluster using clustering balance)

  • 이상욱
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.792-796
    • /
    • 2009
  • 데이터 클러스터링 분야에서 최적의 클러스터 개수를 추정하는 것은 매우 중요한 일이다. 그것은 클러스터링의 적합성을 판단할 기준을 정하고 그 적합성을 극대화 하는 최적의 클러스터의 개수를 찾는 것이다. 본 논문에서는 클러스터의 적합성을 판단할 기준으로써 클러스터링 균형을 사용하여 최적의 클러스터 개수를 찾기 위한 효율적인 휴리스틱 방법을 제안하였다. k-means 사용하여 가상 및 실제 데이터 셋에 적용한 결과, 제안한 알고리즘이 계산효율 측면에서 우수함을 확인할 수 있었다.

  • PDF

강화학습 기반 클러스티-엣지 자원 할당 연구 (Study on Reinforcement Leaning based Resource Allocation of Cluster-edge Environments)

  • 윤주상
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.317-318
    • /
    • 2022
  • 본 논문에서는 클러스터 기반 엣지 모델에서 자원을 효율적으로 사용할 수 있는 지능형 엣지 자원 할당 정책 모델을 제안한다. 최근 쿠버네틱스 기반 클러스터 엣지 시스템 개발 연구 다양한 방향에서 진행 중이다. 따라서, 본 논문에서는 클러스터-엣지 모델 구조를 소개하고 이 모델에서 컴퓨팅 자원을 가진 워커에 컴퓨팅 오프로딩 서비스를 효율적으로 사용할 수 있는 최적의 지능형 클러스터-엣지 컴퓨팅 자원 정책을 생성하는 구조 및 알고리즘을 제안한다.

  • PDF

최적의 유전자 클러스터 분석을 위한 퍼지 c-Means 알고리즘 기반의 베이지안 검증 방법 (Bayesian Validation Method based on Fuzzy c-Means Algorithm for Analysis of Optimal Gene Clustering)

  • 유시호;원홍희;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.736-738
    • /
    • 2003
  • 수천 개의 유전자 발현 정보를 가지고 있는 DNA 마이크로어레이 기술의 발달로 대량의 생물정보를 빠른 시간 내에 분석하는 것이 가능하게 되었다. 유전자를 분석하는 방법 중 하나인 클러스터링 방법은 비슷한 기능을 가진 유전자들을 집단화시켜서 집단내의 유전자들의 기능을 밝히거나, 미지의 유전자를 분석하는데 이용되고 있다. 본 논문에서는 유전자 데이터를 분석하기 위한 퍼지 클러스터링 방법과 이를 효과적으로 검증할 수 있는 베이지안 검증 방법을 제안한다. 퍼지 c-means 알고리즘을 사용하여 클러스터를 생성하고, 클러스터 결과를 기존의 퍼지 클러스터 검증 방법들과 본 논문에서 제안하는 베이지안 검증 방법을 사용하여 비교 평가한다. 베이지안 검증 방법은 각 유전자의 클러스터 멤버쉽을 확률로 이용하여 각 클러스터에 속할 확률을 계산하고, 이 값을 가장 크게 해주는 클러스터 집단을 선택한다. 이 방법은 기존의 퍼지 클러스터 검증 방법들과는 달리 클러스터 수에 무관한 평가가 가능한 장점을 가지고 있다. Serum과 Yeast 데이터에 대한 실험 결과, 베이지안 검증 방법의 유용성을 확인할 수 있었다.

  • PDF

최적 클러스터 분석 모델을 이용한 분류시스템의 데이터베이스 구축 (The database construction of a classification system using an optimal cluster analysis model)

  • 이현숙
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.1045-1050
    • /
    • 1998
  • 데이타의 분류기법은 공장자동화나 로보틱스 분야에서 사용되는 지능시스템의 중요한 기능이다. 일반적으로 이러한 분류시스템을 설계하고자 할때, 준비된 데이타는 레이블링 되어야 하고, 분류하고자하는 클래스의 수도 설정되어야한다. 본 연구에서는 이러한 사전 정보없이 분류 시스템을 설계하고자 최적 클러스터 분석 모델, OFCAM을 제안한다. 이때 사용되는 최적 클러스터 분석 모델은 데이타의 구조에 대한 사전정보 없이, 주어진 데이타의 최적 클러스터의 수와 클러스터 중심점 및 각 데이타에 대한 소속정보를 구해준다. 이를 위하여 OFCAM에서는 목적합수를 가지는 비교사 학습신경망과 클러스터 타당성 전략을 결합하고 있다. OFCAM의 결과를 바탕으로 분류시스템의 데이터베이스, PCSDB가 구축되며 이는 결정 모듈에서 쉽게 활용될 수 있음을 보인다. 이와같은 방법은 하나의 데이타베이스 안에서 필요한 테이블만을 첨가하므로 독립적으로 여러 응용의 분류문제를 다룰 수 있다.

  • PDF

무선 센서 네트워크에서 에너지 효율적인 최적 클러스터 크기 (Energy-Efficient Optimal Clustering Size for Wireless Sensor Networks)

  • 박병창;이성렬;송유경;김종권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.16-18
    • /
    • 2004
  • 무선 센서 네트워크는 센서들을 무선으로 연결하여 데이터 교환을 통해 다양한 환경에서 정보를 수집할 수 있도록 하는 유용한 도구이다. 센서노드 간의 통신은 센서노드의 제한된 에너지를 효율적으로 이용하도록 만들어져야만 한다. 클러스터링에 기반한 계층적 라우팅 기법은 클러스터 내의 노드들은 클러스터헤드와만 통신을 하게하고 클러스터헤드가 한꺼번에 싱크에게 통합된 정보를 보내게 하여 에너지를 절약하는 기법이다. 본 연구에서는 이러한 클러스터링 기반의 라우팅에서 에너지 효율을 높이기 위해 싱크와 클러스터헤드 사이의 거리에 따른 최적 클러스터 크기를 계산하고, 원형의 전체 토폴로지에서 계산된 값과 일치됨을 확인해 보았다.

  • PDF

이기종 클러스터 환경에서 부하공유를 위한 Enhanced Weighted Factoring 알고리즘 (Enhanced Weighted Factoring Algorithm For Load-Sharing In Heterogeneous Clustering Systems)

  • 최인복;이재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.355-357
    • /
    • 2002
  • 최근 인터넷이 발달하면서 인터넷 상의 다양한 컴퓨터들을 연결함으로써 이기종 클러스터 환경 구축이 용이해졌다. 이러한 이기종 클러스터 환경에서 알고리즘의 이식성을 높이기 위해서는 네트워크의 특성 및 노드의 이질성에 따른 부하 불균형에 효과적으로 적응할 수 있어야 한다 본 논문에서는 이기종 클러스터 환경에서 Message Passing 방식을 이용한 고성능 클러스터 컴퓨팅 작업 시 최적의 효율을 얻을 수 있는 Enhanced-WF 알고리즘을 제시한다 Enhanced-WF 알고리즘은 부하공유를 위하여 Weighted Factoring 알고리즘을 기반으로 적응할당정책을 적용하는 동시에 네트워크 통신시간과 계산시간을 겹치게 한다. Enhanced-WF 알고리즘의 성능을 측정하기 위해 이기종 PC클러스터 환경에서 PVM을 이용한 행렬곱셈 프로그램을 이용하였다. 그 결과, Enhanced-WF 알고리즘이 이기종 클러스터 환경에서 Send, GSS, Weighted Factoring 알고리즘과 같은 기존의 부하공유 알고리즘보다 효과적임을 보였다.

  • PDF

대기시간에 근거한 고가용도(n,k) 클러스터 시스템의 최적 여분 서버 수 (Optimal number of spares for highly available(n,k) cluster systems based on waiting time performance)

  • 박기진;김성수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.541-543
    • /
    • 2001
  • 일정 수준의 시스템 성능을 제공하기 위해 다수의 서버를 클러스터로 연결하여 동시에 가동할 경우, 서버의 가동 대수가 증가함으로 인해 발생하는 가용도 저하 문제를 해결해야 하며, 이를 위해서는 시스템의 성능 변화를 반영할 수 있는 가용 성능에 대한 명확한 정의가 요구된다. 본 논문에서는 비용 효율적인 결함허용을 위해 n 대의 주서버가 k 대의 여분서버로 구성된 클러스터 시스템에서 대기시간을 일정 수준이하로 만족시키는 새로운 가용도 척도에 근거한 최적 여분 서버 수를 계산하였다.