• 제목/요약/키워드: Fuzzy C-Means 클러스터링

Search Result 152, Processing Time 0.028 seconds

유전자 발현 데이터를 이용한 암의 클래스 예측을 위한 퍼지 클러스터링 알고리즘 (Fuzzy Clustering Algorithm to Predict Cancer Class Using Gene Expression Data)

  • 원홍희;유시호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.757-759
    • /
    • 2003
  • 암의 치료법은 같은 종류의 암이라 해도 그 하부 클래스에 따라 매우 다르기 때문에 암의 클래스를 예측하는 것은 그 정확한 치료를 위하여 매우 중요하다. 유전자 발현 데이터를 이용한 암의 분류에 있어 기존의 연구들은 각 데이터를 하나의 클러스터에 소속시키는 하드 분할(hard partition)에 의한 분할 방식을 사용하는 하드 클러스터링을 사용하였다. 하지만 일반적으로 유전자 발현 암 데이터와 같은 실세계의 데이터는 쉽게 나뉘어지기 힘들거나 클러스터 간의 경계가 분명하지 않기 때문에 하드 클러스터링 기법은 주어진 데이터의 성질을 손실시킬 수 있는데 반해, 퍼지 클러스터링 기법은 각 데이터가 소속 정도에 따라 여러 개의 클러스터에 속할 수 있도록 분할하기 때문에 이러한 손실을 최소화할 수 있다. 따라서 본 논문에서는 퍼지 클러스터링의 대표적인 방법인 fuzzy c-means 클러스터링을 적용하여 암의 클래스를 예측하고, 다양한 하드 클러스터링 방법과 비교함으로써 퍼지 클러스터링의 성능을 검증하였다.

  • PDF

Subtractive Clustering 알고리즘을 이용한 퍼지 RBF 뉴럴네트워크의 동정 (Genetically Optimization of Fuzzy C-Means Clustering based Fuzzy Neural Networks)

  • 최정내;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.239-240
    • /
    • 2008
  • 본 논문에서는 Subtractive clustering 알고리즘을 이용한 Fuzzy Radial Basis Function Neural Network (FRBFNN)의 규칙 수를 자동적으로 생성하는 방법을 제시한다. FRBFNN은 멤버쉽 함수로써 기존 RBFNN에서 가우시안이나 타원형 형태의 특정 RBF를 사용하는 구조와 달리 Fuzzy C-Means clustering 알고리즘에서 사용하는 거리에 기한 멤버쉽 함수를 사용하여 전반부의 공간 분할 및 활성화 레벨을 결정하는 구조이다. 본 논문에서는 데이터의 밀집도에 기반을 두어 클러스터링을 하는 Subtractive clustering 알고리즘을 사용하여 퍼지 규칙의 수와 같은 의미를 갖는 분할할 입력공간의 수와 분할된 입력공간의 중심값을 동정하며, Least Square Estimator (LSE) 알고리즘을 사용하여 후반부 다항식의 계수를 추정 한다.

  • PDF

ISODATA와 퍼지 C-Means를 이용한 감독 분류의 성능 향상에 관한 연구 (A Study on Improving Performance of Supervised Classifier using ISODATA and Fuzzy C-Means Clustering Method)

  • 전영준;김진일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.79-81
    • /
    • 2003
  • 본 논문에서는 위성영상의 강독 분류에 대한 성능 개선을 위하여 ISODATA와 퍼지 C-Means 클러스터링 기법을 이용한 베이시안 최대우도 분류방법을 제안하였다. 본 연구에서는 ISODATA 클러스터링 기법을 이용하여 각각의 분류항목별로 분광특징에 따라 분석가가 선정한 훈련 데이터를 분할하여 새로운 훈련 데이터를 선정함으로써 분류항목별 훈련데이터의 분광적인 특징에 관계없이 분류를 수행할 수 있도록 하였다. 그리고 새롭게 선정된 훈련 데이터를 이용하여 퍼지 C-Means 클러스터링을 수행하고 그 결과를 베이시안 최대우도 분류기법의 사전확률로 이용함으로써 위성영상의 감독 분류에 대한 성능을 개선할 수 있는 방법을 제안한다. 제안된 기법은 Landset TM 위성영상을 이용하여 그 적용성을 시험하였다.

  • PDF

DNA chip 통합분석 프로그램을 이용한 효모의 세포주기 유전자 발현 통합 데이터의 분석 (Analysis of Combined Yeast Cell Cycle Data by Using the Integrated Analysis Program for DNA chip)

  • 양영렬;허철구
    • KSBB Journal
    • /
    • 제16권6호
    • /
    • pp.538-546
    • /
    • 2001
  • 효모의 세포주기 관련 유전자 발현 통합 데이터를 사용하여 본 연구실에서 개발한 유전자 발현 통합 분석프로그램을 사용하여, 클러스터링 알고리즘의 성능을 비교하고 데이터내에 존재하는 클러스터 개수를 추정하기 위해 FOM 분석을 적용하였으며, 이 분석방법을 통하여 K-means, SOM, Fuzzy c-means 클러스터링 방법의 성능을 서로 비교하였다. 클러스터 개수를 추정한 다음 3가지 클러스터링 방법에 대한 클러스터링 결과 비교, 클러스터의 기능할당 및 모티프 분석을 시도하였다. 본 논문에서 제시하는 분석 방법은 DNA chip 발현 데이터의 일반적인 분석방법을 유전자 발현 패턴의 유사성을 토대로 한 클러스터링 방법에 근간을 두고 있다. 본 논문에서는 클러스터링한 후 각 클러스터의 기능할당 및 모티프 분석에 대한 일반적인 분석방법을 제시하였으며, 본 연구실에서 개발한 유전자 발현분석 통합 프로그램이 효율적으로 사용될 수 있음을 보여주고 있다.

  • PDF

클러스터 중심 왜곡 저감을 위한 클러스터링 기법 (Clustering Method for Reduction of Cluster Center Distortion)

  • 정혜천;서석태;이인근;권순학
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.354-359
    • /
    • 2008
  • 클러스터링은 주어진 임의의 데이터 중에서 유사한 성질을 지닌 데이터를 복수개의 그룹으로 조직화하는 기법이다. 이를 위해 K-Means, Fuzzy C-Means(FCM), Mountain Method(MM) 등과 같은 많은 기법들이 제안되었고 또한 널리 사용되어지고 있다. 그러나 이러한 기법들은 초기값에 따라 클러스터링 결과가 크게 달라지는 단점이 있다. 특히 가장 널리 사용되는 FCM 기법은 잡음 데이터에 취약하며, 주어진 입력 데이터의 클러스터 내부분산을 최소화 하는 방법을 사용하기 때문에 클러스터링 중심의 왜곡 현상이 발생한다. 본 논문에서는 데이터 가중치에 근거한 비례적 근접데이터 병합을 통하여 클러스터 중심 왜곡을 저감하며 초기값에 영향을 받지 않는 클러스터링 기법을 제안한다. 그리고 FCM으로 얻어진 클러스터 중심과 제안기법을 적용하여 얻어진 클러스터 중심에 대한 비교 검토를 통하여 제안기법의 효용성을 확인한다.

개선된 퍼지 클러스터링 (Improved Fuzzy Clusteirng)

  • 김승석;김성수;유정웅
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.6-11
    • /
    • 2005
  • 본 논문에서는 지능형 시스템의 초기 구조 및 파라미터 최적화에 필요한 개선된 성능의 퍼지 클러스터링 방법을 제안한다. 일반적인 클러스터링의 유용한 특성을 유지하면서 시스템의 구성을 적응적으로 변화시켜 전체 시스템의 학습과 성능을 개선할 수 있도록 하였다. 특히, 클러스터링 과정에서 발생하는 초기 파라미터 결정 문제와 최적화 문제를 동시에 만족하면서 일정한 구조로 수련하는 제안된 방법의 특성을 이용하여 지능형 모델에서 필요로 하는 조건이나 패턴의 구조를 자율적으로 추정하였다. 실험에서는 제안된 클러스터링 방법을 기존의 연구된 알고리즘과 비교하여 제안된 방법의 우수성을 보였다.

FCM을 이용한 퍼지 RBF 네트워크 (Fuzzy RBF Network using FCM)

  • 김재용;이상수;이준행;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.158-161
    • /
    • 2004
  • RBF 네트워크의 중간층은 클러스터링하는 층이다. 즉, 이 충의 목적은 주어진 자료 집합을 유사한 클러스터들(homogenous cluster)로 분류하는 것이다. 여기서 유사하다는 것은 입력 데이터들에 대한 특징 벡터 공간사이에서 한 클러스터내의 벡터들 간에 거리를 측정하여 정해진 반경 내에 존재하면 같은 클러스터로 분류하고 정해진 반경 내에 존재하지 않으면 다른 클러스터로 분류한다. 그러나 정해진 반경 내에서 클러스터링하는 것은 잘못된 클러스터를 선택하는 단점을 가지게 된다. 그러므로 중간층을 결정하는 .것은 RBF 네트워크의 전반적인 효율성에 큰 영향을 준다. 따라서 본 논문에서는 효율적으로 중간층을 결정하기 위한 방법으로 퍼지 C-Means 클러스터링 알고리즘을 적용한 퍼지 RBF 네트워크를 제안한다. 제안된 퍼지 RBF 네트워크의 학습은 크게 두 단계로 구분된다. 첫 번째 단계는 입력층과 중간층 사이에 퍼지 C-Means 알고리즘이 수행되고, 두 번째 단계는 중간층과 출력층 사이에 지도학습이 수행된다. 제안된 방법의 학습 성능을 평가하기 위하여 실제 주민등록증에서 추출한 숫자패턴에 적용한 결과, 기존의 RBF네트워크 보다 학습 성능이 개선된 것을 확인하였다.

  • PDF

커널 밀도 추정을 이용한 Fuzzy C-means의 초기 원형 설정 (Initial Prototype Selection in Fuzzy C-Means Using Kernel Density Estimation)

  • 조현학;허경용;김광백
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.85-88
    • /
    • 2011
  • Fuzzy C-Means (FCM) 알고리듬은 가장 널리 사용되는 군집화 알고리듬 중 하나로 다양한 응용 분야에서 사용되고 있다. 하지만 FCM은 여러 가지 문제점을 가지고 있으며 초기 원형 설정이 그 중 하나이다. FCM은 국부 최적해에 수렴하므로 초기 원형 설정에 따라 클러스터링 결과가 달라진다. 이 논문에서는 이러한 FCM의 초기 원형 설정 문제를 개선하기 위하여 커널밀도 추정 (kernel density estimation) 기법을 활용하는 방법을 제안한다. 제안한 방법에서는 먼저 커널 밀도 추정을 수행한 후 밀도가 높은 지역에 클러스터의 초기 원형을 설정하고 원형이 설정된 영역의 밀도를 감소시키는 과정을 반복함으로써 효율적으로 초기 원형을 설정할 수 있다. 제안된 방법이 일반적으로 사용되는 무작위 초기화 방법에 비해 효율적이라는 사실은 실험결과를 통해 확인할 수 있다.

  • PDF

HCM 클러스터링 알고리즘 기반 비퍼지 추론 시스템의 비선형 특성 (Nonlinear Characteristics of Non-Fuzzy Inference Systems Based on HCM Clustering Algorithm)

  • 박건준;이동윤
    • 한국산학기술학회논문지
    • /
    • 제13권11호
    • /
    • pp.5379-5388
    • /
    • 2012
  • 비선형 공정에 대한 퍼지 모델링에서, 퍼지 규칙은 일반적으로 입력 변수 선택, 공간 분할 수 및 소속 함수에 의해 형성된다. 비선형 공정에 대한 퍼지 규칙의 생성은 차원이 증가할수록 규칙의 수가 지수적으로 증가하는 문제를 가지고 있다. 이를 해결하기 위해, 입력 공간의 퍼지 분할에 의한 퍼지 규칙을 생성함으로써 복잡한 비선형 공정을 모델링 할 수 있다. 따라서 본 논문에서는 HCM 클러스터링 알고리즘을 이용하여 입력 공간을 분산 형태로 분할함으로써 비퍼지 추론 시스템의 규칙을 생성한다. 규칙의 전반부 파라미터는 HCM 클러스터링 알고리즘에 의한 소속행렬로 결정된다. 규칙의 후반부는 다항식 함수의 형태로 표현되며, 각 규칙의 후반부 파라미터들은 표준 최소자승법에 의해 동정된다. 마지막으로, 비선형 공정으로는 널리 이용되는 데이터를 이용하여 비선형 특성 및 성능을 평가한다. 본 실험을 통해 고차원의 비선형 시스템은 매우 적은 수의 규칙을 가지고 모델링할 수 있었다.

개선된 FCM 클러스터링 영상 분할 (Improved FCM Clustering Image Segmentation)

  • 이광규
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.127-131
    • /
    • 2020
  • 클러스터링을 이용한 대표적인 영상 분할 방법으로 Fuzzy C-Means(FCM) 알고리즘을 많이 사용하는데, FCM은 영상의 공간을 픽셀 값이 비슷한 클러스터 영역으로 분할하므로 분할 시간이 많이 소요된다. 특히 웹이 보편화된 현재 사용자들의 다양한 패턴을 분석하기 위한 처리 속도 문제는 더욱 중요하다. 이러한 속도 문제를 해결하기 위해 본 논문에서는 Otsu의 영상 히스토그램의 임계값과 FCM으로 영상을 분할하는 개선된 FCM(Improved FCM : IFCM) 알고리즘을 제안한다. 제안방법은 Otsu의 클래스 간의 분산을 최대화 시키는 임계값을 결정하여 FCM에 적용하고 영상을 분할하였다. IFCM은 기존의 FCM에 비해 영상 분할 시간을 단축시켜 성능이 향상되었음을 실험을 통해 보인다.