• 제목/요약/키워드: fuzzy cluster

검색결과 261건 처리시간 0.028초

Document Clustering Using Semantic Features and Fuzzy Relations

  • Kim, Chul-Won;Park, Sun
    • Journal of information and communication convergence engineering
    • /
    • 제11권3호
    • /
    • pp.179-184
    • /
    • 2013
  • Traditional clustering methods are usually based on the bag-of-words (BOW) model. A disadvantage of the BOW model is that it ignores the semantic relationship among terms in the data set. To resolve this problem, ontology or matrix factorization approaches are usually used. However, a major problem of the ontology approach is that it is usually difficult to find a comprehensive ontology that can cover all the concepts mentioned in a collection. This paper proposes a new document clustering method using semantic features and fuzzy relations for solving the problems of ontology and matrix factorization approaches. The proposed method can improve the quality of document clustering because the clustered documents use fuzzy relation values between semantic features and terms to distinguish clearly among dissimilar documents in clusters. The selected cluster label terms can represent the inherent structure of a document set better by using semantic features based on non-negative matrix factorization, which is used in document clustering. The experimental results demonstrate that the proposed method achieves better performance than other document clustering methods.

빅데이터에서 개선된 TI-FCM 클러스터링 알고리즘 (Improved TI-FCM Clustering Algorithm in Big Data)

  • 이광규
    • 전기전자학회논문지
    • /
    • 제23권2호
    • /
    • pp.419-424
    • /
    • 2019
  • FCM 알고리즘은 반복 최적화 기법을 통해 최적해를 찾는다. 특히, 클러스터링 초기 중심과 잡음의 위치, 몰려있는 밀도의 위치, 개수에 따라 실행시간 차이가 난다. 하지만 이 방법은 중심점을 점차 갱신해 나가는 방법으로 초기 클러스터 중심이 한 쪽으로 치우치게 되고 클러스터링 결과의 편차가 심해 클러스터링 대푯값의 신뢰도가 떨어진다. 따라서 본 논문에서는 삼각부등식을 이용하여 클러스터 간 거리를 최대한 멀어지게 하여 클러스터 중심 밀도를 결정하는 TI-FCM(Triangular Inequality-Fuzzy C-Means:삼각부등식-FCM)클러스터링 알고리즘을 제안한다. 제안된 방법은 대용량의 빅데이터에서도 FCM에 비해 실제 클러스터에 수렴하는 효과적인 방법이고 실험을 통해 기존 FCM보다 실행시간이 감소됨을 보였다.

적응적 Multiple Kernels을 이용한 Interval Type-2 Possibilistic Fuzzy C-Means 방법 (A Novel Approach towards use of Adaptive Multiple Kernels in Interval Type-2 Possibilistic Fuzzy C-Means)

  • 주원희;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.529-535
    • /
    • 2014
  • 본 논문에서는 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 클러스터링 방법에 multiple Gaussian kernels을 기반으로 한 possibilistic fuzzy C-means multiple kernels(PFCM-MK) 알고리즘을 결합하여 적응적인 하이브리드 클러스터링 방법인 multiple kernels interval type-2 possibilistic fuzzy C-means(IT2PFCM-MK) 방법을 제안 하였다. 일반적으로 possibilistic fuzzy C-means(PFCM) 알고리즘은 fuzzy C-means(FCM) 알고리즘의 단점인 노이즈 민감성 및 특이점 문제와 알고리즘 초기 클러스터의 Prototype에 따라 위치가 겹치는 문제를 해결하기 위해 제안 되었다. 하지만 이 방법 역시 퍼지화 파라미터 값에 따라 위와 같은 문제를 여전히 가지고 있기 때문에 이와 같은 문제를 보완하기 위해 interval type-2 퍼지 접근 방법을 이용 하는 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 알고리즘을 제안 하였다. 또한 multiple kernels 함수를 interval type-2 possibilistic fuzzy C-means(IT2PFCM) 알고리즘에 적용하여 분류하기 복잡한 형태의 데이터와 노이즈가 있는 데이터에 대하여 보다 정확하고, 향상된 클러스터링을 수행할 수 있다.

레귤러라이제이션 기반 개선된 밀도 무관 퍼지 클러스터링 (Improved Density-Independent Fuzzy Clustering Using Regularization)

  • 한수환;허경용
    • 한국정보통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.1-7
    • /
    • 2020
  • FCM(Fuzzy C-Means)으로 대표되는 퍼지 클러스터링은 간단하면서도 효율적인 클러스터링 방법이지만, FCM에서 사용하는 목적 함수에서는 밀도가 높은 클러스터가 클러스터링 결과에 많은 영향을 미치도록 함으로써 클러스터 사이의 밀도 차에 의해 클러스터링 결과에 왜곡이 발생할 수 있다. 이러한 밀도 문제를 완화하는 방법의 하나로 FCM의 목적 함수에 밀도 차이를 보정할 수 있는 항을 추가한 EDI-FCM(Extended Density-Independent FCM)이 있다. 이 논문에서는 레귤러라이제이션을 이용하여 EDI-FCM을 보완한 Regularized EDI-FCM을 제안한다. 레귤러라이제이션은 해공간을 평탄화하고 잡음 민감성을 줄이기 위해 흔히 사용되는 방법으로, 클러스터링에서는 특정 클러스터가 클러스터링 결과에 미치는 영향을 줄이는 역할을 한다. 제안하는 방법은 FCM이나 EDI-FCM과 비교했을 때 실제 클러스터 중심에 빠르고 정확하게 수렴한다는 것을 실험 결과를 통해 확인할 수 있다.

Improving Data Accuracy Using Proactive Correlated Fuzzy System in Wireless Sensor Networks

  • Barakkath Nisha, U;Uma Maheswari, N;Venkatesh, R;Yasir Abdullah, R
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권9호
    • /
    • pp.3515-3538
    • /
    • 2015
  • Data accuracy can be increased by detecting and removing the incorrect data generated in wireless sensor networks. By increasing the data accuracy, network lifetime can be increased parallel. Network lifetime or operational time is the time during which WSN is able to fulfill its tasks by using microcontroller with on-chip memory radio transceivers, albeit distributed sensor nodes send summary of their data to their cluster heads, which reduce energy consumption gradually. In this paper a powerful algorithm using proactive fuzzy system is proposed and it is a mixture of fuzzy logic with comparative correlation techniques that ensure high data accuracy by detecting incorrect data in distributed wireless sensor networks. This proposed system is implemented in two phases there, the first phase creates input space partitioning by using robust fuzzy c means clustering and the second phase detects incorrect data and removes it completely. Experimental result makes transparent of combined correlated fuzzy system (CCFS) which detects faulty readings with greater accuracy (99.21%) than the existing one (98.33%) along with low false alarm rate.

퍼지 클러스터 분석 기반 특징 선택 방법 (A Feature Selection Method Based on Fuzzy Cluster Analysis)

  • 이현숙
    • 정보처리학회논문지B
    • /
    • 제14B권2호
    • /
    • pp.135-140
    • /
    • 2007
  • 특징선택은 문제 영역에서 관찰된 다차원데이터로부터 데이터가 묘사하는 구조를 잘 반영하는 속성을 선택하여 효과적인 실험 데이터를 구성하는 데이터 준비과정이다. 이 과정은 문서분류, 영상인식, 유전자 선택 분야에서의 같은 분류시스템의 성능향상에 중요한 구성요소로서 상관관계 기법, 차원축소 및 상호 정보 처리 등의 통계학이나 정보이론의 접근방법을 중심으로 연구되어왔다. 이와 같은 선택 분야의 연구는 다루는 데이터의 양이 방대해지고 복잡해지면서 더욱 중요시 되고 있다. 본 논문에서는 데이터가 가지는 특성을 반영하면서 새로운 데이터에 대하여 일반화 할 수 있는 특징선택 방법을 제안하고자 한다. 준비된 데이터의 각 속성 데이터에 대하여 퍼지 클러스터 분석에 의하여 최적의 클러스터 정보를 얻고 이를 바탕으로 근접성과 분리성의 경로를 측정하여 그 값에 따라 특징을 선택하는 매카니즘을 제공한다. 제안된 방법을 실세계의 컴퓨터 바이러스 분류에 적용하여 기존의 대비에 의한 휴리스틱 방법에 의해 선택된 데이터를 가지고 분류한 것과 비교하고자 한다. 이를 통하여 주어진 특징에 시연을 부여할 수 있고 효과적으로 특징을 선택하여 시스템의 성능을 향상 시킬 수 있음을 확인한다.

퍼지 클러스터 필터와 가중화 된 벡터 $\alpha$-trimmed 평균 필터를 이용한 칼라 영상처리 (Color Image Processing using Fuzzy Cluster Filters and Weighted Vector $\alpha$-trimmed Mean Filter)

  • 엄경배;이준환
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1731-1741
    • /
    • 1999
  • 칼라 영상은 센서 잡음이나 채널 전송 에러에 의해 생기는 잡음에 의해 자주 오염되어진다. 이러한 칼라 잡음을 제거하기 위해 벡터 미디안, 벡터 $\alpha$-trimmed 평균 필터 등 여러 형태의 필터들이 개발되어져 왔다. 본 논문에서 제안된 클러스터 필터는 잡음에 오염된 환경 하에서 강건한 소속함수 값을 얻을 수 있는 가능적 c-mean 클러스터링 방법을 이용하였다. 또한, 본 논문에서는 혼합된 잡음에서 우수한 벡터 $\alpha$-trimmed 평균 필터를 개선하여, 원도우내의 화소중 중심에 위치한 화소에는 더 가중치를 부여하여 가중화 된 평균 필터링을 수행하는 가중화 벡터$\alpha$-trimmed 평균 필터를 제안하였다. 본 논문에서는 칼라 잡음이 발생한 영상에서 제안된 필터들의 성능을 평가하기 위해 칼라 잡음 발생기를 구현하였으며, 실험 결과는 NCD 척도 및 관측자의 시각에 의해 평가되었다. 실험 결과 제안된 퍼지 클러스터 필터는 NCD 관점에서 기존의 필터들에 비해 혼합된 잡음에서 우수한 성능을 보였고, 제안된 가중화된 벡터 $\alpha$-trimmed 평균 필터는 벡터 $\alpha$-trimmed 평균 필터에 비해 어떠한 잡음 하에서도 양호한 결과를 보였다.

  • PDF

중첩성과 분리성을 이용한 퍼지 클러스터 평가척도 (A Fuzzy Cluster Validity based on Inter-cluster Overlapping and Separation)

  • 김대원;이광형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.99-102
    • /
    • 2003
  • 본 논문에서는 퍼지 클러스터링 알고리즘에 의해 구해진 퍼지 클러스터들에 대한 평가척도를 제안한다. 제안된 척도는 퍼 지 클러스터들간의 중첩성(overlapping)과 분리성 (separation)을 이용한다. 중첩성은 클러스터간 인접도를 이용하여 계산하며, 분리성은 데이터에 대한 상관성 정도를 나타낸다. 따라서 중첩성이 낮고 분리성이 높을수록 좋은 클러스터 결과라고 할 수 있다. 표준 데이터 집합을 대상으로 기존의 척도들과 비교실험 함으로써 제안된 척도의 신뢰성을 알아보았다.

  • PDF

퍼지기법에 기초한 로드분배 방식에 의한 웹서버 성능향상 (A Fuzzy Technique-based Web Server Performance Improvement Using a Load Balancing Mechanism)

  • 박범주;박기진;강명구;김성수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권3호
    • /
    • pp.111-119
    • /
    • 2008
  • 본 논문에서는 차별화 서비스를 지원하는 웹 서버의 응답시간 성능을 향상시키기 위해 기존의 동적 성능 분리 기법에 퍼지 기법을 접목한다. 특히, 클러스터 기반 웹서버 시스템의 부하량에 대한 판단 기준 흑은 사용자 요청율 및 동적요청 비율 변화시에 발생하는 애매모호한 상황을 효과적으로 반영하기 위해, 퍼지제어 기법에 기초한 로드분배 메커니즘을 제안하였다. 이를 통해, 기존의 퍼지 기법을 활용하지 않은 성능분리 기법과 퍼지기법을 활용한 경우에 대해 응답시간(95-percentile of Response Time) 성능비교 평가를 통해 퍼지기반의 성능분리 기법이 차별화 서비스 시스템의 성능을 더욱 강건하고 효율적으로 향상시킬 수 있다는 점을 검증하였다.

원형 윤곽선 검출을 위한 Interval 제2종 퍼지 C 클러스터링 (Interval Type-2 Fuzzy C Clustering for Detecting Spherical Shells)

  • 황철;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.713-719
    • /
    • 2004
  • 본 논문은 fuzzy C 원형 윤곽선(fuzzy C spherical shells 이하 FCSS) 알고리즘을 확장한 interval 제2종 fuzzy C 원형 윤곽선 알고리즘에 관한 연구이다(1). 본 논문에서는 FCSS의 클러스터 윤곽선과의 관계에 의해 패턴이 할당받은 퍼지 소속도(fuzzy 소속도) 값 결정에 존재하는 불확실성(once퍼ainty)은 표현하고, 관리하여 클러스터링 성능을 향상하고자 한다. 이러한 과정을 통하여 확장된 interval 제2종 FCSS는 패턴 집합에 존재할 수 있는 노이즈(noise)의 존재에 대해 기존의 FCSS보다 좀더 안정적이고, 바람직한 클러스터 윤곽선을 검출해낼 수 있도록 할 수 있을 것이다.