• 제목/요약/키워드: clustering algorithms

검색결과 606건 처리시간 0.035초

A Novel Image Segmentation Method Based on Improved Intuitionistic Fuzzy C-Means Clustering Algorithm

  • Kong, Jun;Hou, Jian;Jiang, Min;Sun, Jinhua
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권6호
    • /
    • pp.3121-3143
    • /
    • 2019
  • Segmentation plays an important role in the field of image processing and computer vision. Intuitionistic fuzzy C-means (IFCM) clustering algorithm emerged as an effective technique for image segmentation in recent years. However, standard fuzzy C-means (FCM) and IFCM algorithms are sensitive to noise and initial cluster centers, and they ignore the spatial relationship of pixels. In view of these shortcomings, an improved algorithm based on IFCM is proposed in this paper. Firstly, we propose a modified non-membership function to generate intuitionistic fuzzy set and a method of determining initial clustering centers based on grayscale features, they highlight the effect of uncertainty in intuitionistic fuzzy set and improve the robustness to noise. Secondly, an improved nonlinear kernel function is proposed to map data into kernel space to measure the distance between data and the cluster centers more accurately. Thirdly, the local spatial-gray information measure is introduced, which considers membership degree, gray features and spatial position information at the same time. Finally, we propose a new measure of intuitionistic fuzzy entropy, it takes into account fuzziness and intuition of intuitionistic fuzzy set. The experimental results show that compared with other IFCM based algorithms, the proposed algorithm has better segmentation and clustering performance.

PC-clustering을 이용한 매핑자료처리 및 변환소프트웨어에 관한 연구 (A study on the process of mapping data and conversion software using PC-clustering)

  • 황보택근;이병욱;박홍기
    • 대한공간정보학회지
    • /
    • 제7권2호
    • /
    • pp.123-132
    • /
    • 1999
  • 컴퓨팅 알고리즘의 병렬화는 계산량 및 데이터의 증가와 더불어 필요성이 꾸준히 제기되어 왔다. 그러나 병렬처리에 사용되는 컴퓨터는 1990년대 중반까지 주로 슈퍼컴퓨터로서 가격, 사용법 등 일반인이 쉽게 접근하지 못할 요소가 많았다. 1990년대 후반에 병렬 처리를 위한 PC-cluster라는 새로운 개념이 나타나게 되었고, 아직 설치와 사용법에서 개선될 여지가 많이 있음에도 불구하고 값싼 비용으로 고성능의 계산 능력을 원하는 일반 사용자에게 PC-cluster는 가장 뛰어난 대안으로 떠오르고 있다. GIS 데이터의 매핑은 축척변환(scale), 벡터에서 레스터로의 변환, DXF 자료구조에서 내부 자료구조로의 변환, 두 지역이 연결되었을 때 가장자리 데이터의 보정, 개체선택, Join, Cut의 처리 등 병렬 처리에 적합한 여러 가지 특성을 가지고 있다. 따라서 이들을 K-clustering으로 구현할 경우 값싼 비용으로 실시간 처리를 할 수 있어 성능과 비용의 모든 면에서 만족할 만한 결과를 얻을 수 있을 것이다. 본 논문에서는 병렬처리 및 PC-clustring, 그리고 이들을 이용하기 위한 라이브러리 및 도구에 대한 소개와, 이들이 매핑에 어떻게 적용시킬 수 있는 가를 살펴보았다. 또한 매핑의 여러 기능을 위한 병렬 프로그램을 개발하였고, 실험 결과 노드의 수에 따라 모든 기능에서 성능이 거의 선형적으로 향상됨을 보여주고 있다.

  • PDF

최소좁은세상 셀룰러 유전알고리즘 (Smallest-Small-World Cellular Genetic Algorithms)

  • 강태원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권11호
    • /
    • pp.971-983
    • /
    • 2007
  • 셀룰러 유전알고리즘(CGAs)은 모집단이 특정한 위상 구조를 갖는 유전알고리즘의 일종이다. 보통의 경우, CGAs의 모집단 공간은 네트워크 이론 측면에서 상대적으로 긴 평균경로길이와 큰 클러스터링계수를 갖는 정규 격자형 위상 구조이다. 평균경로길이가 길면 멀리 떨어진 개체들 사이의 유전적 상호작용이 느리게 일어난다. 따라서 클러스터링계수를 유지하면서 평균경로길이를 줄인다면 개체의 다양성이 유지되면서도 모집단이 보다 빠르게 수렴할 것이다. 이 논문에서는 최소좁은세상 셀룰러 유전알고리즘(SSWCGAs)을 제안한다. SSWCGAs에서 각 개체는 클러스터링이 잘되었으면서도 노드를 연결하는 평균경로길이가 짧은 모집단에 거주하여, 클러스터링에 의한 세부탐색 능력을 유지하면서도 전역탐색을 잘하게 된다. 네 가지 실변수 함수와 두 가지 GA-hard 문제에 대한 실험을 통하여 SSWCGAs가 SGAs 및 CGAs보다 효과적임을 보였다.

Comparison of time series clustering methods and application to power consumption pattern clustering

  • Kim, Jaehwi;Kim, Jaehee
    • Communications for Statistical Applications and Methods
    • /
    • 제27권6호
    • /
    • pp.589-602
    • /
    • 2020
  • The development of smart grids has enabled the easy collection of a large amount of power data. There are some common patterns that make it useful to cluster power consumption patterns when analyzing s power big data. In this paper, clustering analysis is based on distance functions for time series and clustering algorithms to discover patterns for power consumption data. In clustering, we use 10 distance measures to find the clusters that consider the characteristics of time series data. A simulation study is done to compare the distance measures for clustering. Cluster validity measures are also calculated and compared such as error rate, similarity index, Dunn index and silhouette values. Real power consumption data are used for clustering, with five distance measures whose performances are better than others in the simulation.

상황변화에 따른 엔트로피 기반의 클러스터 구성 알고리즘 (Efficient Clustering Algorithm based on Data Entropy for Changing Environment)

  • 최윤정
    • 한국산학기술학회논문지
    • /
    • 제10권12호
    • /
    • pp.3675-3681
    • /
    • 2009
  • 무선 센서네트워크를 효율적으로 운영하고 관리하기 위해서는 센서노드들이 에너지를 효율적으로 사용하도록 프로세스를 설계하고 운영하는 것이 매우 중요하다. 최소한의 자원으로 무인 동작되는 센서 시스템에 결함이 발생하거나 디바이스의 전력이 소진된다면 전체 네트워크에 치명적인 영향을 미치므로, 변화하는 환경을 감지하여 상황에 따라 처리하여 신뢰도를 높이기 위한 연구가 활발하다. 본 논문에서는 센서데이터들의 변화에 따라 환경변화를 인지하고 능동적으로 클러스터링을 재 수행 하게 함으로써 에너지 효율을 높일 수 있는 알고리즘을 제안하고 있다. 상황변화에 따라 변화하는 클러스터의 안정도를 물리량의 무질서 정도를 나타내는 엔트로피의 개념을 이용하여 기존의 확률적 접근방식을 보완하여 클러스터링에 활용하고 있다. 또한, 클러스터링 기반의 LEACH 알고리즘과 엔트로피를 이용하는 제안방법과의 비교를 위해 상황에 따른 조건을 정하여 실험하고 전체 센서노드의 생존율을 체크하여 실험결과를 비교분석 하였다.

Three Effective Top-Down Clustering Algorithms for Location Database Systems

  • Lee, Kwang-Jo;Yang, Sung-Bong
    • Journal of Computing Science and Engineering
    • /
    • 제4권2호
    • /
    • pp.173-187
    • /
    • 2010
  • Recent technological advances in mobile communication systems have made explosive growth in the number of mobile device users worldwide. One of the most important issues in designing a mobile computing system is location management of users. The hierarchical systems had been proposed to solve the scalability problem in location management. The scalability problem occurs when there are too many users for a mobile system to handle, as the system is likely to react slow or even get down due to late updates of the location databases. In this paper, we propose a top-down clustering algorithm for hierarchical location database systems in a wireless network. A hierarchical location database system employs a tree structure. The proposed algorithm uses a top-down approach and utilizes the number of visits to each cell made by the users along with the movement information between a pair of adjacent cells. We then present a modified algorithm by incorporating the exhaustive method when there remain a few levels of the tree to be processed. We also propose a capacity constraint top-down clustering algorithm for more realistic environments where a database has a capacity limit. By the capacity of a database we mean the maximum number of mobile device users in the cells that can be handled by the database. This algorithm reduces a number of databases used for the system and improves the update performance. The experimental results show that the proposed, top-down, modified top-down, and capacity constraint top-down clustering algorithms reduce the update cost by 17.0%, 18.0%, 24.1%, the update time by about 43.0%, 39.0%, 42.3%, respectively. The capacity constraint algorithm reduces the average number of databases used for the system by 23.9% over other algorithms.

영상 분할을 위한 개선된 공간적 퍼지 클러스터링 알고리즘 (An Enhanced Spatial Fuzzy C-Means Algorithm for Image Segmentation)

  • 퉁 투룽;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.49-57
    • /
    • 2012
  • FCM(fuzzy c-means)은 일반적으로 영상 분할에서 좋은 성능을 보인다. 하지만 공간 정보를 사용하지 않는 일반적인 FCM 알고리즘은 낮은 대비의 영상, 경계선이 뚜렷하지 않은 영상, 잡음이 포함된 영상의 분할에는 좋지 않은 성능을 보인다. 이와 같은 문제를 해결하기 위해 본 논문에서는 3x3 크기의 윈도우를 이용하여 윈도우 내의 중심 픽셀과 주변 픽셀간의 거리 정보를 소속 함수에 추가한 개선된 공간적 퍼지 클러스터링 알고리즘을 제안한다. 본 논문에서는 분할 계수, 분할 엔트로피, Xie-Bdni 함수와 같은 클러스터링 검증 함수를 이용하여 FCM 기반의 다양한 클러스터링 알고리즘과 제안한 알고리즘과의 성능을 비교하였다. 성능 평가 결과 제안한 알고리즘이 기존의 FCM기반의 클러스터링 알고리즘보다 클러스터링 검증 함수에서 성능이 우수함을 확인 할 수 있었다.

공간데이타 마이닝을 위한 효율적인 그리드 셀 기반 공간 클러스터링 알고리즘 (An Efficient Grid Cell Based Spatial Clustering Algorithm for Spatial Data Mining)

  • 문상호;이동규;서영덕
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.567-576
    • /
    • 2003
  • 대용량의 공간데이터베이스로부터 암시적이고 유용한 지식을 자동적으로 추출하는 공간데이터 마이닝은 데이타 양이 급격히 증가하면서 필요성이 더욱 증대되고 있다. 공간데이터 마이닝에서 데이타를 분석하여 유사한 그룹으로 분류하는 공간 클러스터링은 매우 중요한 분야이다. 기존 연구에서 공간 클러스터링을 위한 여러 가지 알고리즘들이 제시되었지만, 다음과 같은 문제점들이 있다. 먼저 클러스터링을 위하여 객체들 간의 거리론 기반으로 하므로 데이타 양이 많아질수록 계산 비용이 커진다. 또한, 메모리 상주 데이타를 대상으로 하므로 대용량의 데이타인 경우에 효율이 떨어진다. 본 논문에서는 공간데이터 마이닝을 위하여 그리드 셀을 기반으로 한 효율적인 공간 클러스터링 방법을 제시한다. 이 클러스터링에서는 기존 공간 클러스터링 기법들의 문제점을 해결하는데 중점을 둔다. 세부적으로 공간 클러스터링의 효율성을 높이기 위하여 클러스터링시에 발생하는 비용(계산량)을 감소시키는 것이다. 이를 위해서 공간지역성을 보장하는 대표적인 공간분할 방법인 그리드 셀을 기반으로 한 공간 클러스터링 기법을 제시한다.

Clustering of 2D-Gel Images

  • Hur, Won
    • 한국생물공학회:학술대회논문집
    • /
    • 한국생물공학회 2003년도 생물공학의 동향(XIII)
    • /
    • pp.746-749
    • /
    • 2003
  • Alignment of 2D-gel images of biological samples can visualize the difference of expression profiles and also inform us candidates of protein spots to be further analyzed. However, comparison of two proteome images between case and control does not always successfully identify differentially expressed proteins due to sample-to-sample variation. Because of poor reproducibility of 2D-gel electrophoresis, sample-by-sample variations and inconsistent electrophoresis conditions, multiple number of 2D-gel image must be processed to align each other to visualize the difference of expression profiles and to deduce the protein spots differentially expressed with reliability. Alignment of multiple 2D-Gel images and their clustering were carried out by applying various algorithms and statistical methods. In order to align multiple images, multiresolution-multilevel algorithm was found out to be suitable for fast alignment and for distorted images. Clustering of 12 different images implementing a k-means algorithm gives a phylogenetic tree of distance map of the proteomes. Microsoft Visual C++ was used to implement the algorithms in this work.

  • PDF

유전자적 최적 정보 입자 기반 퍼지 추론 시스템 (Genetically Optimized Information Granules-based FIS)

  • 박건준;오성권;이영일
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.146-148
    • /
    • 2005
  • In this paper, we propose a genetically optimized identification of information granulation(IG)-based fuzzy model. To optimally design the IG-based fuzzy model we exploit a hybrid identification through genetic alrogithms(GAs) and Hard C-Means (HCM) clustering. An initial structure of fuzzy model is identified by determining the number of input, the seleced input variables, the number of membership function, and the conclusion inference type by means of GAs. Granulation of information data with the aid of Hard C-Means(HCM) clustering algorithm help determine the initial paramters of fuzzy model such as the initial apexes of the membership functions and the initial values of polyminial functions being used in the premise and consequence part of the fuzzy rules. And the inital parameters are tuned effectively with the aid of the genetic algorithms and the least square method. And also, we exploite consecutive identification of fuzzy model in case of identification of structure and parameters. Numerical example is included to evaluate the performance of the proposed model.

  • PDF