• 제목/요약/키워드: Clustering Technique

검색결과 704건 처리시간 0.021초

Medoid Determination in Deterministic Annealing-based Pairwise Clustering

  • Lee, Kyung-Mi;Lee, Keon-Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권3호
    • /
    • pp.178-183
    • /
    • 2011
  • The deterministic annealing-based clustering algorithm is an EM-based algorithm which behaves like simulated annealing method, yet less sensitive to the initialization of parameters. Pairwise clustering is a kind of clustering technique to perform clustering with inter-entity distance information but not enforcing to have detailed attribute information. The pairwise deterministic annealing-based clustering algorithm repeatedly alternates the steps of estimation of mean-fields and the update of membership degrees of data objects to clusters until termination condition holds. Lacking of attribute value information, pairwise clustering algorithms do not explicitly determine the centroids or medoids of clusters in the course of clustering process or at the end of the process. This paper proposes a method to identify the medoids as the centers of formed clusters for the pairwise deterministic annealing-based clustering algorithm. Experimental results show that the proposed method locate meaningful medoids.

K-means Clustering for Environmental Indicator Survey Data

  • Park, Hee-Chang;Cho, Kwang-Hyun
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2005년도 춘계학술대회
    • /
    • pp.185-192
    • /
    • 2005
  • There are many data mining techniques such as association rule, decision tree, neural network analysis, clustering, genetic algorithm, bayesian network, memory-based reasoning, etc. We analyze 2003 Gyeongnam social indicator survey data using k-means clustering technique for environmental information. Clustering is the process of grouping the data into clusters so that objects within a cluster have high similarity in comparison to one another. In this paper, we used k-means clustering of several clustering techniques. The k-means clustering is classified as a partitional clustering method. We can apply k-means clustering outputs to environmental preservation and environmental improvement.

  • PDF

효율적인 개념 클러스터링 기법 (An Efficient Conceptual Clustering Scheme)

  • 양기철
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권4호
    • /
    • pp.349-354
    • /
    • 2020
  • 본 논문에서는 개체를 자유롭게 설명하고 효율적으로 클러스터링을 수행 할 수 있는 개념 그래프 기반의 새로운 클러스터링 체계 Clustering scheme Based on Conceptual graphs(CBC)를 제안한다. 개념적 클러스터링은 기계 학습 기술 중 하나이다. 개념 클러스터링에서 개체 간의 유사성은 개체의 의미나 환경을 고려하지 않고 유사성을 결정하는 일반적인 클러스터링 체계와 달리 개념 구성원의 자격에 따라 결정된다. 이 논문에서는 다양한 개체를 개념 그래프로 자유롭게 설명하여 효율적인 개념 클러스터링을 수행 할 수 있는 새로운 개념 클러스터링 체계인 CBC를 소개한다.

궤적 클러스터링 기법을 이용한 클러스터 그룹 헤드 선정 (A Cluster Group Head Selection using Trajectory Clustering Technique)

  • 김진수;신승수
    • 한국산학기술학회논문지
    • /
    • 제12권12호
    • /
    • pp.5865-5872
    • /
    • 2011
  • 무선 센서 네트워크의 클러스터링 시스템에서 클러스터 헤드가 기지국으로부터 멀리 떨어져있어 다중홉으로 통신하는 경우, 센싱된 데이터는 중간 클러스터 헤드를 통해 기지국으로 전송한다. 기지국에 가까이 있는 헤드 노드가 먼 노드보다 더 많은 패킷을 중계할 필요가 있기 때문에 핫 스팟 문제가 생긴다. 이런 문제로 기지국 가까이에 있는 클러스터 헤드는 에너지가 쉽게 고갈되고 이로 인해 네트워크의 수명을 단축시킨다. 본 논문에서는 궤적 클러스터링 기법을 이용한 클러스터 그룹 헤드 선정 기법을 제안한다. 제안하는 방법에서 클러스터 헤드 및 그룹 헤드의 선정은 궤적 클러스터링 기법 및 적합도 함수를 이용함으로써 에너지 효율을 높인다. 또한 핫 스팟 문제는 여러 계층을 클러스터 그룹으로 지정하고 그에 대한 적합도 함수를 이용하여 에너지 소모의 균형을 맞춤으로써 해결한다. 실험을 통해 이전의 클러스터링 기법보다 네트워크 에너지 효율성이 향상됨을 입증한다.

제조 시계열 데이터를 위한 진화 연산 기반의 하이브리드 클러스터링 기법 (Evolutionary Computation-based Hybird Clustring Technique for Manufacuring Time Series Data)

  • 오상헌;안창욱
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.23-30
    • /
    • 2021
  • 제조 시계열 데이터 클러스터링 기법은 제조 대용량 데이터 기반 군집화를 통한 설비 및 공정 이상 탐지 분류를 위한 중요한 솔루션이지만 기존 정적 데이터 대상 클러스터링 기법을 시계열 데이터에 적용함에 있어 낮은 정확도를 가지는 단점이 있다. 본 논문에서는 진화 연산 기반 시계열 군집 분석 접근 방식을 제시하여 기존 클러스터링 기술에 대한 정합성 향상하고자 한다. 이를 위하여 먼저 제조 공정 결과 이미지 형상을 선형 스캐닝을 활용하여 1차원 시계열 데이터로 변환하고 해당 변환 데이터 대상으로 Pearson 거리 매트릭을 기반으로 계층적 군집 분석 및 분할 군집 분석에 대한 최적 하위클러스터를 도출한다. 해당 최적 하위클러스터 대상 유전 알고리즘을 활용하여 유사도가 최소화되는 최적의 군집 조합을 도출한다. 그리고 실제 제조 과정 이미지 대상으로 기존 클러스터링 기법과 성능 비교를 통하여 제안된 클러스터링 기법의 성능 우수성을 검증한다.

데이터 마이닝에서 그룹 세분화를 위한 2단계 계층적 글러스터링 알고리듬 (Two Phase Hierarchical Clustering Algorithm for Group Formation in Data Mining)

  • 황인수
    • 경영과학
    • /
    • 제19권1호
    • /
    • pp.189-196
    • /
    • 2002
  • Data clustering is often one of the first steps in data mining analysis. It Identifies groups of related objects that can be used as a starling point for exploring further relationships. This technique supports the development of population segmentation models, such as demographic-based customer segmentation. This paper Purpose to present the development of two phase hierarchical clustering algorithm for group formation. Applications of the algorithm for product-customer group formation in customer relationahip management are also discussed. As a result of computer simulations, suggested algorithm outperforms single link method and k-means clustering.

Clustering Algorithms for Reducing Energy Consumption - A Review

  • Kinza Mubasher;Rahat Mansha
    • International Journal of Computer Science & Network Security
    • /
    • 제23권7호
    • /
    • pp.109-118
    • /
    • 2023
  • Energy awareness is an essential design flaw in wireless sensor network. Clustering is the most highly regarded energy-efficient technique that offers various benefits such as energy efficiency and network lifetime. Clusters create hierarchical WSNs that introduce the efficient use of limited sensor node resources and thus enhance the life of the network. The goal of this paper is to provide an analysis of the various energy efficient clustering algorithms. Analysis is based on the energy efficiency and network lifetime. This review paper provides an analysis of different energy-efficient clustering algorithms for WSNs.

Fuzzy Technique-based Identification of Close and Distant Clusters in Clustering

  • Lee, Kyung-Mi;Lee, Keon-Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권3호
    • /
    • pp.165-170
    • /
    • 2011
  • Due to advances in hardware performance, user-friendly interfaces are becoming one of the major concerns in information systems. Linguistic conversation is a very natural way of human communications. Fuzzy techniques have been employed to liaison the discrepancy between the qualitative linguistic terms and quantitative computerized data. This paper deals with linguistic queries using clustering results on data sets, which are intended to retrieve the close clusters or distant clusters from the clustering results. In order to support such queries, a fuzzy technique-based method is proposed. The method introduces distance membership functions, namely, close and distant membership functions which transform the metric distance between two objects into the degree of closeness or farness, respectively. In order to measure the degree of closeness or farness between two clusters, both cluster closeness measure and cluster farness measure which incorporate distance membership function and cluster memberships are considered. For the flexibility of clustering, fuzzy clusters are assumed to be formed. This allows us to linguistically query close or distant clusters by constructing fuzzy relation based on the measures.

무선 센서 네트워크에서 에너지 소모 모델의 임계값을 고려한 클러스터링 기법 (A Clustering Method Considering the Threshold of Energy Consumption Model in Wireless Sensor Networks)

  • 김진수
    • 한국산학기술학회논문지
    • /
    • 제11권10호
    • /
    • pp.3950-3957
    • /
    • 2010
  • 무선 센서 네트워크는 한정된 자원의 센서 노드들로 구성되어 있고, 한번 구성된 후에는 유지 보수가 어렵다는 단점을 갖고 있다. 따라서 무선 센서 네트워크에서는 에너지 소비를 최소화하고, 한정된 자원을 효율적으로 사용하여 네트워크 수명을 최대화하는 것이 중요한 문제이다. 본 논문에서는 클러스터링 방식에서 클러스터 수를 효율적으로 지정하여 에너지 소모량을 최적화하는 기법을 제안한다. 이 기법은 무선 전송에 소비되는 에너지양은 거리(임계값)에 따라 많은 차이가 있으므로 이러한 임계값을 고려하여 클러스터 수를 지정함으로써 에너지 소비를 줄이는 방식이다. 실험을 통하여 제안된 클러스터링 기법은 LEACH(Low-Energy Adaptive Clustering Hierarchy)에 비해 전체 에너지 소모량 측면에서 높은 성능을 나타냄을 확인하였다.

데이터마이닝에 의한 고객세분화 개발 (A Development of Customer Segmentation by Using Data Mining Technique)

  • 진서훈
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.555-565
    • /
    • 2005
  • 고객세분화는 기업이 관계하고 있는 고객을 이해하고 그 이해를 바탕으로 효과적인 고객관리를 수행하기 위해 필수적인 요소인데 데이터마이닝이 기업의 정보관리영역에 적극적으로 활용되면서 보다 과학적이고 최적화된 형태로 개발되고 있다. 본 연구에서는 신용카드고객 의 카드사용행태에 근거하여 각 고객을 서로 유사한 사용행태를 보이는 고객군으로 세분화하는 과정을 소개하였다. 고객이 실제로 신용카드를 사용하면서 발생시킨 거래정보에만 의존하여 고객세분화를 개발하였으며 이는 마케팅의 관점에서 상당히 의미있는 내용이 될 수 있다. 고객세분화의 개발을 위하여 데이터마이닝기법인 k-평균 군집방법과 최장연결법에 의한 계보적 군집방법을 단계적으로 활용하는 이단계 군집방법을 이용하였다.