• Title/Summary/Keyword: 클러스터링 알고리즘

Search Result 985, Processing Time 0.023 seconds

Design and Development of Clustering Algorithm Considering Influences of Spatial Objects (공간객체의 영향력을 고려한 클러스터링 알고리즘의 설계와 구현)

  • Kim, Byung-Cheol
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.12
    • /
    • pp.113-120
    • /
    • 2006
  • This paper proposes DBSCAN-SI that is an algorithm for clustering with influences of spatial objects. DBSCAN-SI that is extended from existing DBSCAN and DBSCAN-W converts from non-spatial properties to the influences of spatial objects during the spatial clustering. It increases probability of inclusion to the cluster according to the higher the influences that is affected by the properties used in clustering and executes the clustering not only respect the spatial distances, but also volume of influences. For the perspective of specific property-centered, the clustering technique proposed in this paper can makeup the disadvantage of existing algorithms that exclude the objects in spite of high influences from cluster by means of being scarcely close objects around the cluster.

  • PDF

An Efficient Grid Cell Based Spatial Clustering Algorithm for Spatial Data Mining (공간데이타 마이닝을 위한 효율적인 그리드 셀 기반 공간 클러스터링 알고리즘)

  • Moon, Sang-Ho;Lee, Dong-Gyu;Seo, Young-Duck
    • The KIPS Transactions:PartD
    • /
    • v.10D no.4
    • /
    • pp.567-576
    • /
    • 2003
  • Spatial data mining, i.e., discovery of interesting characteristics and patterns that may implicitly exists in spatial databases, is a challenging task due to the huge amounts of spatial data. Clustering algorithms are attractive for the task of class identification in spatial databases. Several methods for spatial clustering have been presented in recent years, but have the following several drawbacks increase costs due to computing distance among objects and process only memory-resident data. In this paper, we propose an efficient grid cell based spatial clustering method for spatial data mining. It focuses on resolving disadvantages of existing clustering algorithms. In details, it aims to reduce cost further for good efficiency on large databases. To do this, we devise a spatial clustering algorithm based on grid ceil structures including cell relationships.

A Genetic Algorithm for Clustering Nodes in Wireless Ad-hoc Networks (무선 애드 혹 네트워크에서 노드 클러스터링을 위한 유전 알고리즘)

  • Jang, Kil-woong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.649-651
    • /
    • 2017
  • A clustering problem is one of the organizational problems to improve the network lifetime and scalability in wireless ad-hoc networks. This problem is a difficult combinatorial optimization problem associated with the design and operation of these networks. In this paper, we propose an efficient clustering algorithm to maximize the network lifetime and consider scalability in wireless ad-hoc networks. The clustering problem is known to be NP-hard. We thus solve the problem by using optimization approaches that are able to efficiently obtain high quality solutions within a reasonable time for a large size network. The proposed algorithm selects clusterheads and configures clusters by considering both nodes' power and the clustering cost. We evaluate this performance through some experiments in terms of nodes' transmission energy. Simulation results indicate that the proposed algorithm performs much better than the existing algorithms.

  • PDF

An Introduction of Two-Step K-means Clustering Applied to Microarray Data (마이크로 어레이 데이터에 적용된 2단계 K-means 클러스터링의 소개)

  • Park, Dae-Hun;Kim, Yeon-Tae;Kim, Seong-Sin;Lee, Chun-Hwan
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.11a
    • /
    • pp.83-86
    • /
    • 2006
  • 많은 유전자 정보와 그 부산물은 많은 방법을 통해 연구되어 왔다. DNA 마이크로어레이 기술의 사용은 많은 데이터를 가져왔으며, 이렇게 얻은 데이터는 기존의 연구 방법으로는 분석하기 힘들다. 본 눈문에서는 많은 양의 데이터를 처리할 수 있게 하기 위하여 K-means 클러스터링 알고리즘을 이용한 분할 클러스터링을 제안하였다. 제안한 방법을 쌀 유전자로부터 나온 마이크로어레이 데이터에 적용함으로써 제안된 클러스터링 방법의 유용성을 검증하였으며, 기존의 K-means 클러스터링 알고리즘을 적용한 결과와 비교함으로써 제안된 알고리즘의 우수성을 확인 할 수 있었다.

  • PDF

A Heuristic Leaf Ordering Algorithm for Hierarchical Clustering of DNA Microarray Data (DNA 마이크로어레이 데이터의 계층적 클러스터링에 대한 리프오더링 알고리즘 개발)

  • 여상수;이정원;김성권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.706-708
    • /
    • 2002
  • DNA 마이크로어레이 실험으로 나온 데이터들을 클러스터링하는 것은 유전자의 기능과 유전자의 네트워크를 파악해 나가는데 도움을 주게 된다. 계층적 클러스터링(hierarchical clustering) 방법은 그러한 실험 분석에서 가장 보편적으로 사용되는 방법이다. 본 논문에서는 계층적 클러스터링을 통해서 나온 결과 트리에 대해서, 트리의 리프 노드들을 재배열함으로써, 인접한 리프 노드들간의 거리의 종합이 최소가 되도록 하는 문제인 리프오더링 방법을 다루었고, 새로운 리프오더링 알고리즘을 제안하였다. 그리고, 이를 포함한 여러 리프오더링 방법들에 대한 실험 및 생물학적인 분석을 하였다.

  • PDF

Keyword-based Document C lustering Algorithm (주제어 기반 문서 클러스터링 알고리즘)

  • 장성호;강승식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.469-471
    • /
    • 2002
  • 높은 연관성을 갖는 문서들을 서로 집단화시키는 문서 클러스터링은 문서와 문서간의 연관성을 확인할 수 있는 문서의 주제어 추출이 중요한 문제이며 일반적인 정보검색 시스템에서 사용하는 출현빈도에 의한 주제어 추출은 성능 향상에 한계가 있다. 또한, 문서 클러스터링은 문서를 집단화시키기 위해 문서간 연관성을 확인하기 위해 유사도 계산에 따른 시간과 공간을 많이 소비하는 문제를 가지고 있다. 본 논문에서는 주제어 추출 기법을 적용하여 주제어 연관성에 의해 문서들을 집단화시키는 새로운 방법의 문서 클러스터링 알고리즘을 제안한다.

  • PDF

Motion Object Segmentation based on Clustering using Color and Position features (색상과 위치정보를 이용한 클러스터링 기반의 움직이는 객체의 검출)

  • 정윤주;김성동;최기호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.306-308
    • /
    • 2003
  • 본 논문은 컬러영상내 움직이는 객체의 효과적인 검출을 위해 색상과 위치정보를 적용시킨 K-means 클러스터링 알고리즘을 이용하여 움직이는 객체들을 추출한 방법을 제안하고 있다. 최종 클러스터링된 중심픽셀(prototype)이 갖고있는 RGB 값을 사용해 프레임을 비교해 객체와 배경의 분리를 가능하게 했고 마지막으로 후처리를 이용해 남아있는 배경잡음을 제거하였다. 본 연구의 실험은 여러 교통장면을 포함한 다양한 영상에서 이루어졌으며 실험결과 제안된 알고리즘은 기존의 픽셀이나 블록기반의 방법에 비해 보다 정확한 객체 검출이 가능했으며 한 가지 특징 정보를 사용한 클러스터링에 비해 보다 높은 정확도를 보였다.

  • PDF

An Efficient Algorithm for Clustering XML Schema (XML 스키마 클러스터링을 위한 효율적인 알고리즘)

  • 임태우;이경호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.34-36
    • /
    • 2004
  • 최근 웹상에 산재한 정보들의 효율적인 검색과 이용을 위하여 정보의 구조를 정의하는 스키마들의 통합이 중요시되고 있다. 본 논문에서는 XML 스키마들을 클러스터링하기 위한 방법을 제안한다. 제안된 방법은 두 스키마를 통합하는데 드는 비용이 적을수록 스키마간의 유사도가 높다는 가정하에 스키마 사이의 공통된 구조의 크기를 계산한다 이를 위해서 경로사이에 서로 대응하는 요소의 합이 최대가 되는 경로간의 일대일 매칭을 추출한다. 또한 계산된 유사도값에 기반하여 계층적 클러스터링 방법을 적용한다. 제안된 방법의 성능을 평가하기 위해서 다수의 XML 스키마를 대상으로 실험한 결과, 91%의 정확율과 93%의 재현율로서 기존의 알고리즘보다 우수하였다.

  • PDF

Advanced Clustering Algorithm for Documents Visualization (문서 시각화를 위한 개선된 클러스터링 알고리즘)

  • 신광철;한상용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.256-258
    • /
    • 2002
  • 본 논문은 주어진 문서집합에 대한 유사도 검사를 통해 주어진 문서집합의 내용을 사용자가 직관적으로 파악할 수 있도록 하는 클러스터링 시각화 알고리즘에 관한 것이다. 제안하는 방법의 핵심은 주어진 문서 집합의 각 문서 사이의 유사도를 측정하여 각 문서 주변의 밀집도를 파악하고, 밀집도가 높은 문서들을 묶어 하나의 클러스터로 구성한 후, 구성된 각각의 클러스터의 키워드를 제공함으로 사용자가 해당 문서 집합의 내용을 보다 직관적으로 파악할 수 있도록 한 것이다. 우리는 TIME 데이터 집합에 대해 제시하는 알고리즘을 적용해 실험한 후 그 결과를 기존의 spherical k-means에 의해 클러스터링한 결과와 비교하여 제안하는 방법이 사용자에게 더 나은 시각화 정보를 제공함을 알아보았다.

  • PDF

Systematic Performance Evaluation of Efficient Genetic Algorithm based on Clustering (클러스터링 기반의 효율적 유전자알고리즘의 체계적인 성능 평가)

  • 원홍희;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.298-300
    • /
    • 2002
  • 기존의 유전자 알고리즘은 우리가 원하는 최적해를 찾기 위해서 개체 집단의 크기를 가능한 크게 유지하여야 한다. 하지만 일반적인 문제들에 있어 개체의 적합도를 평가하는 젓은 어렵기 때문에 큰 집단의 로든 개체에 대하여 적합도를 평가하는 것은 커다란 시간과 비용을 소모한다. 이에 본 논문에서는 집단의 크기를 크게 유지하되 적합도 평가 과정을 줄이는 방안으로 클러스터링에 기반한 효율적인 유전자 알고리즘을 제시하고 체계적인 평가를 한다. 9개의 벤치마크 적합도 함수에 대하여 여러 클러스터링 방법을 적용하여 실험한 결과 제안한 방법의 유용성을 확인할 수 있었다.

  • PDF