• 제목/요약/키워드: Hierarchical Clustering Analysis

검색결과 247건 처리시간 0.022초

다단계 계층군집 영상분류법을 이용한 토지 피복 분석 (Analysis of Land-cover Types Using Multistage Hierarchical flustering Image Classification)

  • 이상훈
    • 대한원격탐사학회지
    • /
    • 제19권2호
    • /
    • pp.135-147
    • /
    • 2003
  • 본 연구는 한반도 위성 영상자료에 다단계 계층군집 영상분류법을 적용하여 관측지역의 피복특성을 분석한다. 다단계 계층군집 영상분류는 크게 두 단계로 이루어진다. 첫 번째 단계는 계층군집에 의해 공간적으로 근접하고 있는 이웃집단간의 결합을 하는 공간확장 영상분할 단계이고 두번째 단계는 결합지역의 공간적 제약 없이 영상분할 단계에서 분할된 집단을 계층군집에 의해 적은 한정적인 수의 클래스로 분류하는 과정이다. 계층군집 영상분류는 수치영상의 계층구조에 근거하여 매 단계 두 개의 집단을 한 개의 집단으로 합병하므로 클래스 수에 따른 분류집단 간의 관계를 나타내는 계층나무를 구성할 수 있다. 실험결과는 계층군집 영상분류에 의해 구성된 계층나무는 토지사용간의 계층구조를 자세히 밝혀주고 토지 피복 특성의 정확한 분석에는 좀 더 자세한 분광정보가 필요함을 보여주고 있다.

자기 조직화 지도에 기반한 유전자 발현 데이터의 계층적 군집화 (Hierarchical Clustering of Gene Expression Data Based on Self Organizing Map)

  • Park, Chang-Beom;Lee, Dong-Hwan;Lee, Seong-Whan
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.170-177
    • /
    • 2003
  • Gene expression data are the quantitative measurements of expression levels and ratios of numberous genes in different situations based on microarray image analysis results. The process to draw meaningful information related to genomic diseases and various biological activities from gene expression data is known as gene expression data analysis. In this paper, we present a hierarchical clustering method of gene expression data based on self organizing map which can analyze the clustering result of gene expression data more efficiently. Using our proposed method, we could eliminate the uncertainty of cluster boundary which is the inherited disadvantage of self organizing map and use the visualization function of hierarchical clustering. And, we could process massive data using fast processing speed of self organizing map and interpret the clustering result of self organizing map more efficiently and user-friendly. To verify the efficiency of our proposed algorithm, we performed tests with following 3 data sets, animal feature data set, yeast gene expression data and leukemia gene expression data set. The result demonstrated the feasibility and utility of the proposed clustering algorithm.

  • PDF

준 실시간 뉴스 이슈 분석을 위한 계층적·점증적 군집화 (Hierarchical and Incremental Clustering for Semi Real-time Issue Analysis on News Articles)

  • 김호용;이승우;장홍준;서동민
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.556-578
    • /
    • 2020
  • 실시간으로 발생하는 뉴스 기사로부터 이슈를 분석하기 위한 다양한 연구가 진행되어 왔다. 하지만 범주에 따라 계층적으로 이슈를 분석하는 연구는 많이 진행되지 않았고, 계층적 이슈 분석을 위한 기존의 연구에서 제안하는 방식 또한 뉴스 기사 증가에 따라 군집화 속도가 느려지는 문제점이 있다. 따라서 본 논문에서는 준 실시간으로 뉴스 기사의 이슈를 분석하는 계층적·점증적 군집화 방식을 제안한다. 제안하는 군집화 방식은 샴 신경망을 이용한 가중 코사인 유사도 측정 모델 기반의 k-평균 알고리즘을 이용한 단어 군집 기반 문서 표현 방식을 통해 뉴스 기사를 문서 벡터로 표현한다. 그리고 문서 벡터로부터 초기 이슈 군집 트리를 생성하고, 새로 발생한 뉴스 기사를 해당 이슈 군집 트리에 추가하는 점증적 군집화 방식을 제안함으로써 뉴스 기사의 계층적 이슈를 준 실시간으로 분석한다. 마지막으로, 본 논문에서 제안하는 방식과 기존 방식들과의 성능평가를 통해 제안하는 군집화 방식이 정확도 측면에서 기존 방식 대비 NMI 지표 기준 0.26 정도 성능이 향상되었고, 속도 측면에서 약 10배 이상의 성능이 향상됨을 입증하였다.

SAHN 모델의 부분적 패턴 추정 방법에 대한 연구 (A Study on Partial Pattern Estimation for Sequential Agglomerative Hierarchical Nested Model)

  • 장경원;안태천
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.143-145
    • /
    • 2005
  • In this paper, an empirical study result on pattern estimation method is devoted to reveal underlying data patterns with a relatively reduced computational cost. Presented method performs crisp type clustering with given n number of data samples by means of the sequential agglomerative hierarchical nested model (SAHN). Conventional SAHN based clustering requires large computation time in the initial step of algorithm. To deal with this concern, we modified overall process with a partial approach. In the beginning of this method, we divide given data set to several sub groups with uniform sampling and then each divided sub data group is applied to SAHN based method. The advantage of this method reduces computation time of original process and gives similar results. Proposed is applied to several test data set and simulation result with conceptual analysis is presented.

  • PDF

Digital Forensic for Location Information using Hierarchical Clustering and k-means Algorithm

  • Lee, Chanjin;Chung, Mokdong
    • 한국멀티미디어학회논문지
    • /
    • 제19권1호
    • /
    • pp.30-40
    • /
    • 2016
  • Recently, the competition among global IT companies for the market occupancy of the IoT(Internet of Things) is fierce. Internet of Things are all the things and people around the world connected to the Internet, and it is becoming more and more intelligent. In addition, for the purpose of providing users with a customized services to variety of context-awareness, IoT platform and related research have been active area. In this paper, we analyze third party instant messengers of Windows 8 Style UI and propose a digital forensic methodology. And, we are well aware of the Android-based map and navigation applications. What we want to show is GPS information analysis by using the R. In addition, we propose a structured data analysis applying the hierarchical clustering model using GPS data in the digital forensics modules. The proposed model is expected to help support the IOT services and efficient criminal investigation process.

자기조직화 신경망과 계층적 군집화 기법(SONN-HC)을 이용한 인터넷 뱅킹의 고객세분화 모형구축 (Customer Segmentation Model for Internet Banking using Self-organizing Neural Networks and Hierarchical Gustering Method)

  • 신택수;홍태호
    • Asia pacific journal of information systems
    • /
    • 제16권3호
    • /
    • pp.49-65
    • /
    • 2006
  • This study proposes a model for customer segmentation using the psychological characteristics of Internet banking customers. The model was developed through two phased clustering method, called SONN-HC by integrating self-organizing neural networks (SONN) and hierarchical clustering (HC) method. We applied the SONN-HC method to internet banking customer segmentation and performed an empirical analysis with 845 cases. The results of our empirical analysis show the psychological characteristics of Internet banking customers have significant differences among four clusters of the customers created by SONN-HC. From these results, we found that the psychological characteristics of Internet banking customers had an important role of planning a strategy for customer segmentation in a financial institution.

Clustering Algorithms for Reducing Energy Consumption - A Review

  • Kinza Mubasher;Rahat Mansha
    • International Journal of Computer Science & Network Security
    • /
    • 제23권7호
    • /
    • pp.109-118
    • /
    • 2023
  • Energy awareness is an essential design flaw in wireless sensor network. Clustering is the most highly regarded energy-efficient technique that offers various benefits such as energy efficiency and network lifetime. Clusters create hierarchical WSNs that introduce the efficient use of limited sensor node resources and thus enhance the life of the network. The goal of this paper is to provide an analysis of the various energy efficient clustering algorithms. Analysis is based on the energy efficiency and network lifetime. This review paper provides an analysis of different energy-efficient clustering algorithms for WSNs.

제조 셀 구현을 위한 군집분석 기반 방법론 (Cluster Analysis-based Approach for Manufacturing Cell Formation)

  • 심영학;황정윤
    • 산업경영시스템학회지
    • /
    • 제36권1호
    • /
    • pp.24-35
    • /
    • 2013
  • A cell formation approach based on cluster analysis is developed for the configuration of manufacturing cells. Cell formation, which is to group machines and parts into machine cells and the associated part families, is implemented to add the flexibility and efficiency to manufacturing systems. In order to develop an efficient clustering procedure, this paper proposes a cluster analysis-based approach developed by incorporating and modifying two cluster analysis methods, a hierarchical clustering and a non-hierarchical clustering method. The objective of the proposed approach is to minimize intercellular movements and maximize the machine utilization within clusters. The proposed approach is tested on the cell formation problems and is compared with other well-known methodologies available in the literature. The result shows that the proposed approach is efficient enough to yield a good quality solution no matter what the difficulty of data sets is, ill or well-structured.

공간지역확장과 계층집단연결 기법을 이용한 무감독 영상분류 (Unsupervised Image Classification Using Spatial Region Growing Segmentation and Hierarchical Clustering)

  • 이상훈
    • 대한원격탐사학회지
    • /
    • 제17권1호
    • /
    • pp.57-69
    • /
    • 2001
  • 본 연구는 무감독 영상분류를 위하여 공간지역 확장을 통하여 영상을 분할한 후 분할된 집단을 한정된 수의 클래스로 분류하는 다중단계 기법을 제안하고 있다. 제안된 알고리듬은 무감독 분석을 위하여 작은 집단들을 단계적으로 큰 집단들로 합병해 가는 계층집단연결 기법에 기반을 두고 있다. 다중단계 기법의 영상분할 단계는 공간적으로 근접하고 있는 이웃지역간의 결합을 통하여 최종적으로 전체영상 공간내의 모든 집단에 대해서 서로 이웃하고 있는 집단들의 물리적 특성이 서로 다르도록 영상을 분할하는 과정이고, 영상분류 단계는 결합 지역의 공간적 제약 없이 영상 분할 단계에서 분할된 지역을 상대적으로 적은 수의 클래스로 분류하는 과정이다. 제안 된 알고리듬에서 사용하고 있는 계층집단연결 기법의 계산/기억 상의 복잡성을 완화시키기 위해 상호최근사 이웃쌍과 다중창 작업을 사용하고 있다. 모의 자료를 사용하여 제단 된 알고리듬 대한 평가와 효율성을 검증하였고 경기도 용인.능평지역의 LANDSAT ETM+ 자료에 적용한 결과를 예시하고 있다.

역인덱스 기반 상향식 군집화 기법을 이용한 대규모 학술 핵심어 분석 (Analysis of Massive Scholarly Keywords using Inverted-Index based Bottom-up Clustering)

  • 오흥선;정유철
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.758-764
    • /
    • 2018
  • 특허(patent), 학술 논문(scholarly paper)과 연구 보고서(research report)와 같은 디지털 문서(digital document)에는 주제(topic)를 요약하는 저자 키워드(author keyword)가 있다. 서로 다른 문서가 동일한 키워드를 공유하고 있다면 두 문서가 동일한 주제의 내용을 기술하고 있을 가능성이 매우 높다. 문서 군집화(document clustering)는 비슷한 주제를 가지는 문서들을 비지도 학습 방법(unsupervised learning)을 이용하여 같은 군집으로 그룹(group)화 하는 것이다. 문서 군집화는 다양한 분석에 이용되지만 대용량의 문서 데이터에 적용하기 위해서는 많은 계산량이 필요함으로 쉽지 않다. 이러한 경우, 문서의 내용을 이용하는 것보다 문서의 키워드를 이용하여 군집화하면 더욱 효율적으로 대용량의 데이터를 연결할 수 있다. 기존의 상향식 군집화 방법(bottom-up hierarchical clustering)은 대용량의 키워드 군집화(keyword clustering)를 수행하는데 있어서 많은 시간이 필요하다는 문제점이 있다. 본 논문에서는 정보검색(information retrieval)에서 널리 사용되는 역인덱스(inverted-index) 구조를 상향식 군집화에 적용한 효율적인 군집화 방법을 제안하고, 제안 방법을 대용량의 키워드 데이터에 적용하였으며, 그 결과를 분석하였다.