• 제목/요약/키워드: Hierarchical Clustering Analysis

검색결과 247건 처리시간 0.026초

계층적 군집분석(최단, 최장, 평균, 중앙연결)방법에 의한 아시아 컨테이너 항만의 클러스터링 측정 및 실루엣방법과 2단계(Type II) 교차효율성 메트릭스 군집모형을 이용한 실증적 검증에 관한 연구 (A Study on the Asia Container Ports Clustering Using Hierarchical Clustering(Single, Complete, Average, Centroid Linkages) Methods with Empirical Verification of Clustering Using the Silhouette Method and the Second Stage(Type II) Cross-Efficiency Matrix Clustering Model)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제37권1호
    • /
    • pp.31-70
    • /
    • 2021
  • 본 논문에서는 계층적 군집모형(최단, 최장, 평균, 중앙연결), 실루엣방법, 2단계(Type II) 교차효율성 메트릭스 군집모형으로, 아시아 38개 컨테이너항만 들의 2009년부터 2018년까지의 자료와 선석길이, 수심, 총면적, 크레인 수를 투입물, 컨테이너화물처리량을 산출물로 하여 국내대표 컨테이너항만 들(부산, 인천, 광양항)이 클러스터링 해야만 하는 항만들을 적출해 내는 측정방법을 보여 주고 비교, 분석, 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 10년간의 자료를 이용한 분석에서 클러스터링 후의 효율성의 증가가 큰 순서대로 살펴보면 실루엣(0.4052 증가), 계층적 군집분석(0.3097 증가), 2단계(Type II) 교차효율성(0.1057 증가)의 순서로 나타났다. 둘째, 실루엣모형과 2단계(Type II)교차효율성 모형에 의한 국내항만들의 클러스터링을 살펴보면 부산항은 8번(두바이), 11번(홍콩), 17번(탄중프리옥)항과 클러스터링 되고, 인천항과 광양항은 대부분의 항만들과 클러스터링 해야만 하는 것으로 나타났다. 셋째, 윌콕슨 부호순위 검정결과를 보면 평균적으로 보았을 때, P값(유의확율)이 평균 0.852 수준에서 모형들의 평균효율성 수치에 의한 순위가 서로 일치함을 보여 주었다. 넷째, 정치경제학적인 측면에서 아세안 항만들과 국내 항만들과 가장 클러스터링 횟수가 많은 항만들을 살펴보면, 부산항은 싱가포르 항만, 인천항은 탄중프리옥, 탄중퍼락, 마닐라,다바오,방콕항만, 광양항은 탄중프리옥, 탄중퍼락, 포트 클랑, 마닐라, 싱가포르, 림찬방, 방콕항만들과 클러스터링 하는 것이 좋을 것으로 나타났다. 또한 중국과 일본의 항만들과의 클러스터링을 고려해 보면, 부산항은 홍콩, 상해, 광저우, 도쿄 요코하마, 고베, 나고야, 오사카항, 인천항은 닝보, 칭타오, 도쿄, 요코하마, 고베, 나고야, 오사카항, 광양항은 홍콩, 상해, 도쿄 요코하마, 고베, 나고야, 오사카 항들과 클러스터링 하는 것이 좋은 것으로 나타났다. 다섯째, 본 연구에서 사용한 모형들과 기존연구들과의 타 모형들과의 검증에서는 실루엣 모형이 가장 크게 효율성을 증진시키는 것으로 검증되었다. 본 논문이 제안하고 있는 정책적인 측면의 의미는 항만정책입안자, 항만운영관리자들이 본 연구에서 사용한 모형들을 항만의 클러스터링에 도입하여 벤치마킹항만들을 선정해야만 하고, 그들 항만들의 항만개발, 운영방안 등에 대한 내용을 비교·분석하고 벤치마킹이 필요한 부분은 신속하게 도입하여 실시하는 것이 필요하다는 점이다.

집락분석과 판별분석의 활용성연구 (Applicability of Cluster Analysis and Discriminant Analysis)

  • 채성산;황정연
    • 품질경영학회지
    • /
    • 제22권2호
    • /
    • pp.143-153
    • /
    • 1994
  • Cluster analysis is a primitive technique in which no assumptions are made concerning the data structure. And the number of groups is known a priori discriminant analysis provides an information how well N individuals are classified into their own groups. In this study, clustering, which is any partition of a collection of data points, generated by the application of eight hierarchical clustering methods was re-classified by discriminant analysis. Then correct classification ratios were obtained for the application of discriminant analysis through each clustering method and the direct application of discriminant analysis. By comparing the correct classification ratios, the applicability of cluster analysis and discriminant analysis considered.

  • PDF

A Secure, Hierarchical and Clustered Multipath Routing Protocol for Homogenous Wireless Sensor Networks: Based on the Numerical Taxonomy Technique

  • Hossein Jadidoleslamy
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.121-136
    • /
    • 2023
  • Wireless Sensor Networks (WSNs) have many potential applications and unique challenges. Some problems of WSNs are: severe resources' constraints, low reliability and fault tolerant, low throughput, low scalability, low Quality of Service (QoS) and insecure operational environments. One significant solution against mentioned problems is hierarchical and clustering-based multipath routing. But, existent algorithms have many weaknesses such as: high overhead, security vulnerabilities, address-centric, low-scalability, permanent usage of optimal paths and severe resources' consumption. As a result, this paper is proposed an energy-aware, congestion-aware, location-based, data-centric, scalable, hierarchical and clustering-based multipath routing algorithm based on Numerical Taxonomy technique for homogenous WSNs. Finally, performance of the proposed algorithm has been compared with performance of LEACH routing algorithm; results of simulations and statistical-mathematical analysis are showing the proposed algorithm has been improved in terms of parameters like balanced resources' consumption such as energy and bandwidth, throughput, reliability and fault tolerant, accuracy, QoS such as average rate of packet delivery and WSNs' lifetime.

한국 주식시장에서의 군집화 기반 페어트레이딩 포트폴리오 투자 연구 (Clustering-driven Pair Trading Portfolio Investment in Korean Stock Market)

  • 조풍진;이민혁;송재욱
    • 산업경영시스템학회지
    • /
    • 제45권3호
    • /
    • pp.123-130
    • /
    • 2022
  • Pair trading is a statistical arbitrage investment strategy. Traditionally, cointegration has been utilized in the pair exploring step to discover a pair with a similar price movement. Recently, the clustering analysis has attracted many researchers' attention, replacing the cointegration method. This study tests a clustering-driven pair trading investment strategy in the Korean stock market. If a pair detected through clustering has a large spread during the spread exploring period, the pair is included in the portfolio for backtesting. The profitability of the clustering-driven pair trading strategies is investigated based on various profitability measures such as the distribution of returns, cumulative returns, profitability by period, and sensitivity analysis on different parameters. The backtesting results show that the pair trading investment strategy is valid in the Korean stock market. More interestingly, the clustering-driven portfolio investments show higher performance compared to benchmarks. Note that the hierarchical clustering shows the best portfolio performance.

계층적 군집분석 기반의 Continuous Risk Profile을 이용한 고속도로 사고취약구간 선정 (Identifying Hotspots on Freeways Using the Continuous Risk Profile With Hierarchical Clustering Analysis)

  • 이서영;김철순;김동규;이청원
    • 대한교통학회지
    • /
    • 제31권4호
    • /
    • pp.85-94
    • /
    • 2013
  • Continuous Risk Profile(CRP)은 고속도로의 사고취약구간을 선정하는 방법론 중에서 정확성과 효율성이 뛰어난 것으로 알려져 있다. 그러나 전통적인 CRP는 데이터베이스 구축을 위한 대규모 투자를 필요로 하는 안전성능함수를 이용한다. 본 연구는 안전성능함수 대신 동질 그룹들의 평균사고건수를 규모조정계수로 이용하는 CRP를 제안하는 것을 목적으로 한다. 고속도로 구간들을 동질 그룹으로 분류하기 위하여 각 구간의 AADT와 차로 수 자료를 기반으로 하는 계층적 군집분석이 수행된다. 제안된 모형은 캘리포니아의 I-880 자료를 이용하여 다른 여러 가지 사고취약구간 선정방법들과 비교된다. 분석 결과에 따르면, 제안된 모형은 false negative를 발생시키지 않으며 false positive rate를 감소시킨다. 본 연구에서 개발된 방법론은 추가적인 복잡한 데이터베이스 없이 고속도로 사고취약구간을 선정하는 데에 활용될 수 있으며, 또한 고속도로 안전관리시스템을 개선하는 데에 기여할 수 있다.

비대칭적 유사도 기반의 심볼릭 객체의 계층적 클러스터링 (Hierarchical Clustering of Symbolic Objects based on Asymmetric Proximity)

  • 오승준;박찬웅
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.729-734
    • /
    • 2012
  • 패턴 인식, 데이터 분석, 침입 탐지, 이미지 처리, 바이오 인포매틱스 등과 같은 수많은 분야에서 클러스터링 분석이 사용되고 있다. 기존의 많은 연구들은 수치 데이터에만 기반을 두고 있다. 그러나 구간 데이터, 히스토그램, 심지어는 함수들을 값으로 갖는 변수들을 다루는 심볼릭 데이터 분석이 부상하고 있다. 본 논문에서는 이런 심볼릭 데이터들을 클러스터링하기 위하여 비대칭적 유사도를 제안한다. 또한 평균 유사도 값(ASV)에 기반한 클러스터링 방법도 개발한다. 제안하는 클러스터링의 결과는 기존 방법들과 다르며, 매우 고무적인 결과를 보여준다.

Quality Assessment of Curcuma longa L. by Gas Chromatography-Mass Spectrometry Fingerprint, Principle Components Analysis and Hierarchical Clustering Analysis

  • Li, Ming;Zhou, Xin;Zhao, Yang;Wang, Dao-Ping;Hu, Xiao-Na
    • Bulletin of the Korean Chemical Society
    • /
    • 제30권10호
    • /
    • pp.2287-2293
    • /
    • 2009
  • Gas Chromatography-Mass Spectrometry (GC-MS) fingerprint analysis, Principle Components Analysis (PCA), and Hierarchical Cluster Analysis (HCA) were introduced for quality assessment of Curcuma longa L. (C. longa). The GC-MS fingerprint method was developed and validated by analyzing 33 batches of samples of C. longa from different geographic locations. 18 chromatographic peaks were selected as characteristic peaks and their relative peak areas (RPA) were calculated for quantitative expression. Two principal components (PCs) were extracted by PCA. C. longa collected from Guizhou and Fujian were separated from other samples by PC1, capturing 71.83% of variance. While, PC2 contributed for their further separation, capturing 11.13% of variance. HCA confirmed the result of PCA analysis. Therefore, GC-MS fingerprint study with chemometric techniques provides a very flexible and reliable method for quality assessment of C. longa.

지적 구조 분석을 위한 새로운 클러스터링 기법에 관한 연구 (A novel clustering method for examining and analyzing the intellectual structure of a scholarly field)

  • 이재윤
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.215-231
    • /
    • 2006
  • 패스파인더 네트워크를 사용하여 지적 구조의 분석과 규명을 시도한 여러 연구가 발표되었다. 패스파인더 네트워크는 다차원척도법에 비해서 여러 장점을 가지고 있지만 구축 알고리즘의 복잡도가 매우 높아서 실행 시간이 오래 걸리며, 전통적인 지적 구조 분석에 유용하게 사용되어온 군집분석을 함께 적용하기가 어려운 것이 단점이다. 이 연구에서는 이와 같은 패스파인더 네트워크의 약점을 보완할 수 있는 새로운 기법으로 병렬최근접이웃클러스터링(PNNC) 기법을 제안하였다. PNNC 기법의 클러스터링 성능을 전통적인 계층적 병합식 클러스터링 기법들과 비교해본 결과 효과성과 효율성 양면에서 기존 기법보다 우세한 것으로 확인되었다.

컴포넌트 분류를 위한 복합 클러스터 분석 방법 (A Composite Cluster Analysis Approach for Component Classification)

  • 이성구
    • 정보처리학회논문지D
    • /
    • 제14D권1호
    • /
    • pp.89-96
    • /
    • 2007
  • 컴포넌트 재사용을 위해 다양한 분류 방법들이 개발되어 왔다. 이러한 분류 방법들은 사용자가 필요로 하는 컴포넌트들을 쉽고 빠르게 접근하는 것을 돕는다. 전통적인 분류 방법들은 분류 구조 생성을 위한 도메인 분석 노력, 컴포넌트 사이의 관계 표현, 도메인 진화에 따른 분류 구조 유지 보수의 어려움, 그리고 한정된 도메인 적용과 같은 문제들을 포함한다. 본 논문은 이러한 문제들을 언급하기 위해 복합 클러스터 분석 기반의 컴포넌트 분류 방법에 대해 묘사한다. 안정적인 분류 구조 자동 생성을 위해 계층 클러스터 분석 방법과 새로운 컴포넌트의 자동 분류에 대해 비계층 클러스터 분석 개념은 결합된다. 제안된 방법에 의해 생성된 클러스터 정보는 관련 컴포넌트들에 대한 도메인 분석 과정을 지원할 수 있다.

Feature Extraction of Concepts by Independent Component Analysis

  • Chagnaa, Altangerel;Ock, Cheol-Young;Lee, Chang-Beom;Jaimai, Purev
    • Journal of Information Processing Systems
    • /
    • 제3권1호
    • /
    • pp.33-37
    • /
    • 2007
  • Semantic clustering is important to various fields in the modem information society. In this work we applied the Independent Component Analysis method to the extraction of the features of latent concepts. We used verb and object noun information and formulated a concept as a linear combination of verbs. The proposed method is shown to be suitable for our framework and it performs better than a hierarchical clustering in latent semantic space for finding out invisible information from the data.