• 제목/요약/키워드: relative hierarchical clustering

검색결과 15건 처리시간 0.012초

상대적 계층적 군집 방법을 이용한 마이크로어레이 자료의 군집분석 (Microarray data analysis using relative hierarchical clustering)

  • 우숙영;이재원;전명식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.999-1009
    • /
    • 2014
  • 계층적 군집 분석은 분석 결과를 덴드로그램으로 쉽게 표시할 수 있어서 방대한 양의 마이크로어레이 자료를 탐색하기에 유용하며, 군집된 결과를 이용하여 생물학적 현상을 이해하는데 도움을 준다. 하지만, 계층적 군집방법은 두 군집간의 절대값 거리만을 고려하여 병합하기 때문에 군집 간의 상대적 비유사성은 설명하지 못하는 단점이 있다. 본 연구에서는 상대적 계층적 군집 방법을 소개하고, 마이크로어레이 자료와 같이 다양한 군집의 모양을 가진 모의실험 자료들과 실제 마이크로어레이 자료를 사용하여 상대적 계층적 군집방법과 기존의 계층적 군집 방법을 비교하였다. 두 계층적 군집 방법의 질적 평가는 오분류율, 동질성, 이질성 지표를 이용하여 수행하였다.

K-means 알고리즘을 이용한 계층적 클러스터링에서의 클러스터 계층 깊이 선택 (Selection of Cluster Hierarchy Depth in Hierarchical Clustering using K-Means Algorithm)

  • 이원휘;이신원;정성종;안동언
    • 대한전자공학회논문지SD
    • /
    • 제45권2호
    • /
    • pp.150-156
    • /
    • 2008
  • 정보통신의 기술이 발달하면서 정보의 양이 많아지고 사용자의 질의에 대한 검색 결과 리스트도 많이 추출되므로 빠르고 고품질의 문서 클러스터링 알고리즘이 중요한 역할을 하고 있다. 많은 논문들이 계층적 클러스터링 방법을 이용하여 좋은 성능을 보이지만 시간이 많이 소요된다. 반면 K-means 알고리즘은 시간 복잡도를 줄일 수 있는 방법이다. 본 논문에서는 계층적 클러스터링 시스템인 콘도르(Condor) 시스템에서 K-Means 알고리즘을 이용하여 효율적으로 정보 검색을 하고 검색결과를 계층적으로 볼 수 있도록 구현하였다. 이 시스템은 K-Means Algorithm을 이용하였으며 클러스터 계층 깊이와 초기값을 조절하여 더 나은 성능을 보임을 알 수 있다.

개미 군락 시스템을 이용한 계층적 클러스터 분석 (Ant Colony Hierarchical Cluster Analysis)

  • 강문수;최영식
    • 인터넷정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.95-105
    • /
    • 2014
  • 본 논문에서는 방향그래프에서 개미가 한 노드에서 다른 노드들로 이동하는 새로운 개미 기반계층적 클러스터링 알고리즘을 제안한다. 노드페로몬은 로컬영역에서 상대 밀도값으로 간주될 수 있는 값으로 노드로 들어오는 에지들의 페로몬 양을 합한 것이다. 일정한 횟수만큼 개미들을 이동시킨 후 방향 그래프로부터 소량의 노드페로몬 값을 가진 노드들을 제거하고, 강하게 연결되어 있는 요소들을 하나의 클러스터로 구성한다. 반복적으로 낮은 값부터 높은 값까지 제거작업을 하여 계층적 클러스터들을 구축한다. 다양한 실험을 통해 제안하는 알고리즘과 기존 클러스터링 알고리즘을 비교하고 제안하는 알고리즘의 우수성을 실험을 통해 입증한다.

Quality Assessment of Curcuma longa L. by Gas Chromatography-Mass Spectrometry Fingerprint, Principle Components Analysis and Hierarchical Clustering Analysis

  • Li, Ming;Zhou, Xin;Zhao, Yang;Wang, Dao-Ping;Hu, Xiao-Na
    • Bulletin of the Korean Chemical Society
    • /
    • 제30권10호
    • /
    • pp.2287-2293
    • /
    • 2009
  • Gas Chromatography-Mass Spectrometry (GC-MS) fingerprint analysis, Principle Components Analysis (PCA), and Hierarchical Cluster Analysis (HCA) were introduced for quality assessment of Curcuma longa L. (C. longa). The GC-MS fingerprint method was developed and validated by analyzing 33 batches of samples of C. longa from different geographic locations. 18 chromatographic peaks were selected as characteristic peaks and their relative peak areas (RPA) were calculated for quantitative expression. Two principal components (PCs) were extracted by PCA. C. longa collected from Guizhou and Fujian were separated from other samples by PC1, capturing 71.83% of variance. While, PC2 contributed for their further separation, capturing 11.13% of variance. HCA confirmed the result of PCA analysis. Therefore, GC-MS fingerprint study with chemometric techniques provides a very flexible and reliable method for quality assessment of C. longa.

다변량 스트림 데이터 축소 기법 평가 (Evaluation of Multivariate Stream Data Reduction Techniques)

  • 정훈조;서성보;최경주;박정석;류근호
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.889-900
    • /
    • 2006
  • 센서 네트워크는 애플리케이션 분야에 따라 데이터 특성과 사용자의 요구사항이 다양함에도 불구하고, 현존하는 스트림 데이터 축소 연구는 데이터의 본질적인 특징보다 특정 축소 기법의 성능 향상 측면에 중점을 두고 있다. 이 논문은 계층/분산형 센서 네트워크 구조와 데이터 모델을 소개하고, 선택적으로 축소 기법을 적용하기 위해 데이터 특성과 사용자의 요구에 적합한 다변량 데이터 축소 기법을 비교 평가한다. 다변량 데이터 축소 기법의 성능을 비교 분석하기 위해, 우리는 웨이블릿, HCL(Hierarchical Clustering), SVD(Singular Value Decomposition), 샘플링과 같은 표준화 된 다변량 축소 기법을 이용한다. 실험 데이터는 다차원 시계열 데이터와 로봇 센서 데이터를 사용한다. 실험 결과 SVD와 샘플링 기법이 상대 에러 비율과 수행 성능 측면에서 웨이블릿과 HCL기법에 비해 우수하였다. 특히 각 데이터 축소 기법의 상대 에러 비율은 입력 데이터 특성에 따라 다르기 때문에 선택적으로 데이터 축소 기법을 적용하는 것이 좋은 성능을 보였다. 이 논문은 다차원 센서 데이터가 수집되는 센서 네트워크를 디자인하고 구축하는 응용 분야에 유용하게 활용될 것이다.

에드 혹 네트워크에서 노드의 국부 위치 정보를 이용한 최적 계층적 클러스터링 경로 라우팅 알고리즘 (Localized Positioning method for Optimal path Hierarchical clustering algorithm in Ad hoc network)

  • 오영준;이강환
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2550-2556
    • /
    • 2012
  • 본 논문에서는 노드의 위치정보를 측정함에 있어 거리정보에 기반을 두지 않은 방식(range-free)에서의 라우팅 에너지 효율성을 개선한 ALPS(Ad hoc network Localized Positioning System) 알고리즘을 제안한다. 본 논문에서 제안되는 ALPS 알고리즘은 계층적 클러스터 단위에 소속된 임의의 노드에 대한 위치정보를 RSSI(Received signal strength indication)에 의해 상대적 위치정보를 제공하는 방법이다. 제안된 알고리즘에 따른 위치정보를 사용 할 경우 기존의 DV-hop방식에 따른 노드의 평균 위치정보를 사용한 경우보다 계층적 좌표 방식에 의한 제안된 방식이 보다 최적화된 에너지 소모를 유지할 수 있는 경로 알고리즘을 제공하게 된다. 제공된 알고리즘의 성능 분석을 위해 본 논문에서는 상기 두 가지 방식의 위치정보에 따른 라우팅에서 소모되는 에너지 관계를 비교 하였고, 이로부터 보다 최적화된 에너지 경로 관리가 되는 결과를 보여주었다.

Classification of Daily Precipitation Patterns in South Korea using Mutivariate Statistical Methods

  • Mika, Janos;Kim, Baek-Jo;Park, Jong-Kil
    • 한국환경과학회지
    • /
    • 제15권12호
    • /
    • pp.1125-1139
    • /
    • 2006
  • The cluster analysis of diurnal precipitation patterns is performed by using daily precipitation of 59 stations in South Korea from 1973 to 1996 in four seasons of each year. Four seasons are shifted forward by 15 days compared to the general ones. Number of clusters are 15 in winter, 16 in spring and autumn, and 26 in summer, respectively. One of the classes is the totally dry day in each season, indicating that precipitation is never observed at any station. This is treated separately in this study. Distribution of the days among the clusters is rather uneven with rather low area-mean precipitation occurring most frequently. These 4 (seasons)$\times$2 (wet and dry days) classes represent more than the half (59 %) of all days of the year. On the other hand, even the smallest seasonal clusters show at least $5\sim9$ members in the 24 years (1973-1996) period of classification. The cluster analysis is directly performed for the major $5\sim8$ non-correlated coefficients of the diurnal precipitation patterns obtained by factor analysis In order to consider the spatial correlation. More specifically, hierarchical clustering based on Euclidean distance and Ward's method of agglomeration is applied. The relative variance explained by the clustering is as high as average (63%) with better capability in spring (66%) and winter (69 %), but lower than average in autumn (60%) and summer (59%). Through applying weighted relative variances, i.e. dividing the squared deviations by the cluster averages, we obtain even better values, i.e 78 % in average, compared to the same index without clustering. This means that the highest variance remains in the clusters with more precipitation. Besides all statistics necessary for the validation of the final classification, 4 cluster centers are mapped for each season to illustrate the range of typical extremities, paired according to their area mean precipitation or negative pattern correlation. Possible alternatives of the performed classification and reasons for their rejection are also discussed with inclusion of a wide spectrum of recommended applications.

HPLC 분석법을 이용한 이중탕(理中湯) 제제의 품질평가 (Quality Assessment of Ijung-tang Preparations Using a HPLC Analysis)

  • 하우람;박진형;윤동인;이장천;김정훈
    • 대한본초학회지
    • /
    • 제31권3호
    • /
    • pp.29-35
    • /
    • 2016
  • Objectives : Ijung-tang (IJT) is a traditional herbal formula and has been used to treat digestive diseases such as abdominal pain, vomiting, and diarrhea. IJT consists of four herbal medicines, Ginseng radix, Atractylodis rhizoma alba, Zingiberis rhizoma, and Glycyrrhizae radix et rhizoma, containing various bioactive compounds. Quality assesment of IJT preparations was performed by analytical method for determining marker compounds.Methods : Determination of seven marker compounds in IJT preparations was quantitatively conducted by high-performance liquid chromatography equipped with a diode-array detector. The marker compounds were separated on a reversed-phase C18 column and the analytical method was successfully validated. Chemometric analysis was performed to compare IJT water extracts and commercial IJT granules.Results : Limit of detection and limit of quantification values were in the ranges of 0.093-2.649 μg/mL and 0.283-8.027 μg/mL, respectively. Precisions were 0.30-3.87% within a day and 0.23-2.35% over three consecutive days. Recoveries of the marker compounds ranged from 87.35-107.05%, with relative standard deviation (RSD) values < 6.15%. Repeatabilities were < 1.20% and < 1.71% of RSD value for retention time and absolute peak area, respectively. The results from quantitative analysis showed that the quantities of seven marker compounds of IJT samples varied, as were found in principal component analysis and hierarchical clustering analysis.Conclusions : The analytical method developed in the present study was precise and reliable to simultaneously determine marker compounds of IJT. Therefore, it can be used for the quality assessment of IJT preparations.

군집분석법과 분산주성분분석법을 이용한 대기분진시료의 분류 (Classification of Ambient Particulate Samples Using Cluster Analysis and Disjoint Principal Component Analysis)

  • 유상준;김동술
    • 한국대기환경학회지
    • /
    • 제13권1호
    • /
    • pp.51-63
    • /
    • 1997
  • Total suspended particulate matters in the ambient air were analyzed for eight chemical elements (Ca, Co, Cu, Fe, Mn, Pb, Si, and Zn) using an x-ray fluorescence spectrometry (XRF) at the Kyung Hee University - Suwon Campus during 1989 to 1994. To use these data as basis for source identification study, membership of each sample was selected to represent one of the well defined sample groups. The data sets consisting of 83 objects and 8 variables were initially separated into two groups, fine (d$_{p}$<3.3 ${\mu}{\textrm}{m}$) and coarse particle groups (d$_{p}$>3.3 ${\mu}{\textrm}{m}$). A hierarchical clustering method was examined to obtain possible member of homogeneous sample classes for each of the two groups by transforming raw data and by applying various distances. A disjoint principal component analysis was then used to define homogeneous sample classes after deleting outliers. Each of five homogeneous sample classes was determined for the fine and the coarse particle group, respectively. The data were properly classified via an application of logarithmic transformation and Euclidean distance concept. After determining homogeneous classes, correlation coefficients among eight chemical variables within all the homogeneous classes for calculated and meteorological variables (temperature. relative humidity, wind speed, wind direction, and precipitation) were examined as well to intensively interpret environmental factors influencing the characteristics of each class for each group. According to our analysis, we found that each class had its own distinct seasonal pattern that was affected most sensitively by wind direction.ion.

  • PDF

Effect of Herbicide Combinations on Bt-Maize Rhizobacterial Diversity

  • Valverde, Jose R.;Marin, Silvia;Mellado, Rafael P.
    • Journal of Microbiology and Biotechnology
    • /
    • 제24권11호
    • /
    • pp.1473-1483
    • /
    • 2014
  • Reports of herbicide resistance events are proliferating worldwide, leading to new cultivation strategies using combinations of pre-emergence and post-emergence herbicides. We analyzed the impact during a one-year cultivation cycle of several herbicide combinations on the rhizobacterial community of glyphosate-tolerant Bt-maize and compared them to those of the untreated or glyphosate-treated soils. Samples were analyzed using pyrosequencing of the V6 hypervariable region of the 16S rRNA gene. The sequences obtained were subjected to taxonomic, taxonomy-independent, and phylogeny-based diversity studies, followed by a statistical analysis using principal components analysis and hierarchical clustering with jackknife statistical validation. The resilience of the microbial communities was analyzed by comparing their relative composition at the end of the cultivation cycle. The bacterial communites from soil subjected to a combined treatment with mesotrione plus s-metolachlor followed by glyphosate were not statistically different from those treated with glyphosate or the untreated ones. The use of acetochlor plus terbuthylazine followed by glyphosate, and the use of aclonifen plus isoxaflutole followed by mesotrione clearly affected the resilience of their corresponding bacterial communities. The treatment with pethoxamid followed by glyphosate resulted in an intermediate effect. The use of glyphosate alone seems to be the less aggressive one for bacterial communities. Should a combined treatment be needed, the combination of mesotrione and s-metolachlor shows the next best final resilience. Our results show the relevance of comparative rhizobacterial community studies when novel combined herbicide treatments are deemed necessary to control weed growth.