Development of Clustering Algorithm and Tool for DNA Microarray Data

DNA 마이크로어레이 데이타의 클러스터링 알고리즘 및 도구 개발

  • 여상수 (중앙대학교 컴퓨터공학과) ;
  • 김성권 (중앙대학교 컴퓨터공학과)
  • Published : 2003.10.01

Abstract

Since the result data from DNA microarray experiments contain a lot of gene expression information, adequate analysis methods are required. Hierarchical clustering is widely used for analysis of gene expression profiles. In this paper, we study leaf-ordering, which is a post-processing for the dendrograms output by hierarchical clusterings to improve the efficiency of DNA microarray data analysis. At first, we analyze existing leaf-ordering algorithms and then present new approaches for leaf-ordering. And we introduce a software HCLO(Hierarchical Clustering & Leaf-Ordering Tool) that is our implementation of hierarchical clustering, some of existing leaf-ordering algorithms and those presented in this paper.

DNA 마이크로어레이 실험으로 나오는 데이타는 아주 많은 양의 유전자 발현 정보를 담고 있기 때문에 적절한 분석 방법이 필요하다. 대표적인 분석 방법은 계층적 클러스터링(hierarchical clustering) 방법이다. 본 논문에서는 계층적 클러스터링의 결과로 나오게 되는 덴드로그램(dendrogram)에 대해서 후처리(post-Processing)를 시행함으로써 DNA 마이크로어레이 데이타 분석을 더 용이하게 해주는 리프오더링(leaf-ordering)에 대해서 연구하였다. 먼저, 기존의 리프오더링 알고리즘들을 분석하였고, 리프오더링 알고리즘의 새로운 접근 방식을 제안하였다. 또한 이에 대한 성능을 실험하고 분석하기 위해서 계층적 클러스터링과 몇 가지 리프오더링 알고리즘들, 그리고 제안된 접근 방식을 직접 구현한 HCLO (Hierarchical Clustering & Leaf-Ordering Tool)에 대해서 소개하였다.

Keywords

References

  1. 여상수, 김성권, 'DNA 마이크로어레이 데이타 클러스터링 알고리즘의 연구 동향', 한국정보과학회 컴퓨터 이론연구회지, 제12권 1호, pp.2-11, 2001년 10월
  2. R. Shamir and R. Sharan, 'Algorithmic approaches to clustering gene expression data,' Current Topics in Computational Biology, MIT Press, submitted
  3. M. Eisen et aI., 'Cluster analysis and display of genome-wide expression patterns,' Proc. of Natl. Acad. Sci., 95:14863-14867, 1998 https://doi.org/10.1073/pnas.95.25.14863
  4. M. Eisen, 'Cluster and TreeView Manual,' Eisen Lab. Homepage (http://zrana.lbl.gov /manuals/Cluster TreeView.pdf)
  5. U. Alon et aI., 'Broad patterns of gene expression revealed by clustering analysis of tumor and normal colon tissues probed by oligonucleotide arrays,' Proc. Natl. Acad. Sci., 96:6745-6750, 1999 https://doi.org/10.1073/pnas.96.12.6745
  6. Z. Bar-Joseph et al., 'Fast optimal leaf ordering for hierarchical clustering,' Proceedings of 15MB 2001. pp.s22-s29
  7. Z. Bar-Joseph, Therese Biedl, et aI., 'Optimal Arrangement of Leaves in the Tree Representing Hierarchical Clustering of Gene Expression Data,' Bioinformatics Research Group Homepage of University of Waterloo (http://monod.uwaterloo.ca/supplements/01expr/art.pdf)
  8. 여상수, 이정원, 김성권, 'DNA 마이크로어레이 데이타의 계층적 클러스터링에 대한 리프오더링 알고리즘 개발', 한국정보과학회 2002년 봄 학술발표논문집(A), 제29권 제1호, pp.706-708, 2002년 4월
  9. P.T. Spellman et al. 'Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization,' Molecular Biology of the Cell 9:3273-97.1998 https://doi.org/10.1091/mbc.9.12.3273