• 제목/요약/키워드: microarray expression data

검색결과 357건 처리시간 0.034초

마이크로어레이 유전자 발현 자료에 대한 군집 방법 비교 (Comparison of clustering methods of microarray gene expression data)

  • 임진수;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.39-51
    • /
    • 2012
  • 군집분석은 마이크로어레이 발현자료에서 유전자 혹은 표본들의 유사한 특성을 갖는 연관구조를 조사하는데 중요한 도구이다. 본 논문에서는 마이크로어레이 자료에서 계층적 군집방법, K-평균법, PAM (partitioning around medoids), SOM (self-organizing maps) 그리고 모형기반 군집방법 들의 성능을 3가지 군집 타당성 측도인 내적 측도, 안정적 측도 그리고 생물학적 측도를 가지고 비교분석하고자 한다. 모의실험을 통해 생성된 자료와 실제 SRBCT (small round blue cell tumor) 자료를 가지고 여러 가지 군집방법들의 성능을 비교하였으며 그 결과 모의실험 자료에서는 거의 모든 방법들이 3가지 군집측도에서 원래 자료와 일치하는 좋은 군집 결과를 나타내었고 SRBCT 자료에서는 모의실험 자료처럼 명확한 군집화 결과를 보여주지는 않으나 내적측도의 실루엣 너비 (Silhouette width) 관점에서는 PAM 방법, SOM, 모형기반 군집방법 그리고 생물학적 측도에서는 PAM 방법과 모형기반 군집방법이 모의실험 결과와 비슷한 결과를 얻었고 안정적 측도에서 모형기반 군집방법이 다른 방법들보다 좋은 군집결과를 보여주었다.

Performance of the Agilent Microarray Platform for One-color Analysis of Gene Expression

  • Song Sunny;Lucas Anne;D'Andrade Petula;Visitacion Marc;Tangvoranuntakul Pam;FulmerSmentek Stephanie
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2006년도 Principles and Practice of Microarray for Biomedical Researchers
    • /
    • pp.78-78
    • /
    • 2006
  • Gene expression analysis can be performed by one-color (intensity-based) or two-color (ratio-based) microarray platforms depending on the specific applications and needs of the researcher. The traditional two-color approach is well founded from a historical and scientific standpoint, and the one-color approach, when paired with high quality microarrays and a robust workflow, offers additional flexibility in experimental design. Two of the major requirements of any microarray platform are system reproducibility, which provides the means for high confidence experiments and accurate comparison across multiple samples; and high sensitivity, for the detection of significant gene expression changes, including small fold changes across multiple gene sets. Each of these requirements is fulfilled by the Agilent One-color Gene Expression Platform as illustrated by the data included in this study. As a result, researchers have the ability to take advantage of the enhanced performance and sensitivity of Agilent's 60-mer oligonucleotide microarrays, and experience the first commercial microarray platform compatible with both one- and two-color detection.

  • PDF

PathTalk: Interpretation of Microarray Gene-Expression Clusters in Association with Biological Pathways

  • Chung, Tae-Su;Chung, Hee-Joon;Kim, Ju-Han
    • Genomics & Informatics
    • /
    • 제5권3호
    • /
    • pp.124-128
    • /
    • 2007
  • Microarray technology enables us to measure the expression of tens of thousands of genes simultaneously under various experimental conditions. Clustering analysis is one of the most successful methods for analyzing microarray data using the assumption that co-expressed genes may be co-regulated. It is important to extract meaningful clusters from a long unordered list of clusters and to evaluate the functional homogeneity and heterogeneity of clusters. Many quality measures for clustering results have been suggested in different conditions. In the present study, we consider biological pathways as a collection of biological knowledge and used them as a reference for measuring the quality of clustering results and functional homogeneities. PathTalk visualizes and evaluates functional relationships between gene clusters and biological pathways.

Ensemble Gene Selection Method Based on Multiple Tree Models

  • Mingzhu Lou
    • Journal of Information Processing Systems
    • /
    • 제19권5호
    • /
    • pp.652-662
    • /
    • 2023
  • Identifying highly discriminating genes is a critical step in tumor recognition tasks based on microarray gene expression profile data and machine learning. Gene selection based on tree models has been the subject of several studies. However, these methods are based on a single-tree model, often not robust to ultra-highdimensional microarray datasets, resulting in the loss of useful information and unsatisfactory classification accuracy. Motivated by the limitations of single-tree-based gene selection, in this study, ensemble gene selection methods based on multiple-tree models were studied to improve the classification performance of tumor identification. Specifically, we selected the three most representative tree models: ID3, random forest, and gradient boosting decision tree. Each tree model selects top-n genes from the microarray dataset based on its intrinsic mechanism. Subsequently, three ensemble gene selection methods were investigated, namely multipletree model intersection, multiple-tree module union, and multiple-tree module cross-union, were investigated. Experimental results on five benchmark public microarray gene expression datasets proved that the multiple tree module union is significantly superior to gene selection based on a single tree model and other competitive gene selection methods in classification accuracy.

유전자 발현 데이터를 이용한 암의 유형 분류 기법 (Cancer-Subtype Classification Based on Gene Expression Data)

  • 조지훈;이동권;이민영;이인범
    • 제어로봇시스템학회논문지
    • /
    • 제10권12호
    • /
    • pp.1172-1180
    • /
    • 2004
  • Recently, the gene expression data, product of high-throughput technology, appeared in earnest and the studies related with it (so-called bioinformatics) occupied an important position in the field of biological and medical research. The microarray is a revolutionary technology which enables us to monitor several thousands of genes simultaneously and thus to gain an insight into the phenomena in the human body (e.g. the mechanism of cancer progression) at the molecular level. To obtain useful information from such gene expression measurements, it is essential to analyze the data with appropriate techniques. However the high-dimensionality of the data can bring about some problems such as curse of dimensionality and singularity problem of matrix computation, and hence makes it difficult to apply conventional data analysis methods. Therefore, the development of method which can effectively treat the data becomes a challenging issue in the field of computational biology. This research focuses on the gene selection and classification for cancer subtype discrimination based on gene expression (microarray) data.

Statistical Analysis about Ability to Mouse Embryonic Stem Cell Differentiation using cDNA Microarray

  • Choi, Hang-Suk;Kim, Sung-Ju;Lee, Young-Jin;Cha, Kyung-Joon;Kim, Chul-Geun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.951-958
    • /
    • 2005
  • As a foundation study of stem cell applied research, it is necessary to identify the large gene expression through cDNA microarray to understand principles of the level of molecular about cell function. In this paper, we investigated the gene expression through the K-means clustering method and path analysis with genes related to pluripoteny and differentiation in an mouse early stage embryonic development process and embryonic stem cell differentiation. We find a few biological phenomenon through this study. Also, we realize that this process provides functional relationship of unknown genes.

  • PDF

cDNA 마이크로어레이에서 유전자간 상관 관계에 대한 보고 (A Report on the Inter-Gene Correlations in cDNA Microarray Data Sets)

  • 김병수;장지선;김상철;임요한
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.617-626
    • /
    • 2009
  • 최근에 보고되는 일련의 연구는 Affymetrix 마이크로어레이 자료에서 유전자간 상관관계가 강하고 장범위(長範圍)(long-ranged)로 나타나고 있으며, 기존의 "편한" 가정, 즉 유전자간 상관관계가 매우 약하며, 따라서 유전자간 유사 독립성을 가정할 수 있다는 주장이 비현실적이라는 것을 보고하고 있다. Qui 등 (2005b)은 각 유전자의 검정통계량을 병합하여 통계적 추론을 하는 이른바 비모수적 경험적 베이즈 방법을 적용하면 검색된 특이발현 유전자수의 분산이 커진다는 것을 보고하고 있고, 이러한 분산의 불안전성 이유로서 유전자간 강한 상관관계를 지적하고 있다. 또한 Klebanov와 Yakovlev (2007)는 유전자간 상관관계가 통계적 분석을 어렵게 하는 요인이라기 보다는 유용한 정보의 원천이고 적정한 변환을 통하여 근사 독립을 유지할 수 있는 급수를 만들 수 있으며 이 급수를 ${\delta}$-급수라고 불렀다. 본 보고에서는 국내에서 생산된 2조의 cDNA 마이크로어레이 자료에서 유전자간 상관관계가 비교적 강하며, 장범위(長範圍)로 나타나는 것을 확인하며, 유사 독립성을 전제할 수 있는 ${\delta}$-급수가 cDNA 마이크로어레이에서도 발견되는 것을 보고하고자 한다, 동 보고는 추후 cDNA 마이크로어레이 자료의 분석에서도 유전자간 상관관계를 고려하여야 함을 강조하고 있다.

Identification of Differentially Expressed Genes in the Dicer 1 Knock-down Mouse Embryos using Microarray

  • Lee, Jae-Dal;Cui, Xiang-Shun
    • Reproductive and Developmental Biology
    • /
    • 제32권4호
    • /
    • pp.229-235
    • /
    • 2008
  • Silencing of Dicer1 by siRNA did not inhibit development up to the blastocyst stage, but decreased expression of selected transcription factors, including Oct-4, Sox2 and Nanog, suggesting that Dicer1 gene expression is associated with differentiation processes at the blastocyst stage (Cui et al., 2007). In order to get insights into genes which may be linked with microRNA system, we compared gene expression profiles in Gapdh and Dicer1 siRNA-microinjected blastocysts using the Applied Biosystem microarray technology. Our data showed that 397 and 737 out of 16354 genes were up- and down-regulated, respectively, following siRNA microinjection (p<0.05), including 24 up- and 28 down-regulated transcription factors. Identification of genes that are preferentially expressed at particular Dicer1 knock down embryos provides insights into the complex gene regulatory networks that drive differentiation processes in embryos at blastocyst stage.

DNA Microarray 시스템을 이용한 방선균 독소루비신 생합성 유전자군의 발현패턴 분석 (Expression Profiles of Streptomyces Doxorubicin Biosynthetic Gene Cluster Using DNA Microarray System)

  • 강승훈;김명근;박현주;김응수
    • KSBB Journal
    • /
    • 제20권3호
    • /
    • pp.220-227
    • /
    • 2005
  • 독소루비신 생합성 유전자의 발현을 촉진시키는 유전자인 dnrI와 다나루비신으로부터 독소루비신으로의 생전환에 관여하는 유전자인 doxA를 ermE 프로모터가 포함된 pSE34에 도입하였을 때 각각 5.5배, 2.5배의 독소루비신 생산성 증가가 이루어졌다. 독소루비신 생합성 유전자군의 발현패턴 분석을 위한 DNA microarray system을 구축하였고, 고생산 균주의 독소루비신 생합성 유전자 발현 패턴을 DNA microarray를 통해 확인하였다. 독소루비신 생합성 유전자군의 세포성장에 따른 발현패턴을 분석한 결과, 독소루비신 생산성 증가에 따라 생합성 유전자의 발현도 증가함을 확인할 수 있었고, pSE34를 통해 도입해준 donA, dnrI 유전자의 경우 전체 생합성 유전자의 평균보다 높은 수준의 발현량을 보여줌으로써, ermE 프로모터에 의해 발현이 극대화되었음을 확인할 수 있었다. 독소루비신 내성 유전자의 경우 다른 독소루비신 생합성 유전자들에 비해 발현정도가 크게 증가했고, DnrI 의해 조절을 받는 다른 유전자들의 발현 수준과 비교하였을 때 TDP-daunosamine을 생합성의 첫 번째 단계에 관여하는 dnmL 유전자는 그 발현양의 증가가 크지 않았다. 따라서 DNA microarray 시스템 분석 결과, 독소루비신 생산성 극대화를 위해서는 dnrI, doxA, drrA, drrB, drrC, dnmL 등의 유전자들의 안정적 발현이 매우 중요하고도 핵심적인 인자임이 확인되었다.

시드 클러스터링 방법에 의한 유전자 발현 데이터 분석 (Gene Expression Data Analysis Using Seed Clustering)

  • 신미영
    • 전자공학회논문지CI
    • /
    • 제42권1호
    • /
    • pp.1-7
    • /
    • 2005
  • 마이크로어레이 데이터의 클러스터 분석은 생물학적으로 연관성 있는 유전자 그룹을 찾기 위해 종종 사용되는 방법이다. 기능적으로 연관된 유전자들이 대개 유사한 발현 패턴을 나타내는 특징을 이용하여 유사한 발현 프로파일을 가진 유전자 그룹을 찾아냄으로써 알려지지 않은 유전자들의 기능을 같은 그룹에 속한 다른 유전자로부터 유추할 수 있기 때문이다. 본 논문에서는 클러스터 분석을 위해 시드 클러스터링 알고리즘을 새로이 제안하고, 이 방법을 마이크로어레이 데이터 분석에 적용해본다. 시드 클러스터링 방법은 주어진 데이터를 계산적으로 분석하여 시드 패턴을 자동 추출하고, 이러한 시드 패턴을 목적 클러스터의 프로토타입 벡터로서 간주하여 클러스터를 생성하는 방법이다. 이러한 시드 클러스터링 방법은 수학적 원리에 기초하고 있기 때문에, 매우 체계적인 방법으로 안정적이며 일관성 있는 클러스터링 결과를 생성할 수 있다. 또한, 실제 마이크로어레이 데이터 분석에 적용해본 결과 데이터에 내재된 각 클러스터를 대표하는 시드 패턴을 매우 효과적으로 자동 추출할 수 있었으며, 클러스터링 결과 또한 타 방법에 비해 다소 우월한 경향을 나타내었다.