• 제목/요약/키워드: Microarray Data

검색결과 473건 처리시간 0.023초

종양 분류를 위한 마이크로어레이 데이터 분류 모델 설계와 구현 (The Design and Implement of Microarry Data Classification Model for Tumor Classification)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.1924-1929
    • /
    • 2007
  • 오늘날 인간 프로젝트와 같은 종합적 인 연구의 궁극적 목적을 달성하기 위해서는 이 들 연구로부터 획득한 대량의 관련 데이터에 대해 새로운 현실적 의미를 부여할 수 있어야 한다. 마이크로어레이를 기반으로 하는 종양 분류 방법은 종양 종류에 따라 다르게 발현되는 유전자 양상을 통계적으로 발견함으로써 정확한 종양 분류에 기여 할 수 있다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 종양을 분류하기 위해서는 특정 종양 분류와 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 정보력 있는 유전자 목록을 별도로 추출하여 보다 정확한 종양 분류 모델을 구축하고 각각의 실험 결과들을 비교 분석함으로써 성능평가를 하였다. 피어슨 적률 상관 계수를 이용하여 선택된 유전자들을 멀티퍼셉트론 분류기로 분류한 결과 98.6%의 정확도를 보였다.

Effect of Korean Mistletoe Lectin on Gene Expression Profile in Human T Lymphocytes: A Microarray Study

  • Lyu, Su-Yun;Park, Won-Bong
    • Biomolecules & Therapeutics
    • /
    • 제18권4호
    • /
    • pp.411-419
    • /
    • 2010
  • Korean mistletoe has a variety of biological effects, such as immunoadjuvant activities. This study investigates the effects of Korean mistletoe lectin (Viscum album L. var. coloratum agglutinin, VCA) on human T lymphocytes to determine whether VCA acts as an immunomodulator. Purified human T-lymphocytes were cultured with VCA and RNA from each point was analyzed using Affymetrix human genome chips containing 22,500 probe sets which represents more than 18,000 transcripts derived from 14,500 human genes. As a result, there was a striking upregulation of genes coding for chemokines. Seventeen genes out of 50 coding for proteins with chemokine activity were upregulated including CXCL9 and IL-8 which are related to the treatment of cancer. In addition, 28 cytokine genes were upregulated including IL-1, IL-6, IL-8, IFN-$\gamma$, and TNF-$\alpha$. Taken together, the data suggest that Korean mistletoe lectin, in parallel with European mistletoe, has an ability to modulate human T cell function.

Statistical Method for Implementing the Experimenter Effect in the Analysis of Gene Expression Data

  • Kim, In-Young;Rha, Sun-Young;Kim, Byung-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제13권3호
    • /
    • pp.701-718
    • /
    • 2006
  • In cancer microarray experiments, the experimenter or patient which is nested in each experimenter often shows quite heterogeneous error variability, which should be estimated for identifying a source of variation. Our study describes a Bayesian method which utilizes clinical information for identifying a set of DE genes for the class of subtypes as well as assesses and examines the experimenter effect and patient effect which is nested in each experimenter as a source of variation. We propose a Bayesian multilevel mixed effect model based on analysis of covariance (ANACOVA). The Bayesian multilevel mixed effect model is a combination of the multilevel mixed effect model and the Bayesian hierarchical model, which provides a flexible way of defining a suitable correlation structure among genes.

Use of Factor Analyzer Normal Mixture Model with Mean Pattern Modeling on Clustering Genes

  • Kim Seung-Gu
    • Communications for Statistical Applications and Methods
    • /
    • 제13권1호
    • /
    • pp.113-123
    • /
    • 2006
  • Normal mixture model(NMM) frequently used to cluster genes on microarray gene expression data. In this paper some of component means of NMM are modelled by a linear regression model so that its design matrix presents the pattern between sample classes in microarray matrix. This modelling for the component means by given design matrices certainly has an advantage that we can lead the clusters that are previously designed. However, it suffers from 'overfitting' problem because in practice genes often are highly dimensional. This problem also arises when the NMM restricted by the linear model for component-means is fitted. To cope with this problem, in this paper, the use of the factor analyzer NMM restricted by linear model is proposed to cluster genes. Also several design matrices which are useful for clustering genes are provided.

마이크로 어레이 데이터에 적용된 2단계 K-means 클러스터링의 소개 (An Introduction of Two-Step K-means Clustering Applied to Microarray Data)

  • 박대훈;김연태;김성신;이춘환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.83-86
    • /
    • 2006
  • 많은 유전자 정보와 그 부산물은 많은 방법을 통해 연구되어 왔다. DNA 마이크로어레이 기술의 사용은 많은 데이터를 가져왔으며, 이렇게 얻은 데이터는 기존의 연구 방법으로는 분석하기 힘들다. 본 눈문에서는 많은 양의 데이터를 처리할 수 있게 하기 위하여 K-means 클러스터링 알고리즘을 이용한 분할 클러스터링을 제안하였다. 제안한 방법을 쌀 유전자로부터 나온 마이크로어레이 데이터에 적용함으로써 제안된 클러스터링 방법의 유용성을 검증하였으며, 기존의 K-means 클러스터링 알고리즘을 적용한 결과와 비교함으로써 제안된 알고리즘의 우수성을 확인 할 수 있었다.

  • PDF

Graphical Models for DNA Microarray Data Mining

  • 양진산;장병탁
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2002년도 제1차워크샵
    • /
    • pp.49-61
    • /
    • 2002
  • 현대적 실험방법 및 유전공학의 발전으로 최근 생물학적 자료는 비약적으로 늘어나고 있다. 이러한 자료의 기계학습을 이용한 분석방법은 많은 비용과 시간을 요구하는 전통적인 생물적 실험에 있어서 실험 시간을 단축시켜주고 실험비용을 줄여 주게 된다. 본 논문에서는 특별히 micro array data의 분석에 있어서 graphical model에 기반한 기계학습 방법들을 소개한다. 이중 GTM 은 특히 시각화 효과가 뛰어난 방법으로 Graphical model 에 기반한 GTM의 제반 특성을 소개하고 이를 yeast data의 분석에 적용시킨 결과를 자세히 알아보고자 한다. (**Presentation file을 수신 보관 중)

  • PDF

마이크로어레이 데이터와 PPI 데이터를 이용한 에스트로겐 수용체 음성 유방암 환자의 예후 특이 네트워크 식별 및 예후 예측 (Identification of prognosis-specific network and prediction for estrogen receptor-negative breast cancer using microarray data and PPI data)

  • 황유현;오민;윤영미
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.137-147
    • /
    • 2015
  • 본 논문에서는 유전자 네트워크를 기반으로 유방암 환자의 예후를 예측하는 알고리듬을 제안한다. 유방암 환자의 마이크로어레이 데이터와 PPI(Protein-protein interaction)데이터를 이용하여 알고리듬의 분류자로 사용될 예후 특이 네트워크(Prognosis specific gene network)를 추출한다. PPI에 속한 모든 유전자 네트워크에 대하여 각각의 네트워크가 예후 좋음과 나쁨을 잘 구분하는지에 대한 점수를 피어슨 상관계수(Pearson's correlation coefficient)와 마이크로어레이 데이터를 이용하여 계산한다. 이들 중 가장 예후에 유의한 네트워크를 식별하고, 이 네트워크를 분류자로 사용하여 에스트로겐 수용체 음성 유방암 환자의 예후를 분류 분석 한다. 본 연구와 기존 연구의 알고리듬 정확도를 비교 분석 하기 위하여 독립 실험을 진행하고, 본 연구에서 제안된 알고리듬의 성능이 더 우수함을 보인다. 또한, Gene Ontology 데이터베이스를 활용하여 식별된 예후 특이 네트워크를 기능적으로 검증 한다.

DNA Microarray Analysis of Gene Expression Profiles in Aging process of Mouse Brain

  • Lee Mi-Suk;Heo Jee-In;Kim Jae-Bong;Park Jae-Bong;Lee Jae-Yang;Han Jeong-A.;Kim Jong-Il
    • Genomics & Informatics
    • /
    • 제4권1호
    • /
    • pp.23-32
    • /
    • 2006
  • In order to investigate the molecular basis of the aging process in brain, we have employed high-density oligonucleotide microarrays providing data on 10,108 gene clusters to define transcriptional patterns in three brain regions, cerebral cortex, cerebellum, and hippocampus. Comparison of the expression patterns between young (6-week-old) and aged (17-month-old) C57BL/6 male micerevealed that about ten percent (1098) of the genes showed a significant change in the expression level in at least one of the three tissues. Among them, 23 genes were upregulated and 62 genes were downregulated in all three tissues of the old mice. The number of genes upregulated exclusively in hippocampus (337) was much larger compared to other tissues. Gene ontology-based analysis showed the genes related with signal transduction or molecular transports are more likely to be upregulated than downregulated in the aging process of hippocampus. These data may provide some useful means for elucidating the molecular aspect of aging in hippocampus and other regions in brain.

Rank-Based Nonlinear Normalization of Oligonucleotide Arrays

  • Park, Peter J.;Kohane, Isaac S.;Kim, Ju Han
    • Genomics & Informatics
    • /
    • 제1권2호
    • /
    • pp.94-100
    • /
    • 2003
  • Motivation: Many have observed a nonlinear relationship between the signal intensity and the transcript abundance in microarray data. The first step in analyzing the data is to normalize it properly, and this should include a correction for the nonlinearity. The commonly used linear normalization schemes do not address this problem. Results: Nonlinearity is present in both cDNA and oligonucleotide arrays, but we concentrate on the latter in this paper. Across a set of chips, we identify those genes whose within-chip ranks are relatively constant compared to other genes of similar intensity. For each gene, we compute the sum of the squares of the differences in its within-chip ranks between every pair of chips as our statistic and we select a small fraction of the genes with the minimal changes in ranks at each intensity level. These genes are most likely to be non-differentially expressed and are subsequently used in the normalization procedure. This method is a generalization of the rank-invariant normalization (Li and Wong, 2001), using all available chips rather than two at a time to gather more information, while using the chip that is least likely to be affected by nonlinear effects as the reference chip. The assumption in our method is that there are at least a small number of non­differentially expressed genes across the intensity range. The normalized expression values can be substantially different from the unnormalized values and may result in altered down-stream analysis.

Expression of miR-210 during erythroid differentiation and induction of γ-globin gene expression

  • Bianchi, Nicoletta;Zuccato, Cristina;Lampronti, Ilaria;Borgatti, Monica;Gambari, Roberto
    • BMB Reports
    • /
    • 제42권8호
    • /
    • pp.493-499
    • /
    • 2009
  • MicroRNAs (miRs) are a family of small noncoding RNAs that regulate gene expression by targeting mRNAs in a sequence specific manner, inducing translational repression or mRNA degradation. In this paper we have first analyzed by microarray the miR-profile in erythroid precursor cells from one normal and two thalassemic patients expressing different levels of fetal hemoglobin (one of them displaying HPFH phenotype). The microarray data were confirmed by RT-PCR analysis, and allowed us to identify miR-210 as an highly expressed miR in the erythroid precursor cells from the HPFH patient. When RT-PCR was performed on mithramycin-induced K562 cells and erythroid precursor cells, miR-210 was found to be induced in time-dependent and dose-dependent fashion, together with increased expression of the fetal $\gamma$-globin genes. Altogether, the data suggest that miR-210 might be involved in increased expression of $\gamma$-globin genes in differentiating erythroid cells.