• 제목/요약/키워드: Time course gene expression data

검색결과 20건 처리시간 0.025초

Consensus Clustering for Time Course Gene Expression Microarray Data

  • Kim, Seo-Young;Bae, Jong-Sung
    • Communications for Statistical Applications and Methods
    • /
    • 제12권2호
    • /
    • pp.335-348
    • /
    • 2005
  • The rapid development of microarray technologies enabled the monitoring of expression levels of thousands of genes simultaneously. Recently, the time course gene expression data are often measured to study dynamic biological systems and gene regulatory networks. For the data, biologists are attempting to group genes based on the temporal pattern of their expression levels. We apply the consensus clustering algorithm to a time course gene expression data in order to infer statistically meaningful information from the measurements. We evaluate each of consensus clustering and existing clustering methods with various validation measures. In this paper, we consider hierarchical clustering and Diana of existing methods, and consensus clustering with hierarchical clustering, Diana and mixed hierachical and Diana methods and evaluate their performances on a real micro array data set and two simulated data sets.

시간경로 유전자 발현자료의 군집분석에서 이질적인 시계열의 탐지를 위한 패턴일치지수 (A Pattern Consistency Index for Detecting Heterogeneous Time Series in Clustering Time Course Gene Expression Data)

  • 손영숙;백장선
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.371-379
    • /
    • 2005
  • 본 논문에서는 피어슨 상관계수를 이용한 시간경로 유전자 발현자료의 군집분석에서 군집의 대표적인 패턴에서 벗어나는 이질적인 패턴을 보이는 시계열을 탐지하기 위한 패턴일치지수를 제안하고, 이를 마이크로어레이 실험으로부터 얻어진 혈청 시간경로 유전자 발현자료에 적용하여 유용성을 검토해 본다.

시간경로 유전자 발현자료에서 패턴일치지수와 적응 최근접 이웃을 활용한 결측값 대치법 (Missing values imputation for time course gene expression data using the pattern consistency index adaptive nearest neighbors)

  • 신혜서;김동재
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.269-280
    • /
    • 2020
  • 시간경로 유전자 발현 자료는 마이크로어레이 실험을 시간에 따라 관측한 대용량의 자료로 유전자 발현 수준을 동시에 파악할 수 있다. 하지만 실험 과정이 복잡하여 다양한 원인들에 의해 결측값이 자주 발생한다. 본 논문에서는 시간경로 유전자 발현 자료에 대한 결측값을 추정하는 방법으로 패턴 적응 최근접 이웃(pattern consistency index adaptive nearest neighbors; PANN) 방법을 제안하였다. 이 방법은 국소적 특징을 반영하는 적응 최근접 이웃(adaptive nearest neighbors; ANN) 방법과 관측 시점간 유전자 발현의 일치 정도를 고려하는 패턴일치지수를 결합시킨 것이다. 제안한 PANN 방법의 효능을 평가하기 위하여 두 가지의 실제 시간경로 자료들을 사용하여 몬테카를로 모의실험(Monte Carlo simulation study)을 시행하였다.

효모 마이크로어레이 유전자 발현데이터에 대한 가우시안 과정 회귀를 이용한 유전자 선별 및 군집화 (Screening and Clustering for Time-course Yeast Microarray Gene Expression Data using Gaussian Process Regression)

  • 김재희;김태훈
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.389-399
    • /
    • 2013
  • 본 연구에서는 가우시안 과정회귀방법을 소개하고 시계열 마이크로어레이 유전자 발현데이터에 대해 가우시안 과정회귀를 적용한 사례를 보이고자한다. 가우시안 과정회귀를 적합하여 로그 주변우도함수 비를 이용한 유전자를 선별방법에 대한 모의실험을 통해 민감도, 특이도, 위발견율 등을 계산하여 선별방법으로의 활용성을 보였다. 실제 효모세포주기 데이터에 대해 제곱지수공분산함수를 고려한 가우시안 과정회귀를 적합하여 로그 주변우도함수 비를 이용하여 차변화된 유전자를 선별한 후, 선별된 유전자들에 대해 가우시안 모형기반 군집화를 하고 실루엣 값으로 군집유효성을 보였다.

순차적 부분최소제곱 회귀적합에 의한 시간경로 유전자 발현 자료의 결측치 추정 (Missing Values Estimation for Time Course Gene Expression Data Using the Sequential Partial Least Squares Regression Fitting)

  • 김경숙;오미라;백장선;손영숙
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.275-290
    • /
    • 2008
  • 마이크로어레이 유전자 발현 자료는 대용량이며 또한 관측 과정이 복잡하여 결측치가 빈번하게 발생된다. 본 논문에서는 관측 시점 간에 상관성을 갖는 시간경로 유전자 발현 자료에 대한 결측치 추정을 위하여 순차적 부분최소제곱(sequential partial least squares: SPLS) 회귀적합 방법을 제안한다. 이는 순차적 기법과 부분최소제곱(partial least squares: PLS) 회귀적합 방법을 결합시킨 것이다. 세 가지의 이스트(yeast) 시간경로 자료들에 대한 몇 가지 모의실험을 통하여 제안된 결측치 추정방법의 유용성을 평가한다.

무 변화 패턴을 갖는 시간경로 유전자발현자료를 제거하기 위한 함수들의 비교 (Comparison of Functions for Filtering Time Course Gene Expression Data with Flat Patterns)

  • 김경숙;오미라;백장선;손영숙
    • 응용통계연구
    • /
    • 제20권2호
    • /
    • pp.409-422
    • /
    • 2007
  • 시간경로 유전자 발현자료에 대한 본격적인 통계분석을 수행하기에 앞서 의미있는 정보를 제공하지 못할 것으로 여겨지는 유전자들은 선별하여 미리 제거함으로서 자료의 차원을 축소시킬 수 있을 뿐 아니라, 잡음이나 변이가 낮은 자료로 인한 잘못된 판단을 감소시킬 수 있다. 본 논문에서는 관측표본에 대한 백분위수 기준과 붓스트랩 표본에 대한 백분위수 기준 하에서 무 변화 패턴을 갖는 유전자들을 제거시킬 수 있는 기존의 필터링 함수들을 비교하였다. 이스트(yeast) 자료에 적용하여 두 가지 필터링 방식에 대해 가장 유사한 결과를 보인 것은 분산 함수였다.

시간 경로 마이크로어레이 자료의 군집 분석에 관한 고찰 (A Review of Cluster Analysis for Time Course Microarray Data)

  • 손인석;이재원;김서영
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.13-32
    • /
    • 2006
  • 생물학자들은 시간에 따라 발현 수준이 변화하는 유전자의 군집화를 시도하고 있다. 지금까지는 마이크로어레이 자료의 군집분석에 관한 연구의 경우 군집 방법 자체를 비교하는 연구가 주를 이루었다. 그러나 군집화 이전에 의미있는 변화를 보이는 유전자 선택에 따라 군집화 결과가 달라지기 때문에, 군집 분석에 있어서 유전자 선택 단계도 중요하게 고려되어야 한다. 따라서, 본 논문에서는 시간 경로 마이크로어레이 자료를 군집 분석하는데 있어서 유전자 선택, 군집 방법 선택, 군집평가 방법 선택 등 3가지 요인을 고려한 폭 넓은 비교 연구를 하였다.

Gene Discovery Analysis from Mouse Embryonic Stem Cells Based on Time Course Microarray Data

  • Suh, Young Ju;Cho, Sun A;Shim, Jung Hee;Yook, Yeon Joo;Yoo, Kyung Hyun;Kim, Jung Hee;Park, Eun Young;Noh, Ji Yeun;Lee, Seong Ho;Yang, Moon Hee;Jeong, Hyo Seok;Park, Jong Hoon
    • Molecules and Cells
    • /
    • 제26권4호
    • /
    • pp.338-343
    • /
    • 2008
  • An embryonic stem cell is a powerful tool for investigation of early development in vitro. The study of embryonic stem cell mediated neuronal differentiation allows for improved understanding of the mechanisms involved in embryonic neuronal development. We investigated expression profile changes using time course cDNA microarray to identify clues for the signaling network of neuronal differentiation. For the short time course microarray data, pattern analysis based on the quadratic regression method is an effective approach for identification and classification of a variety of expressed genes that have biological relevance. We studied the expression patterns, at each of 5 stages, after neuronal induction at the mRNA level of embryonic stem cells using the quadratic regression method for pattern analysis. As a result, a total of 316 genes (3.1%) including 166 (1.7%) informative genes in 8 possible expression patterns were identified by pattern analysis. Among the selected genes associated with neurological system, all three genes showing linearly increasing pattern over time, and one gene showing decreasing pattern over time, were verified by RT-PCR. Therefore, an increase in gene expression over time, in a linear pattern, may be associated with embryonic development. The genes: Tcfap2c, Ttr, Wnt3a, Btg2 and Foxk1 detected by pattern analysis, and verified by RT-PCR simultaneously, may be candidate markers associated with the development of the nervous system. Our study shows that pattern analysis, using the quadratic regression method, is very useful for investigation of time course cDNA microarray data. The pattern analysis used in this study has biological significance for the study of embryonic stem cells.

백서의 패혈증 모델에서 시간에 따른 폐조직에서의 Inducible Nitric Oxide Synthase 발현 (Time Course of Inducible NOS Expression of Lung Tissue during Sepsis in a Rat Model)

  • 김중희;김성춘;권운용;서길준;윤여규
    • Journal of Trauma and Injury
    • /
    • 제21권2호
    • /
    • pp.120-127
    • /
    • 2008
  • Purpose: Many studies on the time course of inducible nitric oxide synthase (iNOS) gene expression have been performed in the LPS (Lipopolysaccharide)-induced endotoxemic model, but there have been few experimental approaches to continuous peritonitis-induced sepsis model. We conducted this study to establish basic data for future sepsis-related research by investigating the time course of iNOS gene expression and the relationship with the production of inflammatory mediators in the early sepsis model induced by cecal ligation and puncture (CLP). Methods: Male Sprague-Dawley rats were operated on by sing the CLP method to induce of peritonitis; and then, they were sacrificed and samples of blood and lung tissues were obtained at various times (1,2,3,6,9 and 12 h after CLP). We observed the expression of iNOS mRNA from lung tissues and measured the synthesis of nitric oxide, $IL-1{\beta}$, and $TNF-{\alpha}$ from the blood. Results: iNOS mRNA began to be expressed at 3 h and was maintained untill 12 h after CLP. The nitric oxide concentration was increased significantly at 6 h, reached its peak level at 9 h, and maintained a plateau untill 12 h after CLP. $TNF-{\alpha}$ began to be detected at 3 h, increased gradually, and decreased steeply from 9 h after CLP. $IL-1{\beta}$ showed its peak level at 6 h after CLP, and tended to decrease without significance. Conclusion: We observed that the iNOS gene was expressed later in peritonitis-induced sepsis than in LPS-induced sepsis. Nitric oxide and key inflammatory mediators were also expressed later in peritonitis-induced sepsis than in LPS-induced sepsis.

Comparative Analysis of Growth-Phase-Dependent Gene Expression in Virulent and Avirulent Streptococcus pneumoniae Using a High-Density DNA Microarray

  • Ko, Kwan Soo;Park, Sulhee;Oh, Won Sup;Suh, Ji-Yoeun;Oh, TaeJeong;Ahn, Sungwhan;Chun, Jongsik;Song, Jae-Hoon
    • Molecules and Cells
    • /
    • 제21권1호
    • /
    • pp.82-88
    • /
    • 2006
  • The global pattern of growth-dependent gene expression in Streptococcus pneumoniae strains was evaluated using a high-density DNA microarray. Total RNAs obtained from an avirulent S. pneumoniae strain R6 and a virulent strain AMC96-6 were used to compare the expression patterns at seven time points (2.5, 3.5, 4.5, 5.5, 6.0, 6.5, and 8.0 h). The expression profile of strain R6 changed between log and stationary growth (the Log-Stat switch). There were clear differences between the growth-dependent gene expression profiles of the virulent and avirulent pneumococcal strains in 367 of 1,112 genes. Transcripts of genes associated with bacterial competence and capsular polysaccharide formation, as well as clpP and cbpA, were higher in the virulent strain. Our data suggest that late log or early stationary phase may be the most virulent phase of S. pneumoniae.