• 제목/요약/키워드: Microarray Data

검색결과 471건 처리시간 0.03초

Comparison of Normalizations for cDNA Microarray Data

  • 김윤희;김호;박웅양;서진영;정진호
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.175-181
    • /
    • 2002
  • cDNA microarray experiments permit us to investigate the expression levels of thousands of genes simultaneously and to make it easy to compare gene expression from different populations. However, researchers are asked to be cautious in interpreting the results because of the unexpected sources of variation such as systematic errors from the microarrayer and the difference of cDNA dye intensity. And the scanner itself calculates both of mean and median of the signal and background pixels, so it follows a selection which raw data will be used in analysis. In this paper, we compare the results in each case of using mean and median from the raw data and normalization methods in reducing the systematic errors with arm's skin cells of old and young males. Using median is preferable to mean because the distribution of the test statistic (t-statistic) from the median is more close to normal distribution than that from mean. Scaled print tip normalization is better than global or lowess normalization due to the distribution of the test-statistic.

  • PDF

Deducing Isoform Abundance from Exon Junction Microarray

  • Kim Po-Ra;Oh S.-June;Lee Sang-Hyuk
    • Genomics & Informatics
    • /
    • 제4권1호
    • /
    • pp.33-39
    • /
    • 2006
  • Alternative splicing (AS) is an important mechanism of producing transcriptome diversity and microarray techniques are being used increasingly to monitor the splice variants. There exist three types of microarrays interrogating AS events-junction, exon, and tiling arrays. Junction probes have the advantage of monitoring the splice site directly. Johnson et al., performed a genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays (Science 302:2141-2144, 2003), which monitored splicing at every known exon-exon junctions for more than 10,000 multi-exon human genes in 52 tissues and cell lines. Here, we describe an algorithm to deduce the relative concentration of isoforms from the junction array data. Non-negative Matrix Factorization (NMF) is applied to obtain the transcript structure inferred from the expression data. Then we choose the transcript models consistent with the ECgene model of alternative splicing which is based on mRNA and EST alignment. The probe-transcript matrix is constructed using the NMF-consistent ECgene transcripts, and the isoform abundance is deduced from the non-negative least squares (NNLS) fitting of experimental data. Our method can be easily extended to other types of microarrays with exon or junction probes.

Identification of Differentially Expressed Genes Using Tests Based on Multiple Imputations

  • Kim, Sang Cheol;Yu, Donghyeon
    • Quantitative Bio-Science
    • /
    • 제36권1호
    • /
    • pp.23-31
    • /
    • 2017
  • Datasets from DNA microarray experiments, which are in the form of large matrices of expression levels of genes, often have missing values. However, the existing statistical methods including the principle components analysis (PCA) and Hotelling's t-test are not directly applicable for the datasets having missing values due to the fact that they assume the observed dataset is complete in general. Many methods have been proposed in previous literature to impute the missing in the observed data. Troyanskaya et al. [1] study the k-nearest neighbor (kNN) imputation, Kim et al. [2] propose the local least squares (LLS) method and Rubin [3] propose the multiple imputation (MI) for missing values. To identify differentially expressed genes, we propose a new testing procedure when the missing exists in the observed data. The proposed procedure uses the Stouffer's z-scores and combines the test results of individual imputed samples, which are dependent to each other. We numerically show that the proposed test procedure based on MI performs better than the existing test procedures based on single imputation (SI) by comparing their ROC curves. We apply the proposed method to analyzing a public microarray data.

펩타이드 Microarray를 위한 유리 칩의 표면 개질 (Surface Modification of Glass Chip for Peptide Microarray)

  • 조형민;임창환; ; ;이은규
    • KSBB Journal
    • /
    • 제22권4호
    • /
    • pp.260-264
    • /
    • 2007
  • 본 실험에서는 마이크로어레이 형태로 펩타이드와의 공유결합에 의한 고정화를 시키기 위해 유리 칩의 표면을 아민기에서 thiol기로 개질하였다. 펩타이드의 lysine기와 thiol기와의 공유결합반응에는 12시간 정도의 반응시간이 필요하였고 실온보다는 35$^{\circ}C$가 유리함을 확인하였다. Trypsin-FITC와의 반응을 통해 trypsin 결합부위를 가진 target 펩타이드가 control 펩타이드보다 더 높은 형광 신호를 나타냄을 확인하였고, 이를 통해 target 펩타이드를 마이크로어레이 상에서 식별할 수 있었다. 이 trypsin-FITC와의 결합 친화도 차이를 별도의 QCM 실험을 통해서도 확인하였다. 또한 작은 부피의 spot과 높은 농도의 펩타이드 용액이 더욱 높은 표면형광신호를 생성함을 확인하였다. 본 실험을 통해 펩타이드 마이크로어레이 칩 개발을 위한 기초 조건을 확립하였다.

프로폴리스가 X-선에 노출된 마우스 정소에 미치는 방사선 방어 효과 (Radioprotective Effects of Propolis on the Mouse Testis Exposed to X-ray.)

  • 지태정;김종식;정형진;서을원
    • 생명과학회지
    • /
    • 제17권5호
    • /
    • pp.664-670
    • /
    • 2007
  • 프로폴리스는 꿀벌에 의해 생산되는 천연물질로서, 항미생물, 항산화, 항암 활성이 있는 것으로 알려져 있다. 그러나 프로폴리스에 의한 방사선 방어효과에 대한 특성은 잘 연구되지 않았다. 마우스 정소조직을 대상으로 프로폴리스에 의한 방사선 방어효과를 연구하기 위하여, 프로폴리스를 섭식시키거나 복강 투여한 후 각각 방사선을 조사한 후, 마우스의 정소조직을 광학현미경과 전자현미경을 통해 관찰하였다. 그 결과 방사선에 의해 유도된 세포의 변형이 프로폴리스에 의해 회복됨을 알 수 있었다. 또한 이러한 방사선 회복 효과의 분자기전을 이해하고자 DNA microarray 실험을 수행하였다. 그 결과 방사선만 조사한 마우스에 비해 방사선과 프로폴리스를 동시에 처리한 마우스의 정소에서 2배 이상 증가되는 유전자 65개를 선별하였고, 반대로 2배 이상 감소되는 유전자 진4개를 선별하였다. 이중에서 각각의 유전자군에서 2개의 유전자를 선별하여 RT-PCR을 수행하여 마이크로어레이 결과를 검증하였다. 이러한 결과들은 마우스 모델에서 프로폴리스에 의한 방사선 방어효과의 분자기전을 이해하는데 도움이 될 것으로 기대된다.

cDNA 마이크로어레이 이미지를 위한 그래프 모델과 분석 알고리즘 (A Graph Model and Analysis Algorithm for cDNA Microarray Image)

  • 정호열;황미녕;유영중;조환규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권7호
    • /
    • pp.411-421
    • /
    • 2002
  • 본 논문에서는 마이크로어레이 처리를 위한 새로운 이미지 분석 알고리즘과 격자 반점들의 위상 정보를 이용하여 격자의 위치를 결정하는 방법을 제시한다. 마이크로어레이는 유전자의 발현량의 측정을 위해서 수만 혹은 수십 만개의 유전자에 대해서 한번에 실험을 할 수 있는 장비이다. 한번의 실험으로 생성되는 데이터 양이 엄청나게 많기 때문에 자동화된 분석이 필요하다. 이 마이크로어레이의 실험 결과는 16-비트 회색조 이미지 파일로 하나의 유전자가 여러 개의 픽셀로 뭉쳐져 있는 반점(spot)이 격자 구조형태로 나타난다. 본 논문에서 이미지 데이터에서 그래프 구조를 생성하여 이들 반점이 어느 격자에 속하는지 결정하는 알고리즘과 격자 구조의 기울어짐을 측정하여 격자의 정확한 위치와 모양을 결정하는 방법을 제시하고 실제 이미지 데이터를 통한 많은 실험 결과를 보여 준다.

Effect of missing values in detecting differentially expressed genes in a cDNA microarray experiment

  • Kim, Byung-Soo;Rha, Sun-Young
    • Bioinformatics and Biosystems
    • /
    • 제1권1호
    • /
    • pp.67-72
    • /
    • 2006
  • The aim of this paper is to discuss the effect of missing values in detecting differentially expressed genes in a cDNA microarray experiment in the context of a one sample problem. We conducted a cDNA micro array experiment to detect differentially expressed genes for the metastasis of colorectal cancer based on twenty patients who underwent liver resection due to liver metastasis from colorectal cancer. Total RNAs from metastatic liver tumor and adjacent normal liver tissue from a single patient were labeled with cy5 and cy3, respectively, and competitively hybridized to a cDNA microarray with 7775 human genes. We used $M=log_2(R/G)$ for the signal evaluation, where Rand G denoted the fluorescent intensities of Cy5 and Cy3 dyes, respectively. The statistical problem comprises a one sample test of testing E(M)=0 for each gene and involves multiple tests. The twenty cDNA microarray data would comprise a matrix of dimension 7775 by 20, if there were no missing values. However, missing values occur for various reasons. For each gene, the no missing proportion (NMP) was defined to be the proportion of non-missing values out of twenty. In detecting differentially expressed (DE) genes, we used the genes whose NMP is greater than or equal to 0.4 and then sequentially increased NMP by 0.1 for investigating its effect on the detection of DE genes. For each fixed NMP, we imputed the missing values with K-nearest neighbor method (K=10) and applied the nonparametric t-test of Dudoit et al. (2002), SAM by Tusher et al. (2001) and empirical Bayes procedure by $L\ddot{o}nnstedt$ and Speed (2002) to find out the effect of missing values in the final outcome. These three procedures yielded substantially agreeable result in detecting DE genes. Of these three procedures we used SAM for exploring the acceptable NMP level. The result showed that the optimum no missing proportion (NMP) found in this data set turned out to be 80%. It is more desirable to find the optimum level of NMP for each data set by applying the method described in this note, when the plot of (NMP, Number of overlapping genes) shows a turning point.

  • PDF

베이지안 기법을 적용한 마이크로어레이 데이터 분류 알고리즘 설계와 구현 (The Algorithm Design and Implement of Microarray Data Classification using the Byesian Method)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.2283-2288
    • /
    • 2006
  • 최근 생명 정보학 기술의 발달로 마이크로 단위의 실험조작이 가능해짐에 따라 하나의 chip상에서 전체 genome의 expression pattern을 관찰할 수 있게 되었고, 동시에 수 만개의 유전자들 간의 상호작용도 연구 가능하게 되었다. 이처럼 DNA 마이크로어레이 기술은 복잡한 생물체를 이해하는 새로운 방향을 제시해주게 되었다. 따라서 이러한 기술을 통해 얻어진 대량의 유전자 정보들을 효과적으로 분석하는 방법이 시급하다. 본 논문에서는 실험용 데이터로 하버드대학교의 바이오인포메틱스 코어 그룹의 샘플데이터 이용하여 마이크로어레이 실험에서 다양한 원인에 의해 발생하는 잡음(noise)을 줄이거나 제거하는 과정인 표준화 과정을 거쳐 특징 추출방법인 베이지안 알고리즘 ASA(Adaptive Simulated Annealing) 방법을 이용하여 데이터를 2개의 클래스로 나누고, 정확도를 평가하는 시스템을 설계하고 구현하였다. Lowess 표준화 후 98.23%의 정확도를 보였다.

CLUSTERING DNA MICROARRAY DATA BY STOCHASTIC ALGORITHM

  • Shon, Ho-Sun;Kim, Sun-Shin;Wang, Ling;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.438-441
    • /
    • 2007
  • Recently, due to molecular biology and engineering technology, DNA microarray makes people watch thousands of genes and the state of variation from the tissue samples of living body. With DNA Microarray, it is possible to construct a genetic group that has similar expression patterns and grasp the progress and variation of gene. This paper practices Cluster Analysis which purposes the discovery of biological subgroup or class by using gene expression information. Hence, the purpose of this paper is to predict a new class which is unknown, open leukaemia data are used for the experiment, and MCL (Markov CLustering) algorithm is applied as an analysis method. The MCL algorithm is based on probability and graph flow theory. MCL simulates random walks on a graph using Markov matrices to determine the transition probabilities among nodes of the graph. If you look at closely to the method, first, MCL algorithm should be applied after getting the distance by using Euclidean distance, then inflation and diagonal factors which are tuning modulus should be tuned, and finally the threshold using the average of each column should be gotten to distinguish one class from another class. Our method has improved the accuracy through using the threshold, namely the average of each column. Our experimental result shows about 70% of accuracy in average compared to the class that is known before. Also, for the comparison evaluation to other algorithm, the proposed method compared to and analyzed SOM (Self-Organizing Map) clustering algorithm which is divided into neural network and hierarchical clustering. The method shows the better result when compared to hierarchical clustering. In further study, it should be studied whether there will be a similar result when the parameter of inflation gotten from our experiment is applied to other gene expression data. We are also trying to make a systematic method to improve the accuracy by regulating the factors mentioned above.

  • PDF

효모 마이크로어레이 유전자발현 데이터에 대한 군집화 비교 (Comparison of clustering with yeast microarray gene expression data)

  • 이경아;김재희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.741-753
    • /
    • 2011
  • 마이크로어레이 유전자 발현데이터인 효모데이터를 이용하여 군집분석을 실시하였다. 모형기반 군집방법, K-평균법, 중앙값 중심분포 (PAM), 자기 조직화 지도 (SOM), 계층적 Ward 군집방법을 이용하여 군집화를 실시하고, 연결성 측도 (connectivity), Dunn지수, 실루엣 측도 (silhouette)를 이용하여 각 군집방법에 대한 유효성을 측정하고 군집분석 결과를 비교하고자한다.