• 제목/요약/키워드: gene expression data

검색결과 1,303건 처리시간 0.024초

A Unique Gene Expression Signature of 5-fluorouracil

  • Kim, Ja-Eun;Yoo, Chang-Hyuk;Park, Dong-Yoon;Lee, Han-Yong;Yoon, Jeong-Ho;Kim, Se-Nyun
    • Molecular & Cellular Toxicology
    • /
    • 제1권4호
    • /
    • pp.248-255
    • /
    • 2005
  • To understand the response of cancer cells to anticancer drugs at the gene expression level, we examined the gene expression changes in response to five anticancer drugs, 5-fluorouracil, cytarabine, cisplatin, paclitaxel, and cytochalasin D in NCI-H460 human lung cancer cells. Of the five drugs, 5-fluorouracil had the most distinctive gene expression signature. By clustering genes whose expression changed significantly, we identified three clusters with unique gene expression patterns. The first cluster reflected the up-regulation of gene expression by cisplatin, and included genes involved in cell death and DNA repair. The second cluster pointed to a general reduction of gene expression by most of the anticancer drugs tested. A number of genes in this cluster are involved in signal transduction that is important for communication between cells and reception of extracellular signals. The last cluster represented reduced gene expression in response to 5-fluorouracil, the genes involved being implicated in DNA metabolism, the cell cycle, and RNA processing. Since the gene expression signature of 5-fluorouracil was unique, we investigated it in more detail. Significance analysis of microarray data (SAM) identified 808 genes whose expression was significantly altered by 5-fluorouracil. Among the up-regulated genes, those affecting apoptosis were the most noteworthy. The down-regulated genes were mainly associated with transcription-and translation-related processes which are known targets of 5-fluorouracil. These results suggest that the gene expression signature of an anticancer drug is closely related to its physiological action and the response of caner cells.

암 예후를 효과적으로 예측하기 위한 Node2Vec 기반의 유전자 발현량 이미지 표현기법 (A Node2Vec-Based Gene Expression Image Representation Method for Effectively Predicting Cancer Prognosis)

  • 최종환;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권10호
    • /
    • pp.397-402
    • /
    • 2019
  • 암 환자에게 적절한 치료계획을 제공하기 위해 암의 진행양상 또는 환자의 생존 기간 등에 해당하는 환자의 예후를 정확히 예측하는 것은 생물정보학 분야에서 다루는 중요한 도전 과제 중 하나이다. 많은 연구에서 암 환자의 유전자 발현량 데이터를 이용하여 환자의 예후를 예측하는 기계학습 모델들이 많이 제안되어 오고 있다. 유전자 발현량 데이터는 약 17,000개의 유전자에 대한 수치값을 갖는 고차원의 수치형 자료이기에, 기존의 연구들은 특징 선택 또는 차원 축소 전략을 이용하여 예측 모델의 성능 향상을 도모하였다. 그러나 이러한 접근법은 특징 선택과 예측 모델의 훈련이 분리되어 있어서, 기계학습 모델은 선별된 유전자들이 생물학적으로 어떤 관계가 있는지 알기가 어렵다. 본 연구에서는 유전자 발현량 데이터를 이미지 형태로 변환하여 예후 예측이 효과적으로 특징 선택 및 예후 예측을 수행할 수 있는 기법을 제안한다. 유전자들 사이의 생물학적 상호작용 관계를 유전자 발현량 데이터에 통합하기 위해 Node2Vec을 활용하였으며, 2차원 이미지로 표현된 발현량 데이터를 효과적으로 학습할 수 있도록 합성곱 신경망 모델을 사용하였다. 제안하는 모델의 성능은 이중 교차검증을 통해 평가되었고, 유전자 발현량 데이터를 그대로 이용하는 기계학습모델보다 우월한 예후 예측 정확도를 가지는 것이 확인되었다. Node2Vec을 이용한 유전자 발현량의 새로운 이미지 표현법은 특징 선택으로 인한 정보의 손실이 없어 예측 모델의 성능을 높일 수 있으며, 이러한 접근법이 개인 맞춤형 의학의 발전에 이바지할 것으로 기대한다.

An Efficient Functional Analysis Method for Micro-array Data Using Gene Ontology

  • Hong, Dong-Wan;Lee, Jong-Keun;Park, Sung-Soo;Hong, Sang-Kyoon;Yoon, Jee-Hee
    • Journal of Information Processing Systems
    • /
    • 제3권1호
    • /
    • pp.38-42
    • /
    • 2007
  • Microarray data includes tens of thousands of gene expressions simultaneously, so it can be effectively used in identifying the phenotypes of diseases. However, the retrieval of functional information from a large corpus of gene expression data is still a time-consuming task. In this paper, we propose an efficient method for identifying functional categories of differentially expressed genes from a micro-array experiment by using Gene Ontology (GO). Our method is as follows: (1) The expression data set is first filtered to include only genes with mean expression values that differ by at least 3-fold between the two groups. (2) The genes are then ranked based on the t-statistics. The 100 most highly ranked genes are selected as informative genes. (3) The t-value of each informative gene is imposed as a score on the associated GO terms. High-scoring GO terms are then listed with their associated genes and represent the functional category information of the micro-array experiment. A system called HMDA (Hallym Micro-array Data analysis) is implemented on publicly available micro-array data sets and validated. Our results were also compared with the original analysis.

빈발 유전자 발현 패턴과 연쇄 규칙을 이용한 유전자 조절 네트워크 구축 (Constructing Gene Regulatory Networks using Frequent Gene Expression Pattern and Chain Rules)

  • 이헌규;류근호;정두영
    • 정보처리학회논문지D
    • /
    • 제14D권1호
    • /
    • pp.9-20
    • /
    • 2007
  • 유전자들의 그룹은 복잡한 상호작용들을 통해 세포의 기능이 조절되며 이러한 상호작용을 하는 유전자 그룹들을 유전자 조절 네트워크 (GRNs: Gene Regulatory Networks)라고 한다. 이전의 유전자 발현 분석 기법인 군집화와 분류는 단지 상동성에 의한 유전자들 사이의 소속을 결정하는 데에는 유용하나 분자 활동에서의 같은 클래스에서 발견되어지는 유전자들 사이의 조절 관계를 식별할 수 없다. 더욱이 유전자들이 어떻게 연관되는 지와 유전자들이 서로 어떻게 조절하는지에 대한 매커니즘의 이해가 필요하다. 따라서 이 논문에서는 시계열 마이크로어레이 데이터로부터의 유전자들의 조절 관계를 발견하기 위해서 빈발 패턴 마이닝과 연쇄 규칙을 이용한 새로운 접근법을 제안하였다. 이 기법에서는 먼저, 빈발 패턴 마이닝 적용을 위한 적절한 데이터 변환 방법을 제안하였고 FP-growth을 이용하여 유전자 발현 패턴들을 발견한다. 그런 다음, 연쇄 규칙을 이용하여 빈발한 유전자 패턴들로부터 유전자 조절 네트워크를 구축하였다. 마지막으로 제안된 기법의 검증은 공개된 유전자들의 조절 관계와 실험 결과의 일치함을 보임으로써 평가하였다.

Selection and evaluation of reference genes for gene expression using quantitative real-time PCR in Mythimna separata walker (Lepidoptera: Noctuidae)

  • ZHANG, Bai-Zhong;LIU, Jun-Jie;CHEN, Xi-Ling;YUAN, Guo-Hui
    • Entomological Research
    • /
    • 제48권5호
    • /
    • pp.390-399
    • /
    • 2018
  • In order to precisely assess gene expression levels, the suitable internal reference genes must be served to quantify real-time reverse transcription polymerase chain reaction (RT-qPCR) data. For armyworm, Mythimna separata, which reference genes are suitable for assessing the level of transcriptional expression of target genes have yet to be explored. In this study, eight common reference genes, including ${\beta}$-actin (${\beta}$-ACT), 18 s ribosomal (18S), 28S ribosomal (28S), glyceraldehyde-3-phosphate (GAPDH), elongation fator-alpha ($EF1{\alpha}$), TATA box binding protein (TBP), ribosomal protein L7 (RPL7), and alpha-tubulin (${\alpha}$-TUB) that in different developmental stages, tissues and insecticide treatments of M. separata were evaluated. To further explore whether these genes were suitable to serve as endogenous controls, three software-based approaches (geNorm, BestKeeper, and NormFinder), the delta Ct method, and one web-based comprehensive tool (RefFinder) were employed to analyze and rank the tested genes. The optimal number of reference genes was determined using the geNorm program, and the suitability of particular reference genes was empirically validated according to normalized HSP70, and MsepCYP321A10 gene expression data. We found that the most suitable reference genes for the different experimental conditions. For developmental stages, 28S/RPL7 were the optimal reference genes, both $RPL7/EF1{\alpha}$ were suitable for experiments of different tissues, whereas for insecticide treatments, $28S/{\alpha}-TUB$ were suitable for normalizations of expression data. In addition, $28S/{\alpha}-TUB$ were the suitable reference genes because they have the most stable expression among different developmental stages, tissues and insecticide treatments. Our work is the first report on reference gene selection in M. separata, and might serve as a precedent for future gene expression studies.

쥐 해마의 유전자 발현 그리드 데이터를 이용한 특징기반 유전자 분류 및 영역 군집화 (Feature-based Gene Classification and Region Clustering using Gene Expression Grid Data in Mouse Hippocampal Region)

  • 강미선;김혜련;이석찬;김명희
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.54-60
    • /
    • 2016
  • 뇌의 유전자 발현 정보는 영역별 기능과 밀접한 관련이 있어 이를 분석하기 위해 다수의 유전자들 간의 발현 정도 및 발현 위치 정보와의 관계에 대한 연구가 이루어지고 있다. 본 논문에서는 컴퓨터 기술을 통해 알렌 뇌과학연구소에서 제공하는 약 2만여개의 쥐 뇌 유전자 발현 정보 중 뇌의 해마 영역을 중점적으로 분석하여 유전자들을 자동으로 분류해내고 발현 위치 정보를 기반으로 군집화하여 가시화하는 방법을 제안한다. 이를 통해 해마 내 전체적으로 발현되는 유전자들과 특정 영역에만 발현되는 유전자들을 분류할 수 있었고 그 중 특정 영역에 발현되는 유전자들의 위치정보 기반으로 군집화된 데이터를 뇌 지도와 함께 관찰 할 수 있었다. 본 연구는 뇌의 기능과 영역과의 관계성 관련 생물학적 연구를 위한 실험군 선정작업에 이용되어 실험설계시간을 줄일 수 있고 기존에 알려진 뇌의 해부학적 구조보다 더욱 세분화된 구조를 발견할 수 있는 가능성을 제시할 것으로 기대된다.

GEDA: New Knowledge Base of Gene Expression in Drug Addiction

  • Suh, Young-Ju;Yang, Moon-Hee;Yoon, Suk-Joon;Park, Jong-Hoon
    • BMB Reports
    • /
    • 제39권4호
    • /
    • pp.441-447
    • /
    • 2006
  • Abuse of drugs can elicit compulsive drug seeking behaviors upon repeated administration, and ultimately leads to the phenomenon of addiction. We developed a procedure for the standardization of microarray gene expression data of rat brain in drug addiction and stored them in a single integrated database system, focusing on more effective data processing and interpretation. Another characteristic of the present database is that it has a systematic flexibility for statistical analysis and linking with other databases. Basically, we adopt an intelligent SQL querying system, as the foundation of our DB, in order to set up an interactive module which can automatically read the raw gene expression data in the standardized format. We maximize the usability of this DB, helping users study significant gene expression and identify biological function of the genes through integrated up-to-date gene information such as GO annotation and metabolic pathway. For collecting the latest information of selected gene from the database, we also set up the local BLAST search engine and non-redundant sequence database updated by NCBI server on a daily basis. We find that the present database is a useful query interface and data-mining tool, specifically for finding out the genes related to drug addiction. We apply this system to the identification and characterization of methamphetamine-induced genes' behavior in rat brain.

Xperanto: A Web-Based Integrated System for DNA Microarray Data Management and Analysis

  • Park, Ji Yeon;Park, Yu Rang;Park, Chan Hee;Kim, Ji Hoon;Kim, Ju Ha
    • Genomics & Informatics
    • /
    • 제3권1호
    • /
    • pp.39-42
    • /
    • 2005
  • DNA microarray is a high-throughput biomedical technology that monitors gene expression for thousands of genes in parallel. The abundance and complexity of the gene expression data have given rise to a requirement for their systematic management and analysis to support many laboratories performing microarray research. On these demands, we developed Xperanto for integrated data management and analysis using user-friendly web-based interface. Xperanto provides an integrated environment for management and analysis by linking the computational tools and rich sources of biological annotation. With the growing needs of data sharing, it is designed to be compliant to MGED (Microarray Gene Expression Data) standards for microarray data annotation and exchange. Xperanto enables a fast and efficient management of vast amounts of data, and serves as a communication channel among multiple researchers within an emerging interdisciplinary field.

Endo-sulfatase Sulf-1 Protein Expression is Down-regulated in Gastric Cancer

  • Gopal, Gopisetty;Shirley, Sundersingh;Raja, Uthandaraman Mahalinga;Rajkumar, Thangarajan
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권2호
    • /
    • pp.641-646
    • /
    • 2012
  • In our recent report on gene expression in gastric cancer we identified the endo-sulfatase Sulf-1 gene to be up-regulated in gastric tumors relative to apparently normal (AN), and paired normal (PN) gastric tissue samples. In the present report we investigate the protein expression levels of Sulf-1 gene in gastric tumors, AN and PN samples using tissue microarray (TMA) and immunohistochemistry. Expression data was collected from two sets of TMA's containing replicate sections of tissue samples. Scoring data from TMA set-1 revealed a significant difference in Sulf-1 immunoreactivity between tumors and "normals" (PN and AN) (p-value = 0.001928). Also, Sulf-1 expression in tumors was also significantly different from either PN (p-value = 0.019) or AN (p-value = 0.006) samples. Similar results were obtained from analysis of scoring data from the second set of arrays. Comparison of mRNA expression and protein expression in gastric tumor tissues revealed that in 6/20 (30%) tumor samples showed up-regulated protein expression concordant with over-expression of mRNA. However, a discord with mRNA being over-expressed relative to down regulated protein expression was observed in majority 14/20 (70%) of tumor samples. Our study indicates down regulation of Sulf-1 protein expression in gastric tumors relative to PN and AN samples which is discordant with mRNA over-expression seen in tumors.

효모 마이크로어레이 유전자 발현데이터에 대한 가우시안 과정 회귀를 이용한 유전자 선별 및 군집화 (Screening and Clustering for Time-course Yeast Microarray Gene Expression Data using Gaussian Process Regression)

  • 김재희;김태훈
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.389-399
    • /
    • 2013
  • 본 연구에서는 가우시안 과정회귀방법을 소개하고 시계열 마이크로어레이 유전자 발현데이터에 대해 가우시안 과정회귀를 적용한 사례를 보이고자한다. 가우시안 과정회귀를 적합하여 로그 주변우도함수 비를 이용한 유전자를 선별방법에 대한 모의실험을 통해 민감도, 특이도, 위발견율 등을 계산하여 선별방법으로의 활용성을 보였다. 실제 효모세포주기 데이터에 대해 제곱지수공분산함수를 고려한 가우시안 과정회귀를 적합하여 로그 주변우도함수 비를 이용하여 차변화된 유전자를 선별한 후, 선별된 유전자들에 대해 가우시안 모형기반 군집화를 하고 실루엣 값으로 군집유효성을 보였다.