• 제목/요약/키워드: Gene ontology

검색결과 303건 처리시간 0.021초

RNAseq 빅데이터에서 유전자 선택을 위한 밀집도-의존 정규화 기반의 서포트-벡터 머신 병합법 (Combining Support Vector Machine Recursive Feature Elimination and Intensity-dependent Normalization for Gene Selection in RNAseq)

  • 김차영
    • 인터넷정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.47-53
    • /
    • 2017
  • 고처리 시퀀싱과 빅데이터 및 크라우드 컴퓨팅에 혁신이 일어나면서, RNA 시퀀싱도 획기적인 변화가 일어, RNAseq가 기존의 DNA 마이크로어레이를 대체하여, 빅-데이터를 형성하고 있다. 현재, RANseq 이용한 유전자 조절망(GRN) 까지 연구가 활성화 되고 있는데, 그 중 한 분야가 GRN의 기본 요소인 특징 유전자를 빅-데이터에서도 구별하고 기존에 알려진 것 외에 새로운 역할을 찾는 것이다. 그러나, 이러한 연구 방향에 부합하는 빅-데이터를 처리할 수 있는 컴퓨테이션 방법이 아직까지 매우 부족하다. 따라서 본 논문에서는 RNAseq 빅-데이터를 처리할 수 있도록 기존의 SVM-RFE알고리즘을 밀집도-의존 정규화에 병합하여, NCBI-GEO와 같은 빅-데이터에서 공개된 일부의 데이터에 개선된 알고리즘을 적용하고 해당 알고리즘에 의해 나온 결과의 성능을 평가한다.

StrokeBase: A Database of Cerebrovascular Disease-related Candidate Genes

  • Kim, Young-Uk;Kim, Il-Hyun;Bang, Ok-Sun;Kim, Young-Joo
    • Genomics & Informatics
    • /
    • 제6권3호
    • /
    • pp.153-156
    • /
    • 2008
  • Complex diseases such as stroke and cancer have two or more genetic loci and are affected by environmental factors that contribute to the diseases. Due to the complex characteristics of these diseases, identifying candidate genes requires a system-level analysis of the following: gene ontology, pathway, and interactions. A database and user interface, termed StrokeBase, was developed; StrokeBase provides queries that search for pathways, candidate genes, candidate SNPs, and gene networks. The database was developed by using in silico data mining of HGNC, ENSEMBL, STRING, RefSeq, UCSC, GO, HPRD, KEGG, GAD, and OMIM. Forty candidate genes that are associated with cerebrovascular disease were selected by human experts and public databases. The networked cerebrovascular disease gene maps also were developed; these maps describe genegene interactions and biological pathways. We identified 1127 genes, related indirectly to cerebrovascular disease but directly to the etiology of cerebrovascular disease. We found that a protein-protein interaction (PPI) network that was associated with cerebrovascular disease follows the power-law degree distribution that is evident in other biological networks. Not only was in silico data mining utilized, but also 250K Affymetrix SNP chips were utilized in the 320 control/disease association study to generate associated markers that were pertinent to the cerebrovascular disease as a genome-wide search. The associated genes and the genes that were retrieved from the in silico data mining system were compared and analyzed. We developed a well-curated cerebrovascular disease-associated gene network and provided bioinformatic resources to cerebrovascular disease researchers. This cerebrovascular disease network can be used as a frame of systematic genomic research, applicable to other complex diseases. Therefore, the ongoing database efficiently supports medical and genetic research in order to overcome cerebrovascular disease.

Gene Expression Profiling of the Habenula in Rats Exposed to Chronic Restraint Stress

  • Yoo, Hyeijung;Kim, Hyun Jung;Yang, Soo Hyun;Son, Gi Hoon;Gim, Jeong-An;Lee, Hyun Woo;Kim, Hyun
    • Molecules and Cells
    • /
    • 제45권5호
    • /
    • pp.306-316
    • /
    • 2022
  • Chronic stress contributes to the risk of developing depression; the habenula, a nucleus in epithalamus, is associated with many neuropsychiatric disorders. Using genome-wide gene expression analysis, we analyzed the transcriptome of the habenula in rats exposed to chronic restraint stress for 14 days. We identified 379 differentially expressed genes (DEGs) that were affected by chronic stress. These genes were enriched in neuroactive ligand-receptor interaction, the cAMP (cyclic adenosine monophosphate) signaling pathway, circadian entrainment, and synaptic signaling from the Kyoto Encyclopedia of Genes and Genomes pathway analysis and responded to corticosteroids, positive regulation of lipid transport, anterograde trans-synaptic signaling, and chemical synapse transmission from the Gene Ontology analysis. Based on protein-protein interaction network analysis of the DEGs, we identified neuroactive ligand-receptor interactions, circadian entrainment, and cholinergic synapse-related subclusters. Additionally, cell type and habenular regional expression of DEGs, evaluated using a recently published single-cell RNA sequencing study (GSE137478), strongly suggest that DEGs related to neuroactive ligand-receptor interaction and trans-synaptic signaling are highly enriched in medial habenular neurons. Taken together, our findings provide a valuable set of molecular targets that may play important roles in mediating the habenular response to stress and the onset of chronic stress-induced depressive behaviors.

유전자 온톨로지를 이용한 마이크로어레이 데이터의 유전자 기능 분석 시스템의 개발 (Development of a Gene's Functional Classifying System for a Microarray Data using a Gene Ontology)

  • 이종근;박성수;홍동완;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.246-251
    • /
    • 2006
  • 마이크로어레이 실험은 수 천에서 수 만개의 유전자 발현 결과를 동시에 측정할 수 있어 질병의 발현 형질 분류 등에 유용하게 이용되고 있다. 그러나 마이크로어레이 실험은 동일한 플랫폼의 실험이라 할지라도 환경 등에 따라 그 실험 결과에 차이가 나는 등 오차를 항상 포함하고 있다. 또한 마이크로어레이 실험은 아직 고가의 실험으로 분류되어 다수의 샘플에 대한 반복 실험 결과를 얻기 어려운 상황이다. 따라서 이종의 플랫폼, 데이터 포맷, 정규화 기법 등이 서로 다른 데이터를 효율적으로 통합하여 유용한 정보를 추출하는 새로운 방식의 개발이 필요하다. 본 논문은 이와 같은 문제를 해결하기 위한 기초 단계 연구 결과이다. 마이크로어레이 실험 데이터로부터 통계적 방법을 이용하여 유의(informative) 유전자를 추출하고 유전자 온톨로지(Gene Ontology : GO)와의 연계를 통하여 유전자 정보의 기능적 분류 결과를 사용자에게 제공하는 유전자 기능 분석 시스템의 설계 및 구현 방안을 보인다. 본 시스템의 실험방법에서는 3-Fold Filtering 기법을 통하여 발현 차가 큰 유전자를 추출하고, t-검정 기법에 의하여 이들 유전자를 순위화 하였으며, 이 중 상위 100개의 유전자를 유의 유전자로 추출하였다. 다음, 이 들 유의 유전자의 t-검정 값을 GO의 유전자 기능을 나타내는 해당 텀 (term)에 가중치로 부과하여 각 유전자들과 기능적으로 연관성이 높은 텀들을 추출한다. 또한 본 연구의 유효성을 검증하기 위하여 본 시스템에 의한 마이크로어레이 데이터 분석 결과를 전문가에 의한 유전자 기능 분석 결과와 비교한다.투명성 있는 서비스를 제공하고 높은 신뢰성과 안정성이 확보될 수 있도록 구성하고자 한다. Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상 시킬 수 있는 Load Balancing System을 제안한다.할 때 가장 효과적인 라우팅 프로토콜이라고 할 수 있다.iRNA 상의 의존관계를 분석할 수 있었다.수안보 등 지역에서 나타난다 이러한 이상대 주변에는 대개 온천이 발달되어 있었거나 새로 개발되어 있는 곳이다. 온천에 이용하고 있는 시추공의 자료는 배제하였으나 온천이응으로 직접적으로 영향을 받지 않은 시추공의 자료는 사용하였다 이러한 온천 주변 지역이라 하더라도 실제는 온천의 pumping 으로 인한 대류현상으로 주변 일대의 온도를 올려놓았기 때문에 비교적 높은 지열류량 값을 보인다. 한편 한반도 남동부 일대는 이번 추가된 자료에 의해 새로운 지열류량 분포 변화가 나타났다 강원 북부 오색온천지역 부근에서 높은 지열류량 분포를 보이며 또한 우리나라 대단층 중의 하나인 양산단층과 같은 방향으로 발달한 밀양단층, 모량단층, 동래단층 등 주변부로 NNE-SSW 방향의 지열류량 이상대가 발달한다. 이것으로 볼 때 지열류량은 지질구조와 무관하지 않음을 파악할 수 있다. 특히 이러한 단층대 주변은 지열수의 순환이 깊은 심도까지 가능하므로 이러한 대류현상으로 지표부근까지 높은 지온 전달이 되어 나타나는 것으로 판단된다.의 안정된 방사성표지효율을 보였다. $^{99m}Tc$-transferrin을 이용한 감염영상을 성공적으로 얻을 수 있었으며, $^{67}Ga$-citrate

  • PDF

Full-Length Enriched cDNA Library Construction from Tissues Related to Energy Metabolism in Pigs

  • Lee, Kyung-Tai;Byun, Mi-Jeong;Lim, Dajeong;Kang, Kyung-Soo;Kim, Nam-Soon;Oh, Jung-Hwa;Chung, Chung-Soo;Park, Hae-Suk;Shin, Younhee;Kim, Tae-Hun
    • Molecules and Cells
    • /
    • 제28권6호
    • /
    • pp.529-536
    • /
    • 2009
  • Genome sequencing of the pig is being accelerated because of its importance as an evolutionary and biomedical model animal as well as a major livestock animal. However, information on expressed porcine genes is insufficient to allow annotation and use of the genomic information. A series of expressed sequence tags of 5' ends of five full-length enriched cDNA libraries (SUSFLECKs) were functionally characterized. SUSFLECKs were constructed from porcine abdominal fat, induced fat cells, loin muscle, liver, and pituitary gland, and were composed of non-normalized and normalized libraries. A total of 55,658 ESTs that were sequenced once from the 5′ ends of clones were produced and assembled into 17,684 unique sequences with 7,736 contigs and 9,948 singletons. In Gene Ontology analysis, two significant biological process leaf nodes were found: gluconeogenesis and translation elongation. In functional domain analysis based on the Pfam database, the beta transducin repeat domain of WD40 protein was the most frequently occurring domain. Twelve genes, including SLC25A6, EEF1G, EEF1A1, COX1, ACTA1, SLA, and ANXA2, were significantly more abundant in fat tissues than in loin muscle, liver, and pituitary gland in the SUSFLECKs. These characteristics of SUSFLECKs determined by EST analysis can provide important insight to discover the functional pathways in gene networks and to expand our understanding of energy metabolism in the pig.

Microarray를 이용한 pipernonaline의 인간 전립선 암세포에 대한 기능 조절 분석 (Regulation of Pipernonaline on Biological Functions of Human Prostate Cancer Cells Based on Microarray Analysis)

  • 김상헌;김광연;유선녕;박슬기;곽인석;이문수;방병호;전성식;안순철
    • 생명과학회지
    • /
    • 제22권11호
    • /
    • pp.1552-1557
    • /
    • 2012
  • Pipernonaline은 후추나무과에 속하는 필발(Piper longum Linn.)의 유도체로서 전립선 암세포에 대한 항암활성이 보고되고 있다. 하지만 실제 암세포 내에서 생물학적 정보를 가진 수 많은 유전자들에 대한 발현이 어떻게 이루어지고 있는지 알려진 바가 없다. 본 연구에 사용된 microarray 분석은 동시에 수 만개 이상의 유전자 발현양상을 한번에 관찰할 수 있는 기술로서 특정 질병의 유전학적 특성과 기전 연구를 더 광범위하게 연구 할 수 있는 기술이다. 본 연구에서는 전립선 암세포인 PC-3 세포에 pipernonaline을 처리하여 cDNA microarray를 실시하였다. 이후, DAVID database를 이용하여 gene ontology의 Biological Process를 분석하여 세포사멸과 세포주기, 세포성장 및 증식에 관련된 유전자들을 우선적으로 분석하였다. 그 결과, 세포주기관련 256개, 세포사멸관련 197개, 세포성장 및 증식관련에 154개의 유전자가 확인 되었다. 이러한 결과는 pipernonaline은 전립선 암세포 내에 존재하는 생물학적 신호전달체계에 관련된 유전자 발현을 조절함으로써 항암활성을 나타내 것을 알 수 있었고, 이후 이러한 microarray의 추가적인 분석은 암세포 내 새로운 유전자의 탐색 및 메커니즘을 규명하는데 유용하게 사용할 수 있을 것으로 사료된다.

동적인 개념을 적용한 알츠하이머 질병 네트워크의 특성 분석 (Characterization of the Alzheimer's disease-related network based on the dynamic network approach)

  • 김만선;김정래
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.529-535
    • /
    • 2015
  • 지금까지 생체 네트워크 분석 연구는 정적(static)인 개념으로만 다루어졌다. 그러나 실제 생명현상이 발생하는 세포 내에서는 세포의 상태 및 외부 환경에 따라 일부 단백질과 그 상호작용만이 선택적으로 활성화된다. 따라서 생체 네트워크의 구조가 시간의 흐름에 따라 변화하는 동적(dynamic)인 개념이 적용되어야 하며, 이런 개념은 질병의 진행 추이를 분석하는데 효율적이다. 본 논문에서는 동적인 네트워크 방법을 알츠하이머 질병에 적용하여 질병이 진행되는 단계에 따라 변화하는 단백질 상호작용 네트워크의 구조적, 기능적 특징에 대하여 분석하고자 한다. 우선, 유전자 발현데이터를 기반으로 각 질병의 진행 상태에 따른 부분 네트워크(정상, 초기, 중기, 말기)를 구축하였다. 이를 기반으로, 네트워크의 구조적 특성 분석을 수행하였다. 또한 기능적 특성 분석을 위해 유전자 군집(module)을 탐색하고, 군집별 유전자 기능(Gene Ontology) 분석을 수행했다. 그 결과, 네트워크의 특성들은 각 질병의 단계와 잘 대응되며, 동적 네트워크 분석법이 중요한 생물학적 이벤트를 설명하는데 이용될 수 있음을 보였다. 결론적으로 제안된 연구 방법을 통하여 그동안 알려지지 않았던 질병유발에 관련된 주요 네트워크 변화를 관측할 수 있고, 질병에 관여하는 복잡한 분자 수준의 발생 기작과 진행 과정을 이해하는데 중요한 정보를 획득할 수 있다.

아카풀코나리에서 Differential Slot Blot을 이용한 약발현 유전자 목록작성 (Cataloguing of Anther Expressed Genes through Differential Slot Blot in Oriental Lily (Lilium Oriental Hybrid 'Acapulco'))

  • 서은정;유희주;한봉희;임용표;정미정;이성곤;김동헌;장안철;예병우
    • 원예과학기술지
    • /
    • 제31권5호
    • /
    • pp.598-606
    • /
    • 2013
  • 약은 생식과 화형을 결정짓는 꽃의 주요한 기관 중 하나이다. 오리엔탈나리인 아카풀코로부터 만든 약 특이적 cDNA library로부터 2000개의 ESTs를 무작위로 선발하였다. 잎과 약을 cDNA 탐침으로 이용한 differential slot blot이 약에서 발현되는 클론들을 얻기 위해 사용되었으며 570개의 비반복적 ESTs를 얻었고 염기서열분석을 하였다. BLASTX 알고리즘을 이용하여 GenBank에 비교해서 191개의 클론이 의미 있는 유사성을 보였지만 나머지(66.5%)는 기존에 보고된 염기서열에 확인되지 않았다. Gene ontology(GO) annotation에 따른 기능분류결과 대체적으로 세포와 세포구성 부분에서 주요하게 단백질이 확인되었다. 7개의 다른 기관과 발달 단계에서 전사체 분석은 약특이적일 적으로 추정되는 30개의 클론을 가지고 노던혼성화반응을 이용하여 수행하였다. 이러한 결과는 differential slot blot을 이용하여 약에 발현되는 유전자를 선별하는 것이 매우 효과적인 방법인 것으로 간주되며 또한 지금의 연구가 앞으로 나리의 화분을 포함한 약에 대한 기초정보를 제공할 수 있을 것으로 생각한다.

단백질 기능 흐름 모델 구성 및 평가 기법 (A Method for Protein Functional Flow Configuration and Validation)

  • 장우혁;정석훈;한동수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.284-288
    • /
    • 2009
  • 단백질 상호작용의 예측 및 실험 결과가 대용량으로 배포되면서 바이오 정보 기술 연구자들은 생명체 내의 단백질 상호작용 네트워크를 구성하기 위해 노력하여 왔다. 일반적으로 대용량의 상호작용 데이터들은 많은 오류를 포함한다고 알려져 있으나, 최근 단백질의 물리 화학적 특성 및 구조를 기반으로 한 방법들이 실제 실험과 병행되어 고화질(High resolution)의 결과를 제공하게 되면서, 특정 종에 대한 단백질 상호작용 네트워크가 점차 완성되고 있다. 그러나, 단순 물리적 링크 수준의 단백질 상호작용 네트워크만으로는 특정 병원체의 발병 메커니즘 규명 등과 같은 응용분야의 활용에 한계가 있다. 본 논문에서는 실험을 통하여 보고된 신호 전달 경로(signaling transduction pathway)를 이용하여 단백질 기능 간의 관계를 방향성이 있는 그래프로 표현한 단백질 기능 흐름 모델을 제시한다. 제안하는 모델은 Gene Ontology에서 정의된 molecular function을 정점(vertex)으로 가지고 이들 사이의 관계를 간선(edge)으로 표현함으로써 특정 기능의 전이를 살펴볼 수 있다. 이러한 기능 흐름 모델은 수 만개의 정점(vertex)으로 구성된 단백질 상호작용 네트워크에서 의미 있는 경로를 추출하는 데에 제약 혹은 참조 조건으로 사용될 수 있어 향후 활용도가 클 것으로 기대한다. 평가는 KEGG에서 제공되는 11개의 인간 신호 전달 경로 각각에 대하여 대상 경로를 제외한 나머지로부터 생성된 모델과의 크론바하 알파 계수(Cronbach's alpha)를 측정하였고(${\alpha}=0.67$), 총 1023개의 흐름 중 ${\alpha}=0.6$ 이상의 신뢰도에 대하여 총 765개의 흐름을 가지는 기능 흐름 모델을 최종 구성하였다.

Microarray 분석을 이용한 대하 (Fenneropenaeus chinensis) 유생의 카드뮴 단기 노출에 따른 유전자변화 (Acute Toxicity of Cadmium on Gene Expression Profiling of Fleshy Shrimp, Fenneropenaeus Chinensis Postlarvae Using a cDNA Microarray)

  • 김수경;치오궈;윤종화;장인권
    • 한국환경과학회지
    • /
    • 제24권5호
    • /
    • pp.623-631
    • /
    • 2015
  • Microarray technology provides a unique tool for the determination of gene expression at the level of messenger RNA (mRNA). This study, the mRNA expression profiles provide insight into the mechanism of action of cadmium in Fleshy shrimp (Fenneropenaeus chinensis). The ability of genomic technologies was contributed decisively to development of new molecular biomarkers and to the determination of new possible gene targets. Also, it can be approach for monitoring of trace metal using oligo-chip microarray-based in potential model marine user level organisms. 15K oligo-chip for F. chinensis that include mostly unique sets of genes from cDNA sequences was developed. A total of 13,971 spots (1,181 mRNAs up- regulated and 996 down regulated) were identified to be significantly expressed on microarray by hierarchical clustering of genes after exposure to cadmium for different conditions (Cd24-5000 and Cd48-1000). Most of the changes of mRNA expression were observed at the long time and low concentration exposure of Cd48-1000. But, gene ontology analysis (GO annotation) were no significant different between experiments groups. It was observed that mRNA expression of main genes involved in metabolism, cell component, molecular binding and catalytic function. It was suggested that cadmium inhibited metabolism and growth of F. chinensis.