• 제목/요약/키워드: Gene ontology (GO)

검색결과 132건 처리시간 0.031초

Integrative Analysis of Microarray Data with Gene Ontology to Select Perturbed Molecular Functions using Gene Ontology Functional Code

  • Kim, Chang-Sik;Choi, Ji-Won;Yoon, Suk-Joon
    • Genomics & Informatics
    • /
    • 제7권2호
    • /
    • pp.122-130
    • /
    • 2009
  • A systems biology approach for the identification of perturbed molecular functions is required to understand the complex progressive disease such as breast cancer. In this study, we analyze the microarray data with Gene Ontology terms of molecular functions to select perturbed molecular functional modules in breast cancer tissues based on the definition of Gene ontology Functional Code. The Gene Ontology is three structured vocabularies describing genes and its products in terms of their associated biological processes, cellular components and molecular functions. The Gene Ontology is hierarchically classified as a directed acyclic graph. However, it is difficult to visualize Gene Ontology as a directed tree since a Gene Ontology term may have more than one parent by providing multiple paths from the root. Therefore, we applied the definition of Gene Ontology codes by defining one or more GO code(s) to each GO term to visualize the hierarchical classification of GO terms as a network. The selected molecular functions could be considered as perturbed molecular functional modules that putatively contributes to the progression of disease. We evaluated the method by analyzing microarray dataset of breast cancer tissues; i.e., normal and invasive breast cancer tissues. Based on the integration approach, we selected several interesting perturbed molecular functions that are implicated in the progression of breast cancers. Moreover, these selected molecular functions include several known breast cancer-related genes. It is concluded from this study that the present strategy is capable of selecting perturbed molecular functions that putatively play roles in the progression of diseases and provides an improved interpretability of GO terms based on the definition of Gene Ontology codes.

GO Guide : 생물학 온톨로지를 위한 브라우저 및 질의 변환 (GO Guide : Browser & Query Translation for Biological Ontology)

  • 정준원;박형우;임동혁;이강표;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제12권3호
    • /
    • pp.183-191
    • /
    • 2006
  • 생물학 분야에서 유전자에 대한 연구가 활발하게 이루어지면서 유전자에 대한 정보 구축 및 통합에 대한 필요성이 대두 되었다. 그 결과 Gene Ontology Consortium은 W3C에서 제정한 온톨로지 기술언어인 OWL로 유전자에 대한 정보와 분류를 담고 있는 Gene Ontology를 구축하였다. 하지만 Gene Ontology를 위한 기존의 브라우저들은 키워드, 트리, 그래프 기반의 단순 검색만을 지원할 뿐 다양한 관계를 고려한 고급 정보 검색이 불가능하다. 본 논문은 실제 생물학 연구를 수행하는 사용자들이 Gene Ontology를 효과적이고 편리하게 사용할 수 있도록 하기 위해 다양한 온톨로지 검색 기법을 통합적으로 지원하는 방법을 제안하였다. 또한 질의어 입력대신 검색 중에 손쉽게 질의를 생성하는 기법과 생성된 질의를 SeRQL 질의로 변환하는 기법을 제안함으로써 온톨로지에서 지원하는 질의어에 독립적으로 손쉽게 질의를 생성하고 고급정보를 얻을 수 있도록 하였다. 그리고 이렇게 구축한 GO Guide 브라우저를 통해 Gene Ontology의 방대한 정보를 효과적으로 이용할 수 있음을 확인하였다.

분산 생물정보 DB 에 대한 GO 기반의 통합 시맨틱 질의 기법 (Integrated Semantic Querying on Distributed Bioinformatics Databases Based on GO)

  • 박형우;정준원;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제12권4호
    • /
    • pp.219-228
    • /
    • 2006
  • 최근 여러 생물학 연구 집단들은 연구의 효율 향상을 위해 그들의 연구 결과를 서로 공유하기 위한 노력을 하고 있다. 뿐만 아니라, 공통의 어휘를 이용하여 유전자의 기능을 기술하기 위해 통제된 어휘들로 이루어진 Gene Ontology(GO) 라는 온툴로지를 구축하였다. 하지만 현재까지도 각 연구 집단들의 데이타는 분산되어 있고, 기존의 시스템들은 이처럼 분산된 데이타들에 대한 통합 질의를 지원하지 않고 있을 뿐 아니라, 각 연구 집단의 독자적인 어휘들과 GO 와의 대응 관계에 대한 의미가 명확하게 기술되어 있지 않아 통합 시맨틱 질의가 근본적으로 불가능한 상태이다. 본 논문에서는 대응 관계의 의미를 결정하는 기법과, 통합 시맨틱 질의를 지원하는 인터페이스를 제안하였다. 먼저, 문자열 규칙과 다중도 분석 등을 통해 이러한 대응 관계의 의미를 반자동으로 결정해 주고 이렇게 결정된 대응 관계의 의미를 GO 와 통합하여 통합 온톨로지를 생성해 주는 AutoGOA 시스템을 제안하였다. 또한, 대표적인 메타데이타 기술 모델인 RDF 모델을 이용하여 여러 데이타들을 통합하고 이렇게 생성된 통합 온툴로지를 이용하여 통합 시맨틱 질의를 지원하는 인터페이스인 GOGuide II 를 제안하였다.

GORank: Gene Ontology를 이용한 유전자 산물의 의미적 유사성 검색 (GORank: Semantic Similarity Search for Gene Products using Gene Ontology)

  • 김기성;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.682-692
    • /
    • 2006
  • 유사한 생물학적 특성을 가진 유전자 산물을 검색하는 것은 생물정보학 연구에 필수적인 기술이다. 현재 대부분의 생물학 데이타베이스에서 Gene Ontology의 용어를 사용하여 유전자 산물의 생물학적 특성을 기술하고 있다. 본 논문에서는 이런 유전자 산물의 주석 정보를 사용해 의미적으로 유사한 유전자 산물을 검색하는 방법을 제안한다. 이를 위해 우선 정보 이론에 기반한 유전자 산물간의 의미적 유사도를 정의하였다. 그리고 이 유사도를 이용한 의미적 유사성 검색 알고리즘을 제안하였다. 의미적 유사성 검색을 처리하기 위해 Fagin의 문턱값 알고리즘(threshold algorithm)을 다음과 같이 변형한 기법을 사용하였다. 우선 사용하는 유사도 함수가 단조 증가 성질을 갖지 않기 때문에 유사도 함수에 맞는 문턱값을 재정의 하였다. 또 역색인 리스트의 구조를 사용하여 중간 검색을 생략할 수 있는 클러스터 스키핑 기법과 역색인 리스트 액세스 순서를 제안하였다. 실제 GO와 주석 정보를 이용하여 성능 평가를 했으며 제안한 알고리즘은 효율적인 알고리즘임을 보였다.

BINGO: Biological Interpretation Through Statistically and Graph-theoretically Navigating Gene $Ontology^{TM}$

  • Lee, Sung-Geun;Yang, Jae-Seong;Chung, Il-Kyung;Kim, Yang-Seok
    • Molecular & Cellular Toxicology
    • /
    • 제1권4호
    • /
    • pp.281-283
    • /
    • 2005
  • Extraction of biologically meaningful data and their validation are very important for toxicogenomics study because it deals with huge amount of heterogeneous data. BINGO is an annotation mining tool for biological interpretation of gene groups. Several statistical modeling approaches using Gene Ontology (GO) have been employed in many programs for that purpose. The statistical methodologies are useful in investigating the most significant GO attributes in a gene group, but the coherence of the resultant GO attributes over the entire group is rarely assessed. BINGO complements the statistical methods with graph-theoretic measures using the GO directed acyclic graph (DAG) structure. In addition, BINGO visualizes the consistency of a gene group more intuitively with a group-based GO subgraph. The input group can be any interesting list of genes or gene products regardless of its generation process if the group is built under a functional congruency hypothesis such as gene clusters from DNA microarray analysis.

유전자 온톨로지를 활용한 클러스터링 성능 향상 기법 (Improving Clustering Performance Using Gene Ontology)

  • 고송;강보영;김대원
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.802-808
    • /
    • 2009
  • 마이크로어레이 데이터의 클러스터링 성능을 향상시키기 위하여 유전자 온톨로지(GO)를 활용하는 연구가 최근 진행 중에 있다. 그 중 Biological Process(BP) GO를 활용한 Kustra et al.의 연구가 2006년에 소개된 바 있다. 본 연구는 Kustra et al.의 연구를 확장하여 일반적이고 실질적인 GO의 활용 방안을 위한 분석 결과를 제시하기 위하여 다양한 활용 방법을 적용한다. (1) GO의 거리를 측정하기 위하여 Lin et al, Resnik et al과 Jiang et al의 방법을 적용하였으며, (2) BP를 포함한 세 가지 GO 유형의 구조에 대해 적용하여 각 방법에 따른 성능 향상 정도를 분석한다. 각 방법에 대한 성능 분석 비교를 위하여 효모 유전자를 관측하여 형성한 데이터를 활용한다. 실험 결과를 통하여 GO 정보를 클러스터링에 적용하면 전반적으로 성능 향상을 유도하지만, 활용 방법에 따라서 성능 개선 정도의 차이가 발생한다. 그 중 Resnik의 거리 측정 척도와 BP GO를 활용하였을 때, 가장 개선된 성능을 유도함을 볼 수 있다.

An Efficient Functional Analysis Method for Micro-array Data Using Gene Ontology

  • Hong, Dong-Wan;Lee, Jong-Keun;Park, Sung-Soo;Hong, Sang-Kyoon;Yoon, Jee-Hee
    • Journal of Information Processing Systems
    • /
    • 제3권1호
    • /
    • pp.38-42
    • /
    • 2007
  • Microarray data includes tens of thousands of gene expressions simultaneously, so it can be effectively used in identifying the phenotypes of diseases. However, the retrieval of functional information from a large corpus of gene expression data is still a time-consuming task. In this paper, we propose an efficient method for identifying functional categories of differentially expressed genes from a micro-array experiment by using Gene Ontology (GO). Our method is as follows: (1) The expression data set is first filtered to include only genes with mean expression values that differ by at least 3-fold between the two groups. (2) The genes are then ranked based on the t-statistics. The 100 most highly ranked genes are selected as informative genes. (3) The t-value of each informative gene is imposed as a score on the associated GO terms. High-scoring GO terms are then listed with their associated genes and represent the functional category information of the micro-array experiment. A system called HMDA (Hallym Micro-array Data analysis) is implemented on publicly available micro-array data sets and validated. Our results were also compared with the original analysis.

Gene Set Analyses of Genome-Wide Association Studies on 49 Quantitative Traits Measured in a Single Genetic Epidemiology Dataset

  • Kim, Jihye;Kwon, Ji-Sun;Kim, Sangsoo
    • Genomics & Informatics
    • /
    • 제11권3호
    • /
    • pp.135-141
    • /
    • 2013
  • Gene set analysis is a powerful tool for interpreting a genome-wide association study result and is gaining popularity these days. Comparison of the gene sets obtained for a variety of traits measured from a single genetic epidemiology dataset may give insights into the biological mechanisms underlying these traits. Based on the previously published single nucleotide polymorphism (SNP) genotype data on 8,842 individuals enrolled in the Korea Association Resource project, we performed a series of systematic genome-wide association analyses for 49 quantitative traits of basic epidemiological, anthropometric, or blood chemistry parameters. Each analysis result was subjected to subsequent gene set analyses based on Gene Ontology (GO) terms using gene set analysis software, GSA-SNP, identifying a set of GO terms significantly associated to each trait ($p_{corr}$ < 0.05). Pairwise comparison of the traits in terms of the semantic similarity in their GO sets revealed surprising cases where phenotypically uncorrelated traits showed high similarity in terms of biological pathways. For example, the pH level was related to 7 other traits that showed low phenotypic correlations with it. A literature survey implies that these traits may be regulated partly by common pathways that involve neuronal or nerve systems.

유전자군 분석의 방법론과 응용 (A Method for Gene Group Analysis and Its Application)

  • 이태원
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.269-277
    • /
    • 2012
  • 마이크로어레이 분석은 특이 발현하는 개별적인 유전자보다 유전자 온톨로지(Gene Ontology)와 같이 기능적 분류나 생물학적 경로(pathway)와 관련된 유전자군을 찾아내는 것이 그 해석의 용이성 때문에 최근 더욱 많은 연구가 진행되고 있다. 약물 처리에 의한 생물학적 반응을 연구할 때, 한 유전자군에 속하는 유전자들 각각의 특이 발현 여부의 유의성을 나타내는 $p$-value들을 취합하여 그 유전자군의 유의성을 결정하는 통계 검증 방법을 본 논문에서 소개하였다. 본 논문에 제시된 유전자군 분석(Gene group analysis) 방법은 Fisher's exact test나 permutation test와 같은 기존의 대표적인 방법들보다 더 정확하고 적용범위가 넓음을 실재 생물학 실험 자료의 분석을 통해 보였다. 제시된 유전자군 분석 방법은 SAS 프로그램으로 구현되었고 저자의 홈페이지(http://cafe.daum.net/go.analysis)에서 내려 받아 사용할 수 있다.

GoBean: a Java GUI application for visual exploration of GO term enrichments

  • Lee, Sang-Hyuk;Cha, Ji-Young;Kim, Hyeon-Jin;Yu, Ung-Sik
    • BMB Reports
    • /
    • 제45권2호
    • /
    • pp.120-125
    • /
    • 2012
  • We have developed a biologist-friendly, Java GUI application (GoBean) for GO term enrichment analysis. It was designed to be a comprehensive and flexible GUI tool for GO term enrichment analysis, combining the merits of other programs and incorporating extensive graphic exploration of enrichment results. An intuitive user interface with multiple panels allows for extensive visual scrutiny of analysis results. The program includes many essential and useful features, such as enrichment analysis algorithms, multiple test correction methods, and versatile filtering of enriched GO terms for more focused analyses. A unique graphic interface reflecting the GO tree structure was devised to facilitate comparisons of multiple GO analysis results, which can provide valuable insights for biological interpretation. Additional features to enhance user convenience include built in ID conversion, evidence code-based gene-GO association filtering, set operations of gene lists and enriched GO terms, and user -provided data files. It is available at http://neon.gachon.ac.kr/GoBean/.