• Title/Summary/Keyword: 유전자 기능 예측

Search Result 100, Processing Time 0.028 seconds

Pathway Reconstruction System using Orthlogs Database (Ortholog 데이터베이스를 이용한 생물 경로 재구축 시스템)

  • Jung, Tae-Sung;Oh, Jeong-Su;Cho, Wan-Sup
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.280-282
    • /
    • 2005
  • 현재 국내외 적으로 많은 대사경로 재구축을 위한 소프트웨어들이 개발 보급되고 있다. 그러나 기존의 소프트웨어들은 유전자 서열의 주해 작업이 끝난 게놈에 대해서만 가능하다. 따라서 대사경로를 예측하고자 할 경우는 주해 작업이 선행되어야 하는 어려움이 있었다. 본 논문에서는 주해 작업이 완료되지 않은 유전자 서열로부터 유전자의 기능 예측뿐만 아니라 대사경로를 예측할 수 있는 시스템을 제안한다. 제안된 시스템은 Orthologous 데이터베이스를 활용하여 새롭게 밝혀진 유전자 서열을 대상으로 비교적 정확성이 높은 대사경로를 예측하는 기능을 제공한다. 이 방법을 통해 주해 작업이 완료되지 않은 유전자 서열을 이용하여 서열 내에 포함된 유전자의 기능을 예측할 뿐만 아니라 예측된 유전자 정보를 이용하여 대사 경로를 예측할 수 있다.

  • PDF

Gene Prediction Using Phylogenomics and COG (계통유전체학과 COG를 이용한 유전자 기능예측)

  • 신창진;강병철;박준형;신동훈;김철민
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.04a
    • /
    • pp.255-258
    • /
    • 2004
  • 본 연구는 유전자 기능예측에 있어서 유사성 검색과 비교유전체학이 가진 한계를 극복하기 위하여 9종의 Human Herpesvirus를 대상으로 COG와 계통유전학적 방법을 적용하여 향상된 유전자 기능예측을 하고자 하였다. COG의 방법을 이용하여 114 HCOGs (Human Herpesvvirus COGs)를 구축하고, HCOGs를 바탕으로 유전자 컨텐츠트리를 제작하였다. 이 트리를 통하여 각 HCOG는 $\alpha$-특이적 그룹, $\beta$-특이적 그룹, $\alpha$, $\beta$, ${\gamma}$ -특이적 그룹 중 하나에 속함을 보였다. 계통유전체학의 적용을 위하여 u, $\beta$, ${\gamma}$ -특이 그룹에 속하는 ORF중 DNA polymerase를 이용하여 종트리를 제작하였다. SDI (Speciation and Duplication) 알고리즘을 통하여 148개의 당단백질에서 47개의 복제점을 예측하였고, 초기 HCOG의 제작에서 제외되었던 7 ORF는 당단백질과 관련된 5개의 HCOG로 재 정의 하였다. 이 연구를 통하여 COG는 ortholog 그룹을 를러스터링하는데 효과적인 방법이며, 이를 더욱 보완할 수 있는 방법으로 비교유전체학이 사용될 수 있음을 확인하였다. 이는 비교유전체학의 방법과 계통유전체학적 방법을 조화시켜 유전자 기능 예측을 보완할 수 있음을 보여 주었다.

  • PDF

Research for clustering algorithm for the functional classification of genes (유전자의 기능분류를 위한 클러스터링 알고리즘 연구)

  • Han, Seok-Hyeon;Yi, Gangman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1149-1151
    • /
    • 2015
  • 차세대 유전정보 분석기 시퀀서의 개발은 양질의 시퀀싱 데이터를 증가시켰다. 수많은 유전정보는 유전자 분석의 새로운 연구 방향을 제시하였다. 본 논문은 유전자 분석 중에서 기존의 유전정보를 활용하여 유전자의 기능예측을 하고자 한다. 클러스터링 알고리즘의 정확도를 높이기 위해서 본 논문에서는 데이터 유사성 조절이 가능한 클러스터링 알고리즘을 적용하였다. 그 결과 데이터 유사성 조절을 할 경우에 그렇지 않을 경우보다 유전자 기능 예측의 정확도가 높아졌다. 따라서 제안된 데이터 유사성 조절 기법은 유전자 기능을 예측하는 방법에 정확도를 높일 수 있을 것으로 기대된다.

Preprocessing Model for Operon Prediction Using Relative Distance of Genes and COG Distance (COG 거리와 유전자 간의 상대 위치정보를 이용한 오페론 예측 전처리 모델)

  • Chun, Bong-Kyung;Jang, Chul-Jin;Kang, Eun-Mi;Cho, Hwan-Gue
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2003.10a
    • /
    • pp.210-219
    • /
    • 2003
  • 오페론(operon)은 보통 미생물에서 다수의 인접한 유전자들로 구성된 그룹으로 하나의 유전자처럼 공통된 프로모터에 의해 전사되는 단위이다. 오페론을 구성하는 유전자들은 기능적으로 서로 유사하거나 같은 물질대사경로(metabolic pathway) 상에 존재하는 특징을 지니기 때문에 이들은 중요한 의미를 가지며, 미생물 유전체 분석에서 오페론을 구성하는 유전자들을 예측하는 것은 상당히 중요하다. 오페론을 예측하는 이전 연구들로는 이미 알려진 오페론의 특징인 유전자간 거리나 오페론을 구성하는 평균 유전자 개수 등을 이용하는 방법, 마이크로어레이 발현 실험을 이용한 방법, 전유전체(whole genome)들 간의 보존된 유전자 집합(conserved gene cluster)을 이용한 방법 그리고 물질대사경로를 이용한 방법 등이 있다. 본 논문에서는 COG 기능(function) 거리, 유전자 간의 거리, 코돈 사용빈도(codon usage) 그리고COG 기능 거리와 유전자간 거리를 같이 적용한 방법을 이용하여 오페론 예측을 위한 전처리 모델을 생성하였다 전처리 모델을 E. coli 전유전체에 적용해본 결과, 알려진 오페론들의 약 90%가 이를 포함하였다. 따라서 본 논문에서 제시한 전처리 모델은, 추후 오페론 예측을 위한 좋은 도구로 활용할 수 있을 것이다.

  • PDF

Predicting RNA Pseudoknots Using a Genetic Algorithm (유전자 알고리즘을 이용한 RNA Pseudoknot 예측)

  • 이동규;한경숙
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.682-684
    • /
    • 2002
  • RNA 분자의 pseudoknot 구조는 이차 구조의 loop에 있는 염기와 이 loop 외부에 있는 염기와의 결합으로 생성되는 삼차 구조 요소이다. pseudoknot은 삼차 구조 형성에 필수적인 구조 요소일 뿐만 아니라, RNA 분자의 기능에 중요한 영향을 미친다. pseudoknot을 포함한 RNA 구조를 예측하는 문제는 매우 어려우며 많은 계산을 필요로 한다. 현재까지, 병렬 구조를 갖는 수퍼 컴퓨터에서 유전자 알고리즘을 이용한 프로그램의 예측 결과가 가장 우수하다고 알려져 있다. 그러나 이 프로그램은 수퍼 컴퓨터에서만 운용되기 때문에 일반 연구자가 쉽게 사용하기 어려운 단점이 있다. 본 논문은 유전자 알고리즘을 이용한 PC 기반의 pseudoknot 예측 프로그램에 대하여 기술한다. 실헙 결과는 PC 기반에서도 유전자 알고리즘을 이용하여 pseudoknot을 포함한 RNA 구조를 효과적으로 예측하고 있음을 보인다.

  • PDF

A Eukaryotic Gene Structure Prediction Program Using Duration HMM (Duration HMM을 이용한 진핵생물 유전자 예측 프로그램 개발)

  • Tae, Hong-Seok;Park, Gi-Jeong
    • Korean Journal of Microbiology
    • /
    • v.39 no.4
    • /
    • pp.207-215
    • /
    • 2003
  • Gene structure prediction, which is to predict protein coding regions in a given nucleotide sequence, is the most important process in annotating genes and greatly affects gene analysis and genome annotation. As eukaryotic genes have more complicated stuructures in DNA sequences than those of prokaryotic genes, analysis programs for eukaryotic gene structure prediction have more diverse and more complicated computational models. We have developed EGSP, a eukaryotic gene structure program, using duration hidden markov model. The program consists of two major processes, one of which is a training process to produce parameter values from training data sets and the other of which is to predict protein coding regions based on the parameter values. The program predicts multiple genes rather than a single gene from a DNA sequence. A few computational models were implemented to detect signal pattern and their scanning efficiency was tested. Prediction performance was calculated and was compared with those of a few commonly used programs, GenScan, GeneID and Morgan based on a few criteria. The results show that the program can be practically used as a stand-alone program and a module in a system. For gene prediction of eukaryotic microbial genomes, training and prediction analysis was done with Saccharomyces chromosomes and the result shows the program is currently practically applicable to real eukaryotic microbial genomes.

An XML-Based Analysis Tool for Gene Prediction Results (XML기반의 유전자 예측결과 분석도구)

  • Kim Jin-Hong;Byun Sang-Hee;Lee Myung-Joon;Park Yang-Su
    • The KIPS Transactions:PartD
    • /
    • v.12D no.5 s.101
    • /
    • pp.755-764
    • /
    • 2005
  • Recently, as it is considered more important to identify the function of ail unknown genes in living things, many tools for gene prediction have been developed to identify genes in the DNA sequences. Unfortunately, most of those tools use their own schemes to represent their programs results, requiring researchers to make additional efforts to understand the result generated by them So, it is desirable to provide a standardized method of representing predicted gene information, which makes it possible to automatically produce the predicted results for a given set of gene data In this paper, we describe an effective U representation for various predicted gene information, and present an XML-based analysis tool for gene predication results based on this representation. The developed system helps users of gene prediction tools to conveniently analyze the predicted results and to automatically produce the statistical results of the prediction. To show the usefulness of the tool, we applied our programs to the results generated by GenScan and GeneID, which are widely used gene prediction systems.

Research for novel clustering algorithm for protein functional analysis (단백질의 기능 분석을 위한 클러스터링 알고리즘 연구)

  • Han, Seok-Hyeon;Yi, Gangman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.737-740
    • /
    • 2015
  • 유전자의 기능분석이 필요한 유전자 데이터의 양의 증가로 기능분석을 위한 다양한 연구들이 진행되고 있다. 단백질의 기능과 구조가 밝혀지지 않은 새로운 단백질들의 그 기능을 예측하기 위해 제안된 가중치를 제안하여 새로운 클러스터링 알고리즘을 개발하였다. 단백질의 기능을 계통에 따라 구별하고 있는 pfam의 protein family database를 이용하여 기능을 알지 못하는 단백질에 대해 protein family를 분류하는 방법을 제안하고, 이미 알고있는 데이터를 이용하여 제안된 방법의 기능분석 및 성능을 평가하고자 한다.

Inference of Gene Regulatory Program using Local Alignment (지역정렬을 이용한 유전자 발현 조절 프로그램 예측)

  • Lee, Ji-Yeon;Jin, Hee-Jeong;Cho, Hwan-Gue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10a
    • /
    • pp.11-16
    • /
    • 2006
  • 세포의 활동은 단순히 하나의 유전자의 발현으로 설명되기보다 여러 유전자와 그로 인해 생성된 단백질의 상호 작용에 의해 나타난다. 또한 마이크로어레이 실험을 통해 세포 내의 유전자 발현에 대한 정보를 알 수 있게 되고, Chromatin IP 마이크로어레이 실험을 통해 신뢰도가 높은 유전자 발현 조절 관계 데이터를 얻을 수 있게 되면서, 유사한 기능과 유사한 발현 패턴을 보이는 유전자들을 그룹으로 묶어 유전자 모듈로 규정하고 이를 하나의 유전자 조절 네트워크로 구성하고, 분석하는 연구들이 진행되고 있다. 본 논문에서는 ChIP 실험 데이터와 유전자 발현 데이터를 이용하여 지역 정렬을 수행해 하나의 유전자 모듈을 조절하는 조절 프로그램을 예측하는 알고리즘에 대해 기술한다. 조절 프로그램은 유전자 조절 모듈을 조절하는 조절자들의 역할 및 발현 여부에 따른 유전자 조절 모듈 내 유전자들의 발현을 설명할 수 있는 것이다.

  • PDF

Constructing Gene Regulatory Networks using Temporal Relation Rules from 3-Dimensional Gene Expression Data (3차원 유전자 발현 데이터에서의 시간 관계 규칙을 이용한 유전자 상호작용 조절 네트워크 구축)

  • Meijing Li;Jin Hyoung Park;Heon Gyu Lee;Keun Ho Ryu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.340-343
    • /
    • 2008
  • 유전자들은 복잡한 상호작용을 통해 세포의 기능이 조절된다. 상호작용하는 유전자 그룹들을 유전자 조절 네트워크라고 한다. 기존의 유전자 조절 네트워크는 2D microarray 데이터를 이용하여 시간의 흐름에 따른 유전자간의 상호작용을 알 수가 없었다. 이 논문에서는 시간의 변화에 따른 유전자들 간의 조절관계를 살펴 볼 수 있는 조절네트워크 모델링의 방법을 제시한다. 유전자의 발현양을 표시하기 위해 이진 이산화 방법을 사용하였고 3D microarray 데이터에서 유전자 발현 패턴을 찾기 위해 Cube mining 알고리즘을 적용하였고, 유전자간의 관계를 밝히기 위해 시간 관계 규칙탐사 기법을 사용하여 유전자들 간의 시간 관계를 포함한 유전자 조절네트워크를 구축하였다. 이 연구는 시간의 흐름에 따른 유전자간의 상호작용을 알 수 있으며, 모델링된 조절 네트워크를 이용하여 기능이 아직 발견되지 않은 유전자들의 기능을 예측 할 수 있다.