• 제목/요약/키워드: orthologous groups

검색결과 41건 처리시간 0.017초

An Orthologous Group Clustering Technique based on the Grid Computing

  • Oh, J.S.;Kim, T.K.;Kim, S.S.;Kwon, H.R.;Kim, Y.C.;Yoo, J.S.;Cho, W.S.
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.72-77
    • /
    • 2005
  • Orthologs are genes having the same function across different species that specialize from a single gene in the last common ancestor of these species. Orthologous groups are useful in the genome annotation, studies on gene evolution, and comparative genomics. However, the construction of an orthologous group is difficult to automate and it takes so much time. It is also hard to guarantee the accuracy of the constructed orthologous groups. We propose a system to construct orthologous groups on many genomes automatically and rapidly. We utilize the grid computing to reduce the sequence alignment time, and we use clustering algorithm in the application of database to automate whole processes. We have generated orthologous groups for 20 complete prokaryotes genomes just in a day because of the grid computing. Furthermore, new genomes can be accommodated easily by the clustering algorithm and grid computing. We compared the generated orthologous groups with COGs (Clusters of orthologous Group of proteins) and KO (KEGG Ortholog). The comparison shows about 85 percent similarity compared with previous well-known orthologous databases.

  • PDF

원핵생물과 공통인 진핵생물의 보존적 유전자 탐색 (Investigation of Conserved Genes in Eukaryotes Common to Prokaryotes)

  • 이동근
    • 생명과학회지
    • /
    • 제23권4호
    • /
    • pp.595-601
    • /
    • 2013
  • 생물들에서 생명의 본질적 기능을 수행하는 단백질들의 종류와 보존성을 밝히기 위해 COG (Clusters of Orthologous Groups of proteins) 알고리즘을 이용하였다. 66종의 미생물에서 보존적인 63개의 ortholog 그룹들은 진핵생물 7종에서 104개의 ortholog들로 확산되었으며, 7종 모두의 핵에 보존적인 KOG (euKaryotic Orthologous Group)은 71개였다. 71개 중 단백질 합성에 관여하는 유전자들이 총 54개로 생명현상에서의 단백질의 중요성을 확인할 수 있었다. Distance value로 보존적 유전자가 생물종 사이에 나타내는 유전자 변이의 정도를 파악하니 'Translation initiation factor'인 KOG3403과 KOG3271 그리고 'Prolyl-tRNA synthetase' (KOG4163) 등이 높은 보존성을 보였다. 보존적 KOG들의 평균과 분산으로 유전체 분석을 수행하여 꼬마선충이 KOG 평균사이의 편차가 제일 커 유전자의 변이가 다양한 것을 알 수 있었다. 본 연구결과는 기초연구와 항생제 개발 등에 이용될 수 있을 것이다.

Verifying Orthologous Paralogenes using Whole Genome Alignment

  • Chan, P.Y.;Lam, T.W.;Yiu, S.M.
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.109-112
    • /
    • 2005
  • Identifying orthologous paralogenes is a fundamental problem in comparative genomics and can facilitate the study of evolutionary history of the species. Existing approaches for locating paralogs make use of local alignment based algorithms such as BLAST. However, there are cases that genes with high alignment scores are not paralogenes. On the other hand, whole genome alignment tools are designed to locate orthologs. Most of these tools are based on some unique substrings (called anchors) in the corresponding orthologous pair to identify them. Intuitively, these tools may not be useful in identifying orthologous paralogenes as paralogenes are very similar and there may not be enough unique anchors. However, our study shows that this is not true. Paralogenes although are similar, they have undergone different mutations. So, there are enough unique anchors for identifying them. Our contributions include the followings. Based on this counter-intuitive finding, we propose to employ the whole genome alignment tools to help verifying paralogenes. Our experiments on five pairs of human-mouse chromosomes show that our approach is effective and can identify most of the mis-classified paralog groups (more than 80%). We verify our finding that whole genome alignment tools are able to locate orthologous paralogenes through a simulation study. The result from the study confirms our finding.

  • PDF

원핵생물 1,309종에 분포된 COGs (Clusters of Orthologous Groups of proteins) 연구 (Investigation of COGs (Clusters of Orthologous Groups of proteins) in 1,309 Species of Prokaryotes)

  • 이동근;이상현
    • 생명과학회지
    • /
    • 제31권9호
    • /
    • pp.834-839
    • /
    • 2021
  • 저자들은 이전에 711개의 원핵생물에서 COG (Clusters of Orthologous Groups of proteins)를 분석한 결과를 보고하였다. COG 데이터베이스는 2020년에 1,309개의 원핵생물 게놈들을 사용하여 대폭 업데이트되었다. 이에 COG와 원핵생물 측면에서 업데이트된 4,877개의 COG를 구성하는 3,455,853개의 단백질들에 대한 분석 결과를 보고한다. 각 원핵생물이 보유한 COG 종류의 수는 97에서 2,281개의 사이였으며, 평균은 1,430.0개이고 표준편차는 414.2개였다. 문(phylum) 수준에서 보유 COG의 평균 수는 Mollicutes가 497.86개로 최소였고, Cyanobacteria가 1,642.90개로 최대였다. 가장 높은 보유 COG 개수를 가진 상위 10개 종은 모두 Proteobacteria였으며, 하위 10개 중 9개는 시험관 내에서 배양할 수 없는 Candidatus 구성원이었다. 각 COG에 속하는 단백질의 수는 2개에서 22,048개 사이였으며, 상위 11위 COG들은 12,000개 이상의 단백질을 포함하였다. 상위 11개 중 5개는 DNA에 결합하고 유전자 발현에 관여하는 COG로, 원핵생물에서 유전자 발현 조절의 중요성을 알 수 있었다. COG 데이터 베이스는 게놈에 포함된 유전자를 식별하고 균주 개선을 위한 유전자를 선택하는 데 사용할 수 있어 많은 활용이 기대된다.

진핵생물과 원핵생물의 미토콘드리아 관련 보존적 유전자 비교 (Comparison of Mitochondria-related Conserved Genes in Eukaryotes and Prokaryotes)

  • 이동근
    • 생명과학회지
    • /
    • 제24권7호
    • /
    • pp.791-797
    • /
    • 2014
  • 원핵과 진핵생물에 공통 보존적인 OG (Orthologous Group of proteins)를 미토콘드리아 관련 OG와 비관련 OG로 나누어 분석하였다. 62개의 원핵-진핵생물 공통적 COG (Clusters of OG)중 20개가 미토콘드리아 관련 OG였고 이들은 모두 번역관련 OG로 생명현상에서의 단백질의 중요성을 확인할 수 있었다. 세포내 절대기생체인 뇌회백염원충은 비교대상 다른 생물들 모두에 공통적인 미토콘드리아 관련 OG가 전혀 없었다. 뇌회백염원충을 제외한 6개 진핵생물과 원핵생물 63종에 모두 보존적인 미토콘드리아 관련 OG는 17개였다. Phylogenetic tree의 distance 분석을 수행하니 보존적 OG가 원핵생물에서 미토콘드리아 관련 OG와 비관련 OG 등 각각 2개의 그룹으로 나누어 졌고(p<0.001, paired t-test) 진핵생물은 그렇지 않았다(p>0.05, paired t-test). 보존성이 가장 높은 ortholog는 미토콘드리아 관련 OG에서는 COG0048-KOG1750 (ribosomal small subunit S12)이었고, 미토콘드리아 비관련 OG에서는 COG0100-KOG0407 (ribosomal small subunit S11)이었다. 본 연구결과는 진화관계 등의 기초학문적 연구와 치료제 개발 등의 자료가 될 수 있을 것이다.

COG 알고리즘을 통한 Proteobacteria의 보존적 유전자 파악 (Detection of Conserved Genes in Proteobacteria by using a COG Algorithm)

  • 이동근;강호영;이재화;김철민
    • KSBB Journal
    • /
    • 제17권6호
    • /
    • pp.560-565
    • /
    • 2002
  • 생태계에서 중요한 역할을 담당하는 단백세균(Proteobacteria)의 보존적유전자(conserved gene)를 파악하고 서로간의 유연 관계를 밝히고자 clusters of orthologous groups of proteins(COG) 알고리즘을 이용한 접근법을 시도하였다. 42종의 원핵생물과 33종의 진정세균, 16종의 단백세균으로 가면서 보존적유전자가 증가하는 것을 확인하였다. 분석대상 원핵생물 모두에서 75종의 COG 즉 보존적 유전자가 관찰되었다. COG0195, COG0358 그리고 COG0528은 원핵생물에서만 관찰되어 새로운 분류의 parameter로 이용될 가능성이 있는 것으로 추측되었다. 64종류의 보존적 유전자가 33종의 진정세균(eubacteria)에서 관찰되었다. 이는 각 분류단계를 특징짓는 새로운 COG의 추가에 의한 결과로 사료되었다. 각 단백세균 그룹은 독자적인 COG 레퍼토리를 소유하였으며 물질대사에 관련된 보존적 유전자는 beta 그룹이 다른 그룹에 비해 다양한 것을 확인하였다. 본 연구는 단백세균의 기원과 진화적 유연관계를 파악하는데 도움을 줄뿐만 아니라 향후 세균분류학과 생명공학에 필수적인 유용유전자 탐색 등에서도 충분한 연구가치가 있는 것으로 사료되었다.

COG 알고리즘으로 파악한 Proteobacteria의 보존적 유전자

  • 이동근;이진옥;이재화
    • 한국생물공학회:학술대회논문집
    • /
    • 한국생물공학회 2003년도 생물공학의 동향(XII)
    • /
    • pp.715-718
    • /
    • 2003
  • Clusters of orthologous groups of proteins (COG) 알고리즘을 이용하여 42 종의 원핵생물, 33종의 진정세균, 16종의 단백세균 수준에서의 보존적 유전자 (conserved gene)를 파악하였다. 분석대상 원핵생물 모두 75종의 COG 즉 보존적 유전자가 관찰되었다. COG0195, COG0358 그리고 COG0528은 원핵생물에서만 관찰되었고 64종류의 보존적 유전자가 33종의 Bacteria에서 관찰되었다. 각 분류단계를 특징짓는 새로운 COG의 추가를 확인하였고 각 단백세균 그룹은 독자적인 COG 레퍼토리를 소유하였으며 물질대사에 관련된 보존적 유전자는 beta 그룹이 다른 그룹에 비해 다양한 것을 확인하였다. 본 연구는 Proteobacteria의 기원과 진화적 유연관계를 파악하는데 도움을 줄 뿐만 아니라 향후 세균분류학과 생명공학에 필수적인 유용유전자 탐색 등에서도 충분한 연구가치가 있는 것으로 사료되었다.

  • PDF

Expressed Sequence Tags of Trichinella spiralis Muscle Stage Larvae

  • Park, Hae-Kyung;Chang, Seong-Won;Kang, Se-Won;Cho, Min-Kyoung;Choi, Sun-Hee;Hong, Yeon-Chul;Lee, Yong-Seok;Jeong, Hae-Jin;Yu, Hak-Sun
    • Parasites, Hosts and Diseases
    • /
    • 제46권2호
    • /
    • pp.59-63
    • /
    • 2008
  • In order to obtain greater insight into the relevant genomic expression patterns of Trichinella spiralis, 992 expressed sequence tags (ESTs) were collected from a cDNA library of T. spiralis muscle stage larvae and assembled into 60 clusters and 385 singletons. Of them, 445 (44.7%) ESTs were annotated to their homologous genes, and small fractions were matched to known genes of nematodes. The annotated ESTs were classified into 25 eukaryotic orthologous groups (KOG). Cytochrome C oxidase (34 clones) was found to be most frequent species.

Orthologs 수가 적은 원핵생물들의 보존적 유전자 (Conservative Genes of Less Orthologous Prokaryotes)

  • 이동근
    • 생명과학회지
    • /
    • 제27권6호
    • /
    • pp.694-701
    • /
    • 2017
  • 알려진 단독배양이 가능한 원핵생물 중 최소게놈을 가지고 있는 Mycoplasma genitalium보다 보존적 유전자 수가 적은 14개 원핵생물의 유전자를 보존적 유전자 관점의 COG (Clusters of Orthologous Group of proteins)로 검토하였다. 분석대상은 M. genitalium, 초고온성 고세균으로 세포외공생을 하는 Nanoarchaeum equitans, 진정세균으로 식물의 세포내에 기생하는 병원균인 Candidatus Phytoplasma 속 4개와 식물의 수액을 섭취하는 곤충의 세포내에 공생하는 9종이었다. M. genitalium이 가진 367개의 보존적 유전자 중에서, 284개가 비교대상 다른 원핵생물과 공통이었다. M. genitalium 등 분석대상 원핵생물 모두에 보존적 유전자는 29개로, 이들은 리보솜 구성단백질 22개 등 번역관련 25개, RNA 중합효소의 소단위체 3개, 단백질 접힘관련 1개 등으로 단백질의 중요성을 알 수 있었다. 분석대상 15개 원핵생물 중 Candidatus Phytoplasma속 4개 균주 모두에만 존재하는 COG는 40개 였다. 속(genus)이 서로 다른 나머지 9개의 Candidatus는 곤충에 공생한다는 공통점이 있지만 COG0539 (Ribosomal protein S1) 하나만 공통적이었고, 이는 곤충 세포내 공생체들 사이에 보존적 유전자가 다양함을 나타내는 것으로 판단되었다. 본 연구의 결과는 배양이 불가능한 세균의 보존적 유전자 이해에 대한 단서와 함께 아미노산, 항생제, 의약품, 유기합성 전구체 등을 효율적으로 합성하는 원핵생물의 조작에 필요한 기초자료로 활용이 가능할 것이다.

COG 알고리즘을 통한 해양성 Euryarchaeota의 유전적 조성 분석 (Genetic Composition Analysis of Marine-Origin Euryarchaeota by using a COG Algorithm)

  • 이재화;이동근;김철민;이은열
    • 생명과학회지
    • /
    • 제13권3호
    • /
    • pp.298-307
    • /
    • 2003
  • 고세균 (Archaea)의 보존적 유전자를 파악하고 각 분류 단계별로 추가되는 보존적 유전자를 밝히기 위해 그리고 해양성 Euryarchaeota와 육지성 Euryarchaeota의 유전자 조성을 비교하기위해 COG (clusters of orthologous groups of proteins) 알고리즘을 이용하였다. 총 9종의 고세균이 공통적으로 보유하는 보존적 유전자는 340개로 나타났고 8종의 Euryarchaeota는 388개의 유전자가 보존적이었다. Euryarchaeota 각 종이 보유하는 orthologous에 대한 보존적 유전자의 비율은 20.73∼31.54%로 나타났다. 세균과 S.cerevisiae에는 없고 고세균 수준에서만 공통적인 265개 COG의 조성은 유전정보의 보존과 처리에 관여하는 COG가 94개 (35.5%)이고 대사에 관여하는 COG가 82개 (30.9%)로 유전정보와 물질대사와 관여하는 COG의 보존성이 높은 것으로 나타나 고세균이 독특한 생명체계를 이루고 있는 것으로 사료되었다. Euryarchaeota를 Crenarchaeota와 비교하면 핵산대사에서는 상당한 차이를 보이며 유전정보의 저장과 처리에서는 큰 차이가 없는 것으로 판단되었다. 해양성 Euryarchaeota의 보존적 COG는 기능분류별 종류가 육지성 Euryarchaeota와 달랐고 물질대사 관련 COG의 경우 육지성이 해양성보다 다양한 것을 알 수 있었다. 그리고 육지성과 해양성 Euryarchaeota는 탄수화물대사 등을 비롯한 생리적 측면에서 서로 차이가 있을 가능성이 높을 것으로 사료되었다. 본 연구는 해양 극한미생물인 해양성 Euryarchaeota의 기원과 분류단계에 따른 보존적 유전자를 파악하는데 도움을 줄뿐만 아니라 향후 해양미생물 등의 유용유전자 탐색 등에서도 Manco (Arch. Biochem. Biophy. 373, 182 (2000)) 등의 보고와 같이 충분한 연구가치가 있는 것으로 사료되었다.