서론
고세균은 크기나 형태 그리고 핵이 없는 것은 진정세균과 유사하며 전사와 번역에 관련된 대사경로는 진핵생물과 유사한 면이 있어 진정세균과 진핵생물의 중간자로 간주된다. 이들은 지구에 다른 생물들보다 먼저 출현하였으며 고온, 저온, 고염도, 산성 같은 극한환경에서 주로 존재하는 것으로 알려졌으나, 최근에는 토양, 해양, 동물의 구강과 장 등의 극한환경이 아닌 곳에도 분포하여 지구 생태계의 중요한 기여자로 인식된다. 고세균들이 아주 오랜 세월 동안에 극한 및 비극한 환경에서 생존한다는 것은 각 환경에 적합한 유전자들이 발현하여 물질대사와 번식을 계속하였다는 것이며, 다양한 지구의 환경에서도 물질대사와 번식 등의 공통된 생명현상을 갖는 것은 공통된 대사경로 등이 존재할 것이다.
본 연구진은 공통조상 유전자에서 유래하여 서로 다른 종(species)들에 존재하는 유전자인 ortholog유래의 단백질들을 COG (Clusters of Orthologous Group of proteins) 기법으로 1,309종의 원핵생물에 존재하는 공통 유전자[5]와 대사경로[4]를 보고하였다. 개별 보존유전자 위주의 COG 기법의 한계를 보완할 수 있는 MetaCyc에 근거한 연구를 통하여, 본 연구진은 종이 같은 28개의 원핵생물의 대사경로와 보존적 유전자에 대해 보고하였고[3], COG와 MetaCyc database에 공통적으로 분포하는 122종의 고세균종에 보존된 대사 경로와 보존된 유전자를 보고하였다[6].
MetaCyc database는 2024년 1월 현재 고세균 471개 등의 다양한 원핵과 진핵 생물에서 유래한 3,490개의 대사경로를 포함하고 있다. 이에 본 연구에서는 COG의 122개 보다 월등히 많은 471개 고세균들을 포괄하는 MetaCyc를 이용하여 고세균의 공통된 대사경로의 파악 등 이들에 대한 기초적인 이해와 응용 가능성을 탐색하고자 하였다.
재료 및 방법
재료
2024년 1월 현재 MetaCyc database에 존재하는 471개의 고세균에 관한 자료를 이용하였다. MetaCyc database는 Asgard group, Candidatus Thermoplasmatota, DPANN group, Euryarchaeota, TACK group 등의 5개의 그룹으로 나누어져 있고 TACK group 은 Candidatus Korarchaeota, Nitrososphaerota, Thermoproteota로 구성되는데, Nitrososphaerota는 Thaumarchaeota이고 Thermoproteota는 Crenarchaeota이다. Table 1은 실제로 분석한 471종의 고세균의 분류 위치와 이를 구성하는 종(species)의 개수를 나타내고 있다.
각 고세균별 대사경로
MetaCyc를 이용하여 연구 대상인 고세균들의 각 종에 대한 대사경로를 확보하였으며, 각 고세균 종의 대사경로들을 일일이 확인하여 대사경로 이름의 변경 등으로 생기는 문제 등을 확인하여 자료의 무결성을 확인하였다. 자료의 정리에는 perl과 엑셀 프로그램을 이용하였다.
대사경로를 이용한 유전체 분석
연구 대상인 각 고세균들의 대사경로 보유 계통수를 작성하였다. 전체 3,490개의 대사경로의 보유 여부를 고세균 각 종들과 outgroup인 E. coli K12 MG1655를 대상으로 작성하고 MegaX 프로그램[2]으로 다중서열 비교를 수행한 후에 Presence-Absence phylogenetic tree를 Maximum-Likelihood와 Neighbor joining 방법으로 작성하였다. 이때 bootstrap method (n=1,000)를 이용하였고 distance value를 담고 있는 nwk 파일을 생성하였다. Dendroscpe 프로그램(ver 0.8)으로[1] 각 구성원들의 distance value를 얻었고, 엑셀 프로그램으로 distance value 등을 분석하였다.
결과 및 고찰
각 분류단위의 대사경로의 수
각 분류단위에 속하는 고세균들이 공통적으로 보유하는 대사경로의 수와 함께 평균과 범위를 Table 1에 나타냈다. 각 분류단위의 구성원이 1개인 Candidatus Lokiarchaeota 등은 범위를 표시하지 않았다. 분류단위별로 대사경로의 수의 평균은 DPANN group이 15.5개로 최소였고 Euryarchaeota의 Halobacteria강이 109.95개로 최대였다. 각 분류단위가 가진 대사경로의 범위가 넓은 것은 Euryarchaeota의 Methanomicrobia 강(30‒184개 대사경로)과 Crenarchaeota인 Thermoprotei 강(17‒170개) 이었다. 대사경로의 범위가 넓다는 것은 구성원들이 적은 대사경로로 혹은 많은 대사경로로 살아간다는 것으로 다양한 환경에 존재한다는 것을 의미하는 것으로 사료된다. 대사경로의 범위가 좁은 강은 Euryarchaeota의 Archaeoglobi 강(89‒102개)과 Candidatus Thermoplasmatota의 Thermoplasmata 강(61‒94개) 이었다. 대사경로의 범위가 좁다는 것은 구성원들의 생존 환경의 폭이 넓지 않다는 것으로 해석될 수도 있다. 한편, 각 강의 공통된 대사경로의 수가 많다면 연구 대상인 구성원들의 대사경로의 유연관계가 높거나 서식환경이 비슷하다고 할 수 있을 것이다. Table 1에서 각각의 공통된 대사경로의 수는 Euryarchaeota의 7개의 강에서 6‒61개였고 전체 Euryarchaeota에서 2개, Crenarchaeota는 1개의 강에서 2개, Thaumarchaeota는 1개의 강과 기타에서 30개와 40개였고 전체 Thaumarchaeota에서 9개였다. 구성원의 수와 공통된 대사경로의 수 사이의 결정계수(R2)는 0.2629로 나타나 구성원의 수가 많으면 공통된 대사경로의 수가 적다는 것과의 관계는 30% 미만인 것을 알 수 있었다. Crenarchaeota의 각 목(order)에서 공통된 대사경로의 수는 8‒47개였고, 구성원의 수와 공통된 대사경로의 수 사이의 결정계수(R2)는 0.3388로 나타나 구성원의 수와 공통된 대사경로의 수 사이의 관계가 강(class)의 수준에 비해 목(oeder)의 수준에서 증가하는 것으로 나타났다.
Table 1. Phylogenetic position, number of species, average (range), and number of common pathways in phylogenetic position among 471 archaebacteria. * indicates not at class level
대사경로가 13개인 Nanoarchaeum equitans Kin4-M은 기생 혹은 공생체로 단독배양이 불가능하고[9] 대사경로가 33개인 Thaumarchaeota archaeon SCGC AB-539-E09도 배양이 불가능하다[8]. 한편 대사경로가 17개인 Vulcanisaeta sp. JCM 16161과 대사경로가 30개인 Methanogenium cariaci JCM 10550은 단독배양이 가능하여, 독립생활에 필요한 대사경로의 수나 종류에 대한 연구가 좀 더 필요할 것으로 판단된다. 대사경로의 수가 적은 생물체는 생존에 필요한 다양한 물질을 모두 합성할 필요가 없거나 외부 환경의 변화 등이 적은 곳에서 존재해왔을 가능성이 있을 것이다.
대사경로의 수가 많은 고세균으로는 Euryarchaeota에 속하는 Methanosarcina mazei Tuc01와 Methanobrevibacter smithii ATCC 35061로 각각 184개와 172개, Crenarchaeota에 속하는 Pyrobaculum ferrireducens와 Sulfolobus acidocaldarius SUSAZ로 각각 170개와 156개, Thaumarchaeota에 속하는 Candidatus Nitrososphaera gargensis Ga9.2로 144개의 대사경로를 가졌다. 대사경로의 수가 많은 생물체는 생존에 필요한 다양한 물질을 모두 합성하거나 환경의 변화가 크거나 다른 생물체에서 유전자의 전달을 많이 받았을 수도 있을 것이다[10].
Archaeota의 공통 대사경로
Table 2에 471개의 고세균들중에 분포하는 대사경로와 해당 대사경로를 가진 고세균의 수를 내림차순으로 나타내었다.
Table 2. Numbers of genomes in common pathways and pathway of common among 471 archaebacteria
Table 2에 제시된 대사경로 중에서 핵산대사 경로가 UTP and CTP de novo biosynthesis, adenosine ribonucleotides de novo biosynthesis, pyrimidine deoxyribonucleotide phosphorylation, guanosine ribonucleotides de novo biosynthesis 외에 뉴클레오타이드 합성에 필수적인 PRPP biosynthesis 등이 5개였으며, 아미노산이나 단백질 대사 경로가 tRNA charging, L-methionine degradation I (to L-homocysteine), N6-L-threonylcarbamoyladenosine37-modified tRNA biosynthesis, L-threonine biosynthesis, glutaminyl-tRNAgln biosynthesis via transamidation 등이 5개였다. 이를 토대로 핵산과 아미노산 및 단백질 대사경로가 고세균의 생명현상의 유지와 전달에 필수적인 것으로 판단된다.
기타 세포에서 다양한 반응에 참여하는 cofactor인 S-adenosyl-L-methionine (SAM)의 생합성 대사경로, 모든 polyketide 합성효소와 지방산 합성효소 및 non-ribosome 펩타이드 합성효소의 촉매 활성에 필수적인 번역 후 변형에 필요한 4'-hosphopantetheine 합성을 위한 phosphopantothenate biosynthesis III (archaea)와 glycolysis I (from glucose 6-phosphate)의 대사경로도 대다수의 고세균에 공통적이었다. 이들은 해당과정 외에 세포 내 효소들의 활성과아미노산의 생합성에 필수적인 대사경로라고 판단할 수 있었다. Phosphopantothenate 생합성을 위한 pantothenate는 식물과 일부 진핵미생물만이 de novo 경로로 합성하고 동물은 합성경로가 없어 관련 효소는 항균 약물의 표적이 된다[12].
471개의 고세균 모두에 공통적인 대사경로는 없었으며, Euryarchaeota에 속하는 Methanogenium cariaci JCM 10550을 제외한 470개의 고세균들에 UTP and CTP de novo biosynthesis와 tRNA charging이 공통적이었다. M. cariaci JCM 10550은 해양 퇴적층에서 분리된 혐기성이며 저온성인 고세균으로 단독배양이 가능하므로[11] UTP와 CTP를 합성하는 다른 경로가 있을 것으로 판단된다. 이 고세균이 가진 핵산관련 대사경로는 guanosine ribonucleotides de novo biosynthesis, 5-aminoimidazole ribonucleotide biosynthesis II, adenosine ribonucleotides de novo biosynthesis이고 purine 염기 합성에 필수적인 5-aminoimidazole ribonucleotide biosynthesis II 대사경로도 보유하고 있다. tRNA charging은 tRNA에 아미노산을 결합시키는 것인데, M. cariaci JCM 10550에 없는 것으로 나타났지만 단백질 합성을 위해 tRNA charging이 필수적이므로 이 대사경로가 아직 밝혀지지 않았을 가능성이 유추된다.
COG pathway와 MetaCyc pathway에서 지정한 대사경로의 수와 종류의 차이 그리고 고세균 개수의 차이에 의해 결과에 차이가 있었다. Lee와 Lee [6]는 COG pathway에서 선정한 122종의 고세균 모두에 공통적인 대사경로는 없었으며, MetaCyc pathway와 달리 COG pathways는 리보솜을 구성하는 단백질과 번역인자들은 대사경로에 포함시켰는데 ribosome 30S subunit과 50S subunit을 구성하는 일부 단백질들과 aminoacyl-tRNA synthetases와 전사인자 일부가 122종의 고세균에 공통적이라고 보고하였다. Aminoacyl- tRNA synthetase는 tRNA charging에 관여하는 효소이다. 그 외 COG pathways에서 122종의 고세균에 공통적인 COG pathway들은 translation factors, tRNA modification 등으로 본 연구에서 구한 471종의 고세균들에 분포하는 핵산 그리고 SAM의 대사경로 등은 없었다. COG pathways에 속하지 않지만 많은 고세균들에 존재하는 COG들의 보존성을 조사하여 복제, 전사, 번역, 세포벽과 세포외기질의 합성, ATP 등의 뉴클레오티드의 대사에 관련된 단백질 일부가 공통적이라고 보고하였다[6].
Euryarchaeota, Crenarchaeota, Thaumarchaeota는 대표적인 고세균들이다. Euryarchaeota인 Methanogenium cariaci JCM 10550을 제외하고 모두에 공통적인 대사경로는 UTP and CTP de novo biosynthesis와 tRNA charging의 대사경로였다(Table 2). Euryarchaeota와 Crenarchaeota, Crenarchaeota와 Thaumarchaeota, 그리고 Euryarchaeota와 Thaumarchaeota 사이에는 공통적인 대사경로가 없었다.
대사경로 계통수
Fig. 1은 분석대상 고세균들이 3,490개의 각 대사경로의 보유 유무를 바탕으로 구성한 presence/absence 계통수에 Neighbor Joining과 bootstrap (n=1,000)을 적용한 것이다. 471개의 고세균을 Table 1에서 약어로 표시된 분류단위 3개까지 각 분지에 나타내었고, 분류단위 앞의 숫자는 해당 분류단위에 속하는 고세균의 개수이다. 계통수는 크게 A, B, C, D의 4구역으로 나눌 수 있었다. A구역은 423개의 종이, B구역은 37개의 종이 분포하여 전체 분석대상의 97.7%가 존재하였다. D구역의 구성원들은 Euryarchaeota, Crenarchaeota, Thaumarchaeota의 구성원들 중의 극히 일부이며 Maximum-Likelihood 계통수에서도 동일하게 묶여(data not shown) 고세균들 중에서는 대장균과 대사경로가 유사한 종들로 판단된다.
Fig. 1. The neighbor joining phylogenetic tree of 471 species of archaebacteria in the sense of presence or absence of the 3,490 pathways.
Euryarchaeota의 Halobacteria 강(Eu-Hb)의 181종과 Archaeoglobi 강(Eu-Ag)의 8종은 모두 A구역에 존재한다. Euryarchaeota의 Methanomada group에 속하는 Methanococci 강(Eu-Mc)의 19종 모두, Methanopyri 강(Eu-Mp)의 1종, Methanobacteria 강(Eu-Mb)의 33종 중에서 32종이 A구역에 존재하고, 1종의 Methanobacteria 강의 구성원인 Methanobrevibacter smithii ATCC 35061만이 D구역에 존재하였다. Euryarchaeota의 Stenoarchaea group에 속하는 Methanobacteria 강(Eu-Mm)의 60종 중에서 58종이 A구역에 존재하고 1종씩만 B구역과(Methanogenium cariaci JCM 10550) D구역에(Methanococcoides methylutens DSM 2657) 존재하였다. 이는 대체적으로 분류그룹과 일치하는 대사경로의 비율이 높다는 것과 일부 고세균들은 분류그룹과 대사경로가 꼭 일치하는 것은 아니라는 것을 동시에 나타내는 결과로 판단된다.
Lee와 Lee [6]는 고세균 122종의 보존된 대사경로와 보존 유전자를 파악하기 위해 COG의 자료들을 이용하여 archaeal ribosomal proteins가 가장 보존적인 것을 확인하였고, 122종의 고세균 모두에 공통적인 COG는 66개임을 밝혔다. COG pathway에 관련된 보존 유전자는 ribosome을 구성하는 29개, tRNA synthetase와 전사인자가 각각 5개, RNA polymerase를 구성하는 3개, 그리고 tRNA modification에 관련된 2개의 유전자가 공통적이었다. 이는 각 대사경로를 구성하는 단백질들 모두가 보존적인 것은 아니라 일부는 보존적이고 일부는 차이를 보여 각 고세균이 호염성, 호열성, 호냉성, 메탄생성 등의 생존환경 혹은 진화과정에서 차이를 보이게 된 것이라고 유추된다.
Fig. 2는 Maximum-Likelihood 기법으로 구한 대사경로의 보유 계통수의 distance value를 각 분류그룹별 평균과 표준편차로 나타낸 것으로 구성원이 1개인 분류그룹들은 제외하였고, 크게 2그룹과 기타로 나눌 수 있었다. 그룹1은 Euryarchaeota의 Archaeoglobi 강(Eu-Ag), Methanobacteria 강(Eu-Mb), Methanococci 강(Eu-Mc), Methanomicrobia 강(Eu-Mm)으로 distance value의 평균과 표준편차가 상대적으로 낮았고 메탄 대사와 관계있는 Euryarchaeota 고세균들이 109종으로 많고 Archaeoglobi 강에 8종이다. 그룹2는 Thermoplasmata 강(CT-Th), Halobacteria 강(Eu-Hb), Nitrososphaeria 강(Th-Ns), Thermococci 강(Eu- Tc)으로 distance value의 평균이 그룹1에 비해 높았고 Euryarchaeota 고세균들이 222종, Thermoplasmata 강이 17종이다. DPANN group은 구성원이 2개인데 distance value의 평균이 높았고, Thaumarchaeota에 속하는 Thaumarchaeota incertae sedis(Th-Is)는 구성원이 5개인데 distance value의 표준편차가 높았다. Thaumarchaeota incertae sedis는 확정된 분류단위가 아니다.
Fig. 2. Average and standard deviation of distance values obtained from phylogenetic trees of 3,490 metabolic pathways among 471 archaebacteria.
고세균의 영양형태는 phototrophs, lithotrophs, organotrophs로 분류가 가능하며, 각 해당 그룹에 따른 대사경로가 매우 다양할 수 있다. 따라서 공통되는 대사경로가 적어 물질대사가 각 종 별로 매우 특이적인지는 향후 분류별 연구가 진행되면 더 확실해질 것이다.
본 연구는 MetaCyc의 자료로 471종의 고세균에 보존된 대사경로를 파악하였다. UTP and CTP de novo biosynthesis와 tRNA charging의 대사경로가 가장 보존적이었다. 유럽과 아시아 사람들을 대상으로 한 연구에서 정상인에 비해 대장암 환자의 장내의 고세균중에서 메탄생성균이 감소하고 Halobacteria가 증가하는 것이 보고되어[7] 고세균이 사람의 건강과도 밀접한 연관이 있어 고세균에 관한 연구가 실용적인 면에서도 중요한 것을 알 수 있다. 또한, 본 연구결과는 동물에게는 존재하지 않고 고세균에만 존재하는 대사경로에 관련된 효소들을 타겟으로 하는 약물 개발 등에도 응용될 수 있을 것이다[12].
The Conflict of Interest Statement
The authors declare that they have no conflicts of interest with the contents of this article.
References
- Huson, D. H. and Scornavacca, C. 2012. Dendroscope 3 : An interactive viewer for rooted phylogenetic trees and networks. Syst. Biol. 61, 1061-1067. https://doi.org/10.1093/sysbio/sys062
- Kumar, S., Stecher, G., Li, M., Knyaz, C. and Tamura, K. 2018. MEGA X: Molecular evolutionary genetics analysis across computing platforms. Mol. Biol. Evol. 35, 1547-1549. https://doi.org/10.1093/molbev/msy096
- Lee, D. G., Kim, J. H. and Lee, S. H. 2019. Conserved genes and metabolic pathways in prokaryotes of the same genus. J. Life Sci. 29, 123-128.
- Lee, D. G., Kim, J. H. and Lee, S. H. 2022. Metabolic pathways of 1309 prokaryotic species in relation to COGs. J. Life Sci. 32, 249-255.
- Lee, D. G. and Lee, S. H. 2021. Investigation of COGs (Clusters of Orthologous Groups of proteins) in 1,309 species of prokaryotes. J. Life Sci. 31, 834-839.
- Lee, D. G. and Lee, S. H. 2023. Conserved COG pathways and genes of 122 species of archaea. J. Life Sci. 33, 944-949.
- Mathlouthi, N. E. H., Belguith, I., Yengui, M., Oumarou Hama, H. Lagier, J. C., Ammar Keskes, L., Grine, G. and Gdoura, R. 2023. The Archaeome's role in colorectal cancer: Unveiling the DPANN group and investigating archaeal functional signatures. Microorganisms 11, 2742.
- Meng J., Xu J., Qin D., He Y., Xiao X. and Wang F. 2014. Genetic and functional properties of uncultivated MCG archaea assessed by metagenome and gene expression analyses. ISME J. 8, 650-659. https://doi.org/10.1038/ismej.2013.174
- Moissl-Eichinger, C. and Huber, H. 2011. Archaeal symbionts and parasites. Curr. Opin. Microbiol. 14, 364-370. https://doi.org/10.1016/j.mib.2011.04.016
- Rinke, C., Schwientek, P., Sczyrba, A., Ivanova, N. N., Anderson, I. J., Cheng, J. F., Darling, A., Malfatti, S., Swan, B. K., Gies, E. A., Dodsworth, J. A., Hedlund, B. P., Tsiamis, G., Sievert, S. M., Liu, W. T., Eisen, J. A., Hallam, S. J., Kyrpides, N. C., Stepanauskas, R., Rubin, E. M., Hugenholtz, P. and Woyke, T. 2013. Insights into the phylogeny and coding potential of microbial dark matter. Nature 499, 431-437. https://doi.org/10.1038/nature12352
- Romesser, J. A., Wolfe, R. S., Mayer, F., Spiess, E. and Walther-Mauruschat, A. 1979. Methanogenium, a new genus of marine methanogenic bacteria, and characterization of Methanogenium cariaci sp. nov. and Methanogenium marisnigri sp. nov.. Arch. Microbiol. 121, 147-153. https://doi.org/10.1007/BF00689979
- Yokooji, Y., Tomita, H., Atomi, H. and Imanaka, T. 2009. Pantoate kinase and phosphopantothenate synthetase, two novel enzymes necessary for CoA biosynthesis in the Archaea. J. Biol. Chem. 284, 28137-28145. https://doi.org/10.1074/jbc.M109.009696