DOI QR코드

DOI QR Code

Protein Function Finding Systems through Domain Analysis on Protein Hub Network

단백질 허브 네트워크에서 도메인분석을 통한 단백질 기능발견 시스템

  • 강태호 (충북대학교 전기전자컴퓨터공학부) ;
  • 류제운 (충북대학교 생화학과) ;
  • 김학용 (충북대학교 생화학과) ;
  • 유재수 (충북대학교 전기전자컴퓨터공학부)
  • Published : 2008.01.28

Abstract

We propose a protein function finding algorithm that is able to predict specific molecular function for unannotated proteins through domain analysis from protein-protein network. To do this, we first construct protein-protein interaction(PPI) network in Saccharomyces cerevisiae from MIPS databases. The PPI network(proteins; 3,637, interactions; 10,391) shows the characteristics of a scale-free network and a hierarchical network that proteins with a number of interactions occur in small and the inherent modularity of protein clusters. Protein-protein interaction databases obtained from a Y2H(Yeast Two Hybrid) screen or a composite data set include random false positives. To filter the database, we reconstruct the PPI networks based on the cellular localization. And then we analyze Hub proteins and the network structure in the reconstructed network and define structural modules from the network. We analyze protein domains from the structural modules and derive functional modules from them. From the derived functional modules with high certainty, we find tentative functions for unannotated proteins.

본 논문에서는 단백질-단백질 상호작용과 도메인 분석을 통해 기능이 알려지지 않은 미지 단백질의 기능을 예측할 수 있는 알고리즘을 제안한다. 먼저 MIPS 데이터베이스로부터 효모에 대한 단백질-단백질 상호작용(PPI) 네트러크를 구축한다. 구축된 PPI 네트워크는(단백질 3,637개, 상호작용 10,391개) 많은 상호작용을 갖는 소수의 단백질들을 갖으면서 단백질 클러스터의 고유한 모듈성을 보이는 스케일 프리 네트워크와 계층적 네트워크의 특성을 보인다 단백질-단백질 상호작용 데이터베이스는 Y2보(Yeast Two Hybrid) 실험 등으로 얻어졌기 때문에 부정확한 데이터를 포함하고 있다. 따라서 본 논문에서는 세포상의 localization을 고려하여 부정확한 데이터를 정제하여 PPI 네트워크를 재구축한다. 그리고 허브 단백질과 네트워크 구조를 분석하여 네트워크로부터 구조적 모듈을 발견하고 이를 정의한다. 또한 이러한 구조적 모듈로부터 단백질의 도메인을 분석하여 기능적 모듈을 밝히고, 높은 확실성을 가지는 기능적 모듈을 기반으로 미지 단백질에 대한 기능을 예측한다.

Keywords

References

  1. E. Ravasz and A. L. Barabasi, "Hierarchical organization in complex networks," Phys. Rev. E67, 026122, 2003.
  2. 강희영, 내피세포의 생존과 죽음 경로 및 효모의 단백질 네트워크 분석, 충북대학교 대학원 석사학위 논문, 2005.
  3. G. Cynthia and J. Per, Developing Bioinformatics Computer Skills, O'reilly press, 2001(4).
  4. J. Jeffery, S. Fetrow, and K. Andrzej "Structural genomics and its importance for gene function analysis," Nature Biotechnology, Vol.18, No.18, pp.282-287, 2000.
  5. I. Takashi, A comprehensive two-hybrid analysis to explore the yeast protein interactome, Proceedings of the National Academy of Sciences of the United States of America, 2001.
  6. B. Schwikowski, P. Uetz and S. Fields, "A network of protein-protein interactions in yeast," Nat Biotechnol, pp.1257-1261, 2000.
  7. R. Sharan and R. Shamir, "Network-based prediction of protein function," Mol. Sys. Biol. pp.3-88, 2007.
  8. H. Hishigaki, K. Nakai, T. Ono, A. Tanigami, and T. Takagi, "Assessment of prediction accuracy of protein function from protein-protein interaction data," pp.523-531, 2001.
  9. H. N. Chua, W. K. Sung, and L. Wong, "Exploiting indirect neighbours and topological weight to predict protein function from protein-protein interactions," Bioinformatics, Vol.22, pp.1623-1630, 2006. https://doi.org/10.1093/bioinformatics/btl145
  10. A. Vazquez, A. Flammini, A. Maritan, and A. Vespignani, "Global protein function prediction from protein-protein interaction networks," Nat Biotechnol, Vol.22 pp.697-700, 2003.
  11. A. U. Amin, M. Shin, Y. Mihara, K. Kurokawa, and S. Kanaya, "Development and implementation of an algorithm for detection of protein complexes in large interaction networks," BMC Bioinformatics, 7: 207, 2006. https://doi.org/10.1186/1471-2105-7-207
  12. R. Sharan and T. Ideker, "Modeling cellular machinery through biological network comparison," Nat Biotechnol, Vol.24, pp.427-433, 2006. https://doi.org/10.1038/nbt1196
  13. V. Arnau, S. Mars, and I. Marin, "Iterative cluster analysis of protein interaction data," Bioinformatics, Vol.20, pp.364-378, 2005.
  14. A. L. Barabasi and E. Bonabeau, "Scale-Free Networks," Scientific Mnerican, Vol.288, pp.60-69, 2003.