Abstract
We propose a protein function finding algorithm that is able to predict specific molecular function for unannotated proteins through domain analysis from protein-protein network. To do this, we first construct protein-protein interaction(PPI) network in Saccharomyces cerevisiae from MIPS databases. The PPI network(proteins; 3,637, interactions; 10,391) shows the characteristics of a scale-free network and a hierarchical network that proteins with a number of interactions occur in small and the inherent modularity of protein clusters. Protein-protein interaction databases obtained from a Y2H(Yeast Two Hybrid) screen or a composite data set include random false positives. To filter the database, we reconstruct the PPI networks based on the cellular localization. And then we analyze Hub proteins and the network structure in the reconstructed network and define structural modules from the network. We analyze protein domains from the structural modules and derive functional modules from them. From the derived functional modules with high certainty, we find tentative functions for unannotated proteins.
본 논문에서는 단백질-단백질 상호작용과 도메인 분석을 통해 기능이 알려지지 않은 미지 단백질의 기능을 예측할 수 있는 알고리즘을 제안한다. 먼저 MIPS 데이터베이스로부터 효모에 대한 단백질-단백질 상호작용(PPI) 네트러크를 구축한다. 구축된 PPI 네트워크는(단백질 3,637개, 상호작용 10,391개) 많은 상호작용을 갖는 소수의 단백질들을 갖으면서 단백질 클러스터의 고유한 모듈성을 보이는 스케일 프리 네트워크와 계층적 네트워크의 특성을 보인다 단백질-단백질 상호작용 데이터베이스는 Y2보(Yeast Two Hybrid) 실험 등으로 얻어졌기 때문에 부정확한 데이터를 포함하고 있다. 따라서 본 논문에서는 세포상의 localization을 고려하여 부정확한 데이터를 정제하여 PPI 네트워크를 재구축한다. 그리고 허브 단백질과 네트워크 구조를 분석하여 네트워크로부터 구조적 모듈을 발견하고 이를 정의한다. 또한 이러한 구조적 모듈로부터 단백질의 도메인을 분석하여 기능적 모듈을 밝히고, 높은 확실성을 가지는 기능적 모듈을 기반으로 미지 단백질에 대한 기능을 예측한다.