Concept-based Detection of Functional Modules in Protein Interaction Networks

단백질 상호작용 네트워크에서의 개념 기반 기능 모듈 탐색 기법

  • 박종민 (한국전자통신연구원 라이프인포메틱스팀) ;
  • 최재훈 (한국전자통신연구원 라이프인포메틱스팀) ;
  • 박수준 (한국전자통신연구원 아이프인포매틱스팀) ;
  • 양재동 (전북대학교 전자정보공학부)
  • Published : 2007.10.15

Abstract

In the protein interaction network, there are many meaningful functional modules, each involving several protein interactions to perform discrete functions. Pathways and protein complexes are the examples of the functional modules. In this paper, we propose a new method for detecting the functional modules based on concept. A conceptual functional module, briefly concept module is introduced to match the modules taking them as its instances. It is defined by the corresponding rule composed of triples and operators between the triples. The triples represent conceptual relations reifying the protein interactions of a module, and the operators specify the structure of the module with the relations. Furthermore, users can define a composite concept module by the counterpart rule which, in turn, is defined in terms of the predefined rules. The concept module makes it possible to detect functional modules that are conceptually similar as well as structurally identical to users' queries. The rules are managed in the XML format so that they can be easily applied to other networks of different species. In this paper, we also provide a visualized environment for intuitionally describing complexly structured rules.

단백질 상호작용 네트워크는 생체 내에서 특정 역할을 담당하는 패스웨이나 복합체와 같은 중요한 의미의 많은 기능 모듈들을 포함하고 있다. 본 논문에서는 이 기능 모듈들과 정합될 수 있는 개념 모듈을 정의하고 이를 기반으로 원하는 기능 모듈들을 개념적으로 표현하고 효율적으로 탐색할 수 있는 새로운 방법을 제안한다. 개념 모듈은 트리플들과 이들 사이의 연산자로 이루어진 표현 규칙에 의해 정의 되며 탐색하고자 하는 기능 모듈들의 구조를 개념적으로 표현한다. 이 표현 규칙에서의 트리플은 한 기능 모듈을 구성하는 단백질들 사이의 구체적인 상호작용 관계를, 연산자는 트리플들 사이의 구조적인 연관 관계를 각각 개념적으로 정의한다. 또한, 사용자는 사전에 표현 규칙에 의해 잘 정의된 개념들을 조합하여 새로운 의미의 복합 개념 모듈을 정의할 수도 있다. 복합 개념 모듈은 복잡한 기능 모듈들의 개념적 구조를 보다 정교하게 표현할 수 있기 때문에, 사용자 탐색 질의의 의미적 표현력을 획기적으로 높일 수 있다. 정의된 규칙들은 XML로 관리될 수 있어 다른 종류의 단백질 상호작용 네트워크에서 사용자가 유사한 모듈들을 탐색하기 위해 쉽게 적용 가능하다. 본 논문에서는 또한, 구조적으로 복잡한 규칙들을 직관적으로 표현하고 효율적으로 탐색하기 위한 시각화된 질의 환경도 구현하였다.

Keywords

References

  1. Tucker CL, Gera JF, and Uetz P, 'Towards an understanding of complex protein networks,' Trends Cell Biol., Vol.11, No.3, pp.102-106, 2001 https://doi.org/10.1016/S0962-8924(00)01902-4
  2. Ravasz E, Somera AL, Mongru DA, et al., 'Hierarchical organization of modularity in metabolic networks,' Science, Vol.297, No.5586, pp.1551- 1555, 2002 https://doi.org/10.1126/science.1073374
  3. Ito T, Chiba T, Ozawa R, et al., 'A comprehensive two-hybrid analysis to explore the yeast protein interactome,' Proc. Natl Acad. Sci., Vol.98, No.8, pp.4569-4574, 2001 https://doi.org/10.1073/pnas.061034498
  4. Gavin AC, Bosche M, Krause R, et al., 'Functional organization of the yeast proteome by systematic analysis of protein complexes,' Nature, Vol.415, No.6868, pp.141-147, 2002 https://doi.org/10.1038/415141a
  5. Ho Y, Gruhler A, Heilbut A, et al., 'Systematic identification of protein complexes in Saccharomyces cerevisiae by mass spectrometry,' Nature, 415, No.6868, pp.180-183, 2002 https://doi.org/10.1038/415180a
  6. Bader GD, Betel D. and Hogue CW., 'BIND: the Biomolecular Interaction Network Database,' Nucleic Acids Res., Vol.31, No.1, pp.248-250, 2003 https://doi.org/10.1093/nar/gkg056
  7. Xenarios I, Salwinski L, Duan XJ, et al., 'DIP, the Database of Interacting Proteins: a research tool for studying cellular networks of protein interactions,' Nucleic Acids Res., Vol.30, No.1, pp.303-305, 2002 https://doi.org/10.1093/nar/30.1.303
  8. Zanzoni A, Montecchi-Palazzi L, Quondam M, et al., 'MINT: a Molecular INTeraction database,' FEBS Lett., Vol.513, No.1, pp.135-140, 2002 https://doi.org/10.1016/S0014-5793(01)03293-8
  9. Joshi-Tope G, Gillespie M, Vastrik I, et al., 'Reactome: a knowledgebase of biological pathways,' Nucleic Acids Res., Vol.33, Database issue, pp.D428-D432, 2005 https://doi.org/10.1093/nar/gki072
  10. Dogrusoz U, Erson EZ, Giral E, et al., 'PATIKAweb: a Web interface for analyzing biological pathways through advanced querying and visualization,' Bioinformatics, Vol.22, No.3, pp.374-375, 2006 https://doi.org/10.1093/bioinformatics/bti776
  11. Li XL, Tan SH, Foo CS, et al., 'Interaction Graph Mining for Protein Comple Merging,' Genome Informatics, Vol.16, No.2, pp.260-269, 2005
  12. Zhang S, Ning X, Zhang XS., 'Identification of functional modules in a PPI network by clique percolation clustering,' Computational Biology and Chemistry, Vol.30, No. 6, pp.445-451, 2006 https://doi.org/10.1016/j.compbiolchem.2006.10.001
  13. Bader GD and Hogue CW., 'An automated method for finding molecular complexes in large protein interaction networks,' BMC Bioinformatics, Vol.4, Article 2, 2003
  14. Lubovac Z, Gamalielsson J, Olsson B., 'Combining functional and topological properties to identify core modules in protein interaction networks,' Proteins, Vol. 64, No. 4, pp.948-959, 2006 https://doi.org/10.1002/prot.21071
  15. Koyuturk M, Grama A, and Szpankowski W., 'An efficient algorithm for detecting frequent subgraphs in biological networks,' Bioinformatics, Vol.20, Suppl. 1, pp.i200-i207, 2004 https://doi.org/10.1093/bioinformatics/bth919
  16. Leser U., 'A query language for biological networks,' Bioinformatics, Vol.21, Suppl.2, pp.ii33-ii39, 2005 https://doi.org/10.1093/bioinformatics/bti1105
  17. Baitaluk M, Qian X, Godbole S, et al., 'PathSys: integrating molecular interaction graphs for systems biology,' BMC Bioinformatics, Vol.7, 2006
  18. Boeckmann B, Bairoch A, Apweiler R, et al., 'The SWISS-PROT protein knowledgebase and its supplement TrEMBL in 2003,' Nucleic Acids Res., Vol.31, No.1, pp.365-370, 2003 https://doi.org/10.1093/nar/gkg095
  19. Kanehisa M, Goto S, Kawashima S, et al., 'The KEGG resource for deciphering the genome,' Nucleic Acids Res., Vol.32, Database issue, pp.D277-D280, 2004 https://doi.org/10.1093/nar/gkh063
  20. Harris MA, Clark J, Ireland A, et al., 'The Gene Ontology (GO) database and informatics resource,' Nucleic Acids Res., Vol.32, Database issue, pp.D258-D261, 2004 https://doi.org/10.1093/nar/gkh036
  21. Rinaldi F, Schneider G, Kaljurand K, et al., 'An environment for relation mining over richly annotated corpora: the case of GENIA,' BMC Bioinformatics, Vol.7, Suppl.3, Article S3, 2006
  22. Yeast Protein Complex Database, http://yeast.cellzome.com/