DOI QR코드

DOI QR Code

Investigating Binding Area of Protein Surface using MCL Algorithm

MCL 알고리즘을 이용한 단백질 표면의 바인딩 영역 분석 기법

  • 정광수 (충북대학교 전자계산학과) ;
  • 유기진 (충북대학교 전자계산학과) ;
  • 정용제 (충북대학교 생명과학부) ;
  • 류근호 (충북대학교 전기전자컴퓨터공학부)
  • Published : 2007.12.31

Abstract

Proteins combine with other materials to achieve their function and have similar function if their active sites are similar. Thus we can infer the function of protein by identifying the binding area of proteins. This paper suggests the novel method to select binding area of protein using MCL (Markov Cluster) algorithm. We construct the distance matrix from surface residues distance on protein. Then this distance matrix is transformed to connectivity matrix for applying MCL process. We adopted Catalytic Site Atlas (CSA) data to evaluate the proposed method. In the experimental result using CSA data (94 selected single chain proteins), our algorithm detects the 91 (97%) binding area near by active site of each protein. We introduced a new geometrical features and this mainly contributes to reduce the time to analyze the protein by selecting the residues near by active site.

단백질은 다른 물질과의 결합하여 기능을 수행하기 때문에 활성 사이트가 유사한 단백질은 유사한 기능을 가진다. 따라서 단백질의 바인딩 영역을 식별함으로써 단백질의 기능을 추론할 수 있다. 이 논문은 MCL (Markov Cluster) 알고리즘을 이용하여 단백질의 바인딩 영역을 추출하는 새로운 방법을 제시한다. 이를 위하여 단백질의 표면 잔기 거리를 나타내는 distance matrix를 생성하고, 여기에 MCL 프로세스를 적용한다. 제시한 방법을 평가하기 위해 Catalytic Site Atlas (CSA) 데이터를 사용하였다. CSA 데이터 (94개의 단일 체인 단백질)를 이용한 실험 결과, 알고리즘은 91개 단백질의 활성 사이트 주변의 바인딩 영역을 검출하였다. 이 논문은 단백질 활성 사이트를 분석하기 위한 새로운 기하학적 특징을 제시하였고, 활성 사이트와 관련이 없는 잔기를 제거함으로써 단백질 표면의 분석의 시간을 줄일 수 있는 장점이 있다.

Keywords

References

  1. A.Stark, A.Shkumatov, 'Finding Functional Sites in Structural Genomics,' Proteins. Structure, Vol.12, pp.1205-1412, 2004 https://doi.org/10.1016/j.str.2004.05.012
  2. L.M. Kauvar and H.O. Villar, 'Deciphering cryptic similarities in protein binding sites,' Curr. Opin. Biotechanol., Vol.9, pp.390-394, 1998 https://doi.org/10.1016/S0958-1669(98)80013-X
  3. P.C Babbitt, 'Definition of enzyme function for the structural genomics era,' Curr. Opin, Chem. Biol., Vol.7, pp.230-237, 2003 https://doi.org/10.1016/S1367-5931(03)00028-0
  4. S. Van Dongen, 'Graph clustering by flow simulation,' PhD thesis, University of Utrecht, The Netherlands, 2000
  5. A.J. Enright, S.Van Dongen and C.A. Ouzounis, 'An efficient algorithm for large-scale detection of protein families,' Nucleic Acids Research, Vol.30, No.7, pp. 1575-1584, 2002 https://doi.org/10.1093/nar/30.7.1575
  6. C.T. Porter, G.J. Bartlett, and J.M. Thornton, 'The Catalytic Site Atlas: a resource of catalytic sites and residues identified in enzymes using structural data,' Nucl. Acids. Res., Vol.32, pp.129-133, 2004 https://doi.org/10.1093/nar/gkh028
  7. Reichmann D, Rahat O, Cohen M, Neuvirth H, Schreiber G., 'The molecular architecture of protein-protein binding sites,' Curr Opin Struct Biol., Vol.17, No.1, pp.67-76, 2007 https://doi.org/10.1016/j.sbi.2007.01.004
  8. A. Via, F. Ferre, B. Brannetti, A. Valencia, and M. Helmer-Citterich, 'Three-dimensional view of the surface motif associated with the P-loop structure: cis and trans cases of convergent evolution,' J. Mol. Biol., Vol.303, pp.455-465, 2000 https://doi.org/10.1006/jmbi.2000.4151
  9. Fabian Glaser, Richard J. Morris, Rafael J. Najmanovich, Roman A. Laskowski, and Janet M. Thornton, 'A Method for Localizing Ligand Binding Pockets in Protein Structures.,' PROTEINS: Structure, Function, and Bioinformatics Vol.62, pp.479-488, 2006 https://doi.org/10.1002/prot.20769
  10. R.A. Laskowski, 'SURFNET: A program for visualizing molecular surfaces, cavities, and intermolecular interactions,' J.Mol.Graph, Vol.13, pp.307-308, 1995 https://doi.org/10.1016/0263-7855(95)00073-9
  11. Changhui Yan, Vasant Honavar, and Drena Dobbs, 'Predicting Protein-Protein Interaction Sites From Amino Acid Sequence,' Department of Computer Science Iowa State University, 2002
  12. T.Andrew Binkowski, Larisa Adamian and Jie Liang, 'Inferring Functional Relationships of Proteins from Local Sequence and Spatial Surface Patterns,' J.Mol.Biol. Vol.332, pp.505-526, 2003 https://doi.org/10.1016/S0022-2836(03)00882-9
  13. Oliviero Carugo and Giacomo Franzot, 'Prediction of protein-protein interactions based on surface patch comparison,' Proteomics, Vol.4, pp.1727-1736, 2004 https://doi.org/10.1002/pmic.200300692
  14. Susan Jones and Janet M.Thornton, 'Principles of protein-protein interactions,' Proc. Natl. Acad. Sci. USA, Vol.93, pp.13-20, 1996 https://doi.org/10.1073/pnas.93.1.13
  15. L.Mirny and E.Domany, 'Protein Fold Recognition and Dynamics in the Space of Contact Maps,' Proteins, pp.391-410, 1996 https://doi.org/10.1002/(SICI)1097-0134(199612)26:4<391::AID-PROT3>3.0.CO;2-F
  16. M.Vendruscolo, E.Kussell and E.Domany, 'Recovery of Protein Structure from Contact Maps,' Fold. Des, pp.295-306, 1997 https://doi.org/10.1016/S1359-0278(97)00041-2
  17. G. Lancia, R. Carr, B. Walenz, and S.Istrail, '101 optimal PDB structure alignments : a branch-and-cut algorithm for the maximum contact map overlap problem,' Proceedings of The Fifth Annual International Conference on Computational Molecular Biology, RECOMB, 2001 https://doi.org/10.1145/369133.369199
  18. B. Carr, W. E. Hart, N. Krasnogor, E. K. Burke, J. D. Hirst, and J. E. Smith, 'Alignment of protein structures with a memetic evolutionary algorithm.' In GECCO-2002: Proceedings of the Genetic and evolutionary Computation Conference, Morgan Kaufman, 2002
  19. E.L.L. Sonnhammer and J.C. Wooton, 'Dynamic contact maps of protein structures,' Journal of Molecular Graphics and Modelling, Vol.16, pp.1-5, 1998 https://doi.org/10.1016/S1093-3263(98)00009-6
  20. http://www.umass.edu/microbio/rasmol/index2.htm
  21. R.A. Laskowski, N.MLuscombe, M.B.Swindells and J.M.Thornton, 'Protein clefts in molecular recognition and function,' Protein Science, Vol.5, pp. 2438-2452, 1996
  22. http://xray.bmc.uu.se/usf/voidoo.html
  23. 김선신, 정광수, 류근호, '단백질 구조기반 단백질 간의 기능관계 예측 기법,' 한국정보처리학회, 12권 2호, pp.55-58, 2005
  24. Kwang Su Jung, Sunshin Kim, Keun Ho Ryu, 'A Personalized Biological Data Management System based on BSML,' LNBI, vol.4115, pp.362-371, 2006 https://doi.org/10.1007/11816102_40
  25. Sunshin Kim, Kwang Su Jung, Keun Ho Ryu, 'Automatic Orthologous-Protein-Clustering from Multiple Complete-Genomes by the Best Reciprocal BLAST Hits,' LNBI, Vol.3916, pp.60-70, 2006 https://doi.org/10.1007/11691730_7
  26. 유기진, 정광수, 류근호, '잔기 위치 예측을 위한 단백질 기하학적 특징 추출 기법,' 한국정보처리학회, 13권 2호, pp.673-676, 2006
  27. Kwang Su Jung, Ki Jin Yu, Keun Ho Ryu, Yong Je Chung, 'Predicting Ligand Binding Site Using Protein Surface Features,' PACIFIC SYMPOSIUM ON BIOCOMPUTING, pp.72, 2007
  28. 유기진, 정광수, 류근호, 정용제, '단백질 활성 사이트 비교 를 통한 단백질 기능 예측 기법 설계,' 한국데이터베이스 학회, pp.191-197, 2007
  29. 김선신, 이충세, 류근호, '유전체 상호간의 BLAST 최대 히트를 사용하여 서열화가 완성된 다수의 유전체로부터 Orthologous 단백질그룹을 자동적으로 클러스터링하는 기법,' 한국정보처리학회논문지D, 13D권 2호, pp.207-214, 2006 https://doi.org/10.3745/KIPSTD.2006.13D.2.207
  30. 김선신, 이범주, 정광수, 김영창, 김태경, 조완섭, 이충세, 류근호, '다종의 유전체로부터 탐지된 올소로그(Ortholog)군 집에 대한 분석,' 한국정보과학회논문지 출판예정, 2008