단백질 기능 흐름 모델 구성 및 평가 기법

A Method for Protein Functional Flow Configuration and Validation

  • 장우혁 (한국정보통신대학교 공학부) ;
  • 정석훈 (한국정보통신대학교 공학부) ;
  • 한동수 (한국정보통신대학교 공학부)
  • 발행 : 2009.04.15

초록

단백질 상호작용의 예측 및 실험 결과가 대용량으로 배포되면서 바이오 정보 기술 연구자들은 생명체 내의 단백질 상호작용 네트워크를 구성하기 위해 노력하여 왔다. 일반적으로 대용량의 상호작용 데이터들은 많은 오류를 포함한다고 알려져 있으나, 최근 단백질의 물리 화학적 특성 및 구조를 기반으로 한 방법들이 실제 실험과 병행되어 고화질(High resolution)의 결과를 제공하게 되면서, 특정 종에 대한 단백질 상호작용 네트워크가 점차 완성되고 있다. 그러나, 단순 물리적 링크 수준의 단백질 상호작용 네트워크만으로는 특정 병원체의 발병 메커니즘 규명 등과 같은 응용분야의 활용에 한계가 있다. 본 논문에서는 실험을 통하여 보고된 신호 전달 경로(signaling transduction pathway)를 이용하여 단백질 기능 간의 관계를 방향성이 있는 그래프로 표현한 단백질 기능 흐름 모델을 제시한다. 제안하는 모델은 Gene Ontology에서 정의된 molecular function을 정점(vertex)으로 가지고 이들 사이의 관계를 간선(edge)으로 표현함으로써 특정 기능의 전이를 살펴볼 수 있다. 이러한 기능 흐름 모델은 수 만개의 정점(vertex)으로 구성된 단백질 상호작용 네트워크에서 의미 있는 경로를 추출하는 데에 제약 혹은 참조 조건으로 사용될 수 있어 향후 활용도가 클 것으로 기대한다. 평가는 KEGG에서 제공되는 11개의 인간 신호 전달 경로 각각에 대하여 대상 경로를 제외한 나머지로부터 생성된 모델과의 크론바하 알파 계수(Cronbach's alpha)를 측정하였고(${\alpha}=0.67$), 총 1023개의 흐름 중 ${\alpha}=0.6$ 이상의 신뢰도에 대하여 총 765개의 흐름을 가지는 기능 흐름 모델을 최종 구성하였다.

With explosively growing PPI databases, the computational approach for a prediction and configuration of PPI network has been a big stream in the bioinformatics area. Recent researches gradually consider physicochemical properties of proteins and support high resolution results with integration of experimental results. With regard to current research trend, it is very close future to complete a PPI network configuration of each organism. However, direct applying the PPI network to real field is complicated problem because PPI network is only a set of co-expressive proteins or gene products, and its network link means simple physical binding rather than in-depth knowledge of biological process. In this paper, we suggest a protein functional flow model which is a directed network based on a protein functions' relation of signaling transduction pathway. The vertex of the suggested model is a molecular function annotated by gene ontology, and the relations among the vertex are considered as edges. Thus, it is easy to trace a specific function's transition, and it can be a constraint to extract a meaningful sub-path from whole PPI network. To evaluate the model, 11 functional flow models of Homo sapiens were built from KEGG, and Cronbach's alpha values were measured (alpha=0.67). Among 1023 functional flows, 765 functional flows showed 0.6 or higher alpha values.

키워드

참고문헌

  1. Amy Hin Yan Tong, “Global Mapping of the Yeast Genetic Interaction Network,” Science, 303:5659, 2004 https://doi.org/10.1126/science.1091317
  2. Jacob Scott, et. al., “Efficient algorithms for detecting signaling pathways in protein interaction networks,” Journal of Computational Biology, 13:2, 2006 https://doi.org/10.1089/cmb.2006.13.133
  3. Mebmet E Turanalp and Tolga Can, “Discovering functional interaction patterns in protein-protein interaction networks,” BMC Bioinformatics, 9:276, 2008 https://doi.org/10.1186/1471-2105-9-276
  4. Ali Cakmak and Gultekin Ozsoyoglu, “Mining bio-logical networks for unknown pathways,” BIOIN-FORMATICS, 23:20, 2007 https://doi.org/10.1093/bioinformatics/btm409
  5. The UniProt Consortium, “The Universal Protein Resource (UniProt),” Nucleic Acids Res., 36:D190- D195, 2008 https://doi.org/10.1093/nar/gkl929
  6. Kanehisa, M., et. al., “KEGG for linking genomes to life and the ennvironment,” Nucleic Acids Res., 36:D480-D484, 2008 https://doi.org/10.1093/nar/gkm882
  7. Lee J. Cronbach, et. al., “The dependability of behavioral measurements,” Science, 178:4067, 1972