Inter-Species Validation for Domain Combination Based Protein-Protein Interaction Prediction Method

  • Jang, Woo-Hyuk (School of Engineering Information and Communications University) ;
  • Han, Dong-Soo (School of Engineering Information and Communications University) ;
  • Kim, Hong-Soog (School of Engineering Information and Communications University) ;
  • Lee, Sung-Doke (School of Engineering Information and Communications University)
  • Published : 2005.09.22

Abstract

도메인 조합에 기반한 단백질 상호작용 예측 기법은 효모와 같은 특정 종에 대하여 우수한예측 정확도를 보이는 것으로 알려졌으나, 인간과 같은 고등 생명체의 단백질에 대한 상호작용 예측을 수행하기 위하여는 여러종에 대한 기법의 적절성검증과 최적의 학습집단 구성 방안에 대한 연구가 선행되어야 한다. 본 논문에서는, 초파리 단백질을 이용한 예측 정확도 검증으로 도메인 조합 기법의 일반화 가능성을 타진 하고 이종간의 상호작용 예측실험 및 정확도 검증을 통하여 비교적 연구가 덜 되어진 종의 단백질 상호작용 예측을 위한 학습집단 구성 방법에 대하여 기술한다. 초파리 실험에서는 10351개의 상호작용이 있는 단백질 쌍 가운데, 80%와 20%를 각각 학습집단 및 실험집단으로 사용하였으며, 상호작용이 없는단백질 쌍의 학습집단은 1배에서 5배까지 변화시키면서 예측 정확도를 관찰하였다. 이 결과77.58%의 민감도와 92.61%의 특이도를 확인하였다. 이종간의 상호작용 예측 실험은 효모, 초파리, 효모, 초파리에 해당하는 학습집단 각각을 바탕으로 Human, Mouse, E. coli, C. elegans 등의 단백질 상호작용 예측을 수행하였다. 실험 곁과 학습집단의 도메인이 실험집단의 도메인과 많이 겹칠수록 높은 정확도를 보여주었으며, 도메인 집단간의 유사도를 나타내기 위해 고안한 Domain Overlapping Rate(DOR) 는 상호작용 예측 정확도의 중요한 요소임을 찾아내었다.

Keywords