DOI QR코드

DOI QR Code

단백질 동정을 위한 Mowse 스코어링 방법의 성능 개선

Performance Improvement of Mowse Scoring Method for Protein Identification

  • 정민아 (목포대학교 컴퓨터교육과) ;
  • 김치연 (목포해양대학교 해양전자통신공학부)
  • 발행 : 2007.10.31

초록

본 논문은 단백질 동정에 이용하는 펩타이드-매스 핑거프린팅 툴 중 하나인 Mowse의 성능을 개선하는 방법을 제안한다. Mowse에서 빈발 요소 행렬은 단백질과 펩타이드 질량에 대하여 일정한 간격으로 생성되어 행렬의 각 원소의 값은 펩타이드의 빈발횟수에 따라 계산된다. 현재 이러한 행렬을 생성하는데 있어서 정해진 간격으로 생성되는데 이러한 간격의 값이 작아질수록 스코어링 값은 정확해진다. 그러나 이러한 간격의 값이 작아질수록 행렬의 크기는 증가하게 되며 이에 따라 스코어링 계산의 복잡도도 증가하게 된다. 본 논문에서는 행렬의 크기를 현재와 같이 유지하면서 스코어 링 값을 정확하게 계산하기 위한 새로운 방법을 제안한다. 현재 Mowse에서 검색 대상이 되는 단백질 데이터베이스의 분포를 고려하여 비선형적으로 행렬의 간격의 값을 정하는 방법 즉, 임의의 단백질 질량 값이 많은 곳에서는 행렬의 간격을 작게 결정하는 반면 단백질 질량 값이 적은 곳에서는 행렬의 간격을 크게 결정하는 방법을 새롭게 제안하였다. 또한, 성능평가는 Mowse 스코어링 방법과 본 논문에서 제안한 새로운 스코어링 방법에 관하여 수행하고 분석결과를 제시하였다.

In this paper, we propose the method that improve the performance of the Mowse. Mowse is the tool of the peptide mass fingerprinting that is used the identification of protein. In Mowse, frequency factor matrix is generated to regular interval for protein and peptide mass and the value of each elements is calculated to frequency of peptide. We propose new method for calculation of exact scoring value maintaining same size of matrix. The proposed method is that decide interval of matrix considering distribution of protein database. That is, interval of matrix is decided to small in many value of protein mass and is decided to large in few value of protein mass. We present the performance result both Mowse scoring method and the proposed scoring method.

키워드

참고문헌

  1. S. R. Penningron and M. J. Dunn, Proteomics From Protein Sequence To Function, 2001. Springer-Verlag
  2. M. R. Wilkins, K. L. Williams, R. D. Appel, and D. F. Hochstrasser, Proteom Research: New Frontiers in Fuctional Geomics, Springer-Verlag
  3. G. Kris and Joel Vandekerckhove, 'Protein identification methods in proteomics,' Electrophoresis, 21, 2000, pp.1145-1154 https://doi.org/10.1002/(SICI)1522-2683(20000401)21:6<1145::AID-ELPS1145>3.0.CO;2-Z
  4. C. L. Daniel, Introduction to Proteomics, Humana Press
  5. Tang, C., Zhang, W., Fenyo, D., and Chait, B. T., 'Assessing the performance of Different Protein Identification Algorithms,' 48th ASMS Conference, June 11-15, 2000
  6. Pappin, D. J. C., Hojrup, P., and Bleasby., 'Rapid Identification of Proteins by Pepide-Mass Fingerprinting,' Current Biology, 3, 1993, pp.327-332 https://doi.org/10.1016/0960-9822(93)90195-T
  7. Perkins, D. N., Pappin, D. J. C., Creasy, D. M. and Cottrell, J. S., 'Probability-based protein identification by searching sequence databases using mass spectrometry data,' Electrophoresis, 20, 1999, pp.3551- 3567 https://doi.org/10.1002/(SICI)1522-2683(19991201)20:18<3551::AID-ELPS3551>3.0.CO;2-2
  8. Zhang, W. and Chait, B. T., 'ProFound - An expert system for protein identification using mass spectrometric peptide mapping information,' Anal. Chem., 72(11), 2000, pp.2482-2489 https://doi.org/10.1021/ac991363o
  9. P. R. Baker and K. R. Clauser, 1995. http://prospector.ucsf.edu
  10. M. R. Wilkins, E. Gasteiger, A. Bairoch, J. C. Sanchez, K. L. Williams, R. D. Appel, and D. F. Hochstrasser, Protein Identification and Analysis Tools in the ExPASy Server in: 2-D Proteom Analysis Protocols, 1998, Humana Press
  11. M. R. Wilkins, E. Gasteiger, C. Wheeler, I. Lindskog, J. C. Sanchez, A. Bairoch, R. D. Appel, M. D. Dunn, and D. F. Hochstrasser, 'Multiple parameter cross-species protein identification using MultiIdent, Electrophoresis, 19(18), 1998, p.3199-3206 https://doi.org/10.1002/elps.1150191824