질량스펙트럼의 펩타이드 분자량 오차범위 재해석에 의한 단백질 동정의 성능 향상

Improvement of protein identification performance by reinterpreting the precursor ion mass tolerance of mass spectrum

  • 권경훈 (한국기초과학지원연구원 연구장비개발부) ;
  • 김진영 (한국기초과학지원연구원 단백질체구조연구부) ;
  • 박건욱 (한국기초과학지원연구원 연구장비개발부) ;
  • 이정화 (한국기초과학지원연구원 단백질체구조연구부) ;
  • 백융기 (연세프로테옴연구센터, 질병유전단백체연구지원센터) ;
  • 유종신 (한국기초과학지원연구원 연구장비개발부)
  • 발행 : 2006.05.28

초록

프로테오믹스에서 얻는 탄뎀 질량 스펙트럼은 효소로 가수분해된 펩타이드의 전구이온(precursor ion) 분자량과 펩타이드에 에너지를 가하여 생성된 이온조각(fragment ion)들의 분자량값들로 구성된다. 탄뎀 질량스펙트럼의 전구이온 분자량은 단백질 서열 데이터베이스에서의 검객 과정에서 가장 먼저 고려하는 값이다. 단백질 검색 프로그램은 단백질 서열 중에 스펙트럼의 전구이온으로부터 계산된 분자량과 일치하는 펩타이드 서열들을 찾아내고, 이들 중의 하나를 이온조각들의 분자량 정보를 이용해서 선택한다. 이 때에 전구이온의 분자량은 사용자가 지정한 오차범위 내에서 일치하는 감을 검색하는데, 이때의 오차범위는 질량분석기의 정확도에 따라 결정된다. 본 논문에서는 인간 혈액의 혈장시료로부터 FT LTQ 질량분석기를 통해 얻어진 탄뎀 질량 스펙트럼에서 전구이온 분자량의 분포를 역순서열을 이용하여 분석하였다. 전구이온 분자량의 분포를 재해석하여 실험값의 정확도를 보정하고 단백질 동정의 성능을 향상시키는 방법을 모색하였다.

In proteomics research, proteins are digested into peptides by an enzyme and in mass spectrometer, these peptides break into fragment ions to generate tandem mass spectra. The tandem mass spectral data obtained from the mass spectrometer consists of the molecular weights of the precursor ion and fragment ions. The precursor ion mass of tandem mass spectrum is the first value that is fetched to sort the candidate peptides in the database search. We look far the peptide sequences whose molecular weight matches with precursor ion mass of the mass spectrum. Then, we choose one peptide sequence that shows the best match with fragment ions information. The precursor ion mass of the tandem mass spectrum is compared with that of the digested peptides of protein database within the mass tolerance that is assigned by users according to the mass spectrometer accuracy. In this study, we used reversed sequence database method to analyze the molecular weight distribution of precursor ions of the tandem mass spectra obtained by the FT LTQ mass spectrometer for human plasma sample. By reinterpreting the precursor ion mass distribution, we could compute the experimental accuracy and we suggested a method to improve the protein identification performance.

키워드