주요 서열 구성의 선택에 의한 단백질의 세포내 소기관 위치 예측

Predication of Protein Subcelluar Localization by Selecting Significant Sequence Composition

  • 김수진 (서울대학교 생물정보학, 서울대학교 바이오정보기술 연구센터) ;
  • 정제균 (서울대학교 생물정보학, 서울대학교 바이오정보기술 연구센터) ;
  • 이제근 (서울대학교 생물정보학, 서울대학교 바이오정보기술 연구센터) ;
  • 장병탁 (서울대학교 생물정보학, 서울대학교 바이오정보기술 연구센터, 서울대학교 컴퓨터공학부)
  • Kim Soo-Jin (Graduate Program in Bioinformatics, Center for Bioinformation Technology, Seoul National University) ;
  • Joung Je-Gun (Graduate Program in Bioinformatics, Center for Bioinformation Technology, Seoul National University) ;
  • Rhee Je-Keun (Graduate Program in Bioinformatics, Center for Bioinformation Technology, Seoul National University) ;
  • Zhang Byoung-Tak (School of Computer Science and Engineering, Seoul National University)
  • 발행 : 2005.07.01

초록

단백질들이 어느 세포내 소기관에 위치하는지에 대한 지식은 그들의 기능을 예측하는데 있어서 중요한 정보를 제공한다. 하지만 실험적으로 세포내 소기관 위치를 분석하는 작업은 않은 비용과 시간을 요구한다. 따라서 지금까지 단백질의 세포내 소기관 위치 예측을 위한 다양한 계산적 방법들이 개발되었으나, 효율적인 학습 데이터의 생성에 있어서 문제점을 가지고 있다. 본 논문은 기계학습 기법을 이용하여 주요 서열 구성을 선택함으로써 예측의 성능을 최대화 하는 방법을 제안하고자 한다. 실험은 효모의 단백질의 세포 내 소기관 위치 예측에 있어서 주요 아미노산 서열들을 선택함으로써 예측의 성능을 향상시키는 결과를 보이고 있다.

키워드