DOI QR코드

DOI QR Code

EP-tree 마이닝을 이용한 단백질 DISORDER/ORDER 지역 분류

Classification of Protein DISORDER/ORDER Region Using EP-tree Mining

  • 박홍규 (한국전자통신연구원 우정물류기술연구부) ;
  • 이헌규 (한국전자통신연구원 우정물류기술연구부) ;
  • 이미정 (충북대학교 데이터베이스/바이오인포메틱스 연구실)
  • Park, Hong-Kyu (Dept. of Postal&Logistics Technology, Electronics & Telecommunication Research Institute) ;
  • Lee, Heon-Gyu (Dept. of Postal&Logistics Technology, Electronics & Telecommunication Research Institute) ;
  • Li, Mei-Jing (Database/Bioinformactics Lab., Chungbuk National University)
  • 발행 : 2011.04.30

초록

단백질 1차 서열로부터 DISORDER와 ORDER지역을 예측하기 위해서 이 논문에서는 EP-tree에 기반한 출현패턴 발견 알고리즘을 제안하였다. EP-tree 알고리즘을 적용함으로서 기존의 단백질 특징 추출을 통한 방법과 달리 서열 자체에서 발견되는 출현패턴만을 이용하여 분류 모델을 생성하므로 기존의 신경망이나 SVM 보다 분류모델 생성 및 예측 속도가 빠르다. 또한 Disprot 4.9과 CASP7 테스트 데이터로 DISORDER/ORDER 지역을 예측한 결과, 73.4%의 높은 정확성을 보였다.

키워드