Estimation of the steps of cardiovascular disease by machine learning based on aptamers-based biochip data

기계학습에 의한 압타머칩 데이터 기반 심혈관 질환 단계의 예측

  • 김병희 (서울대학교 컴퓨터공학부 바이오지능 연구실) ;
  • 김성천 ((주) 제노프라) ;
  • 장병탁 (서울대학교 컴퓨터공학부 바이오지능 연구실)
  • Published : 2006.06.01

Abstract

압타머칩은 (주)제노프라에서 개발한 새로운 개념의 바이오칩으로서, 압타머(aptamer)를 이용하여 혈액중의 특정 단백질군의 상대적인 양의 변화를 측정할 수 있으며, 질병 진단에 바로 응용할 수 있는 도구이다. 본 논문에서는 압타머칩 데이터 분석을 통해 심혈관 질환 환자의 질병 진행 단계를 예측할 수 있음을 보인다. 정상, 안정/불안정성 협심증, 심근경색의 네 단계로 표지된 환자의 혈액 샘플로부터 제작한 (주)제노프라의 3K 압타머칩 데이터를, 일반 DNA 마이크로어레이 분석과 동일한 과정을 거쳐 분류한 결과, 각 단계별 환자샘플이 확연히 구분되는 것을 확인하였다. 분산분석 결과 P-Value를 이용하여 자질 선택을 수행하고, 분류 알고리즘으로는 신경망, 결정트리, SVM, 베이지안망을 적용한 결과. 각 알고리즘별로 50대 남성환자 31개의 샘플에 대하여 $77{\sim}100%$의 정확도로 심혈관 질환의 단계를 구분해내었다.

Keywords