MarSel : The LD-based Marker Selection System for the Large-scale Datasets

MarSel : Large-scale Dataset에 대한 LD기반의 Marker 선택 시스템

  • 김상준 (중앙대학교 컴퓨터공학부) ;
  • 여상수 (중앙대학교 컴퓨터공학부) ;
  • 김성권 (중앙대학교 컴퓨터공학부)
  • Published : 2004.10.01

Abstract

인간(human)에게 나타나는 다양성(variation)은 인체의 유전체(genome) 안에서 발생된 SNP(Single Nucleotide Polymorphism)에 의해 나타난다고 알려져 있다. 유전체내의 SNP과 다양성에 대한 연관 연구(Associate study)를 할 때에 약 30여 억 개로 추정되는 염기서열(DNA sequence)물 모두 분석한다면 많은 비용과 시간을 필요로 할 것이다. 이런 비용과 시간을 줄이기 위친 적은 수의 대표 SNP(=tagSNP)을 찾는 연구가 현재 진행 중이다. 우리는 LD계수|D;|을 block 분할에 이용하여 생물학적인 의미를 부여한 후, 전산적인 최적해를 찾는 접근을 이용했다. 또한, 기존 연구에서는 large-scale data에 대한 처리가 불가능해서 chromosome의 일부분의 데이터에 대해서안 분석이 시도되었다. 더욱 광범위한 분석을 위해서 chromosome 단위의 처리가 필요하다. 우리는 chromosome단위의 SNP data를 한 번에 처리가 가능한 시스템인 MarSel를 구현하였다

Keywords