Highly accurate detection of cancer-specific copy number variations with MapReduce

맵리듀스 기반의 암 특이적 유전자 단위 반복 변이 추출

  • Shin, Jae-Moon (Department of Computer Engineering, Hallym University) ;
  • Hong, Sang-Kyoon (Department of Computer Engineering, Hallym University) ;
  • Lee, Un-Joo (Department of Electronic Engineering, Hallym University) ;
  • Yoon, Jee-Hee (Department of Computer Engineering, Hallym University)
  • 신재문 (한림대학교 컴퓨터공학과) ;
  • 홍상균 (한림대학교 컴퓨터공학과) ;
  • 이은주 (한림대학교 전자공학과) ;
  • 윤지희 (한림대학교 컴퓨터공학과)
  • Published : 2012.06.22

Abstract

모든 암 세포는 체세포 변이를 동반한다. 따라서 암 유전체 변이 분석에 의하여 암을 발생시키는 유전자 및 진단/치료법을 찾아낼 수 있다. 본 연구에서는 차세대 시퀀싱 데이터를 이용하여 암 특이적 단이 반복 변이(copy number variation, CNV) 유형을 밝히는 새로운 알고리즘을 제안한다. 제안하는 방식은 암 환자의 정상 세포와 암세포로부터 얻어진 정상 유전체와 암 유전체를 동시 분석하여 각각 CNV 후보 영역을 추출하며, 통계적 유의성 분석을 통하여 암 특이적 CNV 후보 영역을 선별하고, 다음 후처리 과정에서 참조 표준 서열(reference sequence)에 존재하는 오류 영역 보정 작업을 수행하여 정확한 암 특이적 CNV 영역을 추출해 낸다. 또한 다수의 대용량 유전체 데이터 동시 분석을 위하여 맵리듀스(MapReduce) 기법을 기반으로 하는 병렬 수행 알고리즘을 제안한다.

Keywords

Acknowledgement

Supported by : 한국연구재단