DOI QR코드

DOI QR Code

Solving the Haplotype Assembly Problem for Human Using the Improved Branch and Bound Algorithm

개선된 분기한정 알고리즘을 이용한 인간 유전체의 일배체형 조합문제 해결

  • 최문호 (전남대학교 전산학과) ;
  • 강승호 (동신대학교 정보보안학과) ;
  • 임형석 (전남대학교 전자컴퓨터공학부)
  • Received : 2013.04.22
  • Accepted : 2013.06.26
  • Published : 2013.10.31

Abstract

The identification of haplotypes, which encode SNPs in a single chromosome, makes it possible to perform haplotype-based association tests with diseases. Minimum Error Correction model, one of models to computationally assemble a pair of haplotypes for a given organism from Single Nucleotide Polymorphism fragments, has been known to be NP-hard even for gapless cases. In the previous work, an improved branch and bound algorithm was suggested and showed that it is more efficient than naive branch and bound algorithm by performing experiments for Apis mellifera (honeybee) data set. In this paper, to show the extensibility of the algorithm to other organisms we apply the improved branch and bound algorithm to the human data set and confirm the efficiency of the algorithm.

인간의 한쪽 염색체상에 나타나는 SNP의 서열인 일배체형을 식별해내면 효과적인 유전질병 연관검사를 할 수 있다. 주어진 SNP 단편들로부터 계산적인 방법으로 한 쌍의 일배체형을 조합하기 위해 제시된 모델 중 하나인 최소오류수정 모델은 단편에 손실이 없는 경우조차 NP-hard임이 증명되었다. 기존의 분기한정 알고리즘은 많은 계산시간을 요구함에 따라 실제 응용에 사용하기 어려웠다. 그러나 최근에 개선된 분기한정 알고리즘이 제시되었고, 꿀벌(Apis mellifera)의 유전자형 데이터를 대상으로 성능을 분석해봄으로써 개선된 알고리즘이 기존 분기한정 알고리즘보다 효율적임을 보였다. 본 논문에서는 인간의 유전자형 데이터를 대상으로 개선된 분기한정 알고리즘을 적용해 일배체형 조합문제를 수행한다. 실험을 통한 성능분석 결과, 개선된 분기한정 알고리즘이 인간 유전체에 대해서도 성공적으로 적용됨을 확인함으로써 다양한 생명체의 일배체형 조합문제에 적용 가능함을 보인다.

Keywords

References

  1. The International HapMap Consortium, "A second generation human haplotype map of over 3.1 million SNPs," Nature, Vol.449, pp.851-861, 2007. https://doi.org/10.1038/nature06258
  2. Wikipedia, http://en.wikipedia.org/wiki/Haplotype.
  3. C. Burgtorf, P. Kepper, M. Hoehe, C. Schmitt, R. Reinhardt, H. Lehrach, S. Sauer, "Clone-based systematic haplotyping (CSH): A procedure for physical haplotyping of whole genomes," Genome Research, Vol.13, pp.2717-2724, 2003. https://doi.org/10.1101/gr.1442303
  4. A. Graça, I. Lynce, J. Marques-Silva, and A.L. Oliveira, "Haplotype inference by Pure Parsimony: a survey", Journal of Computational Biology, Vol.17, pp.969-992, 2010. https://doi.org/10.1089/cmb.2009.0101
  5. S.R. Browning and B.L. Browning, "Haplotype phasing: existing methods and new developments," Nature Reviews Genetics, Vol.12, pp.703-714, 2011. https://doi.org/10.1038/nrg3054
  6. X. S. Zang, R. S. Wang, L. Y. Wu, and L. Chen, "Models and algorithms for haplotyping problem," Current Bioinformatics, Vol.1, No.1, pp.105-114, 2006. https://doi.org/10.2174/157489306775330570
  7. R. Schwartz, "Theory and Algorithms for the Haplotype Assembly Problem," Communication in Information and Systems, Vol.10, No.1, pp.23-38, 2010. https://doi.org/10.4310/CIS.2010.v10.n1.a2
  8. M. J. Daly, J. D. Rioux, S. F. Schaffner, T. J. Hudson, E. S. Lander, "High-resolution haplotype structure in the human genome," Nature Genetics, Vol.29, pp.229-232, 2001. https://doi.org/10.1038/ng1001-229
  9. S. H. Kang, I. S. Jeong, H. G. Cho, H. S. Lim, "HapAssembler: A web server for haplotype assembly from SNP fragments using genetic algorithm," Biochemical and Biophysical Research Communications, Vol.397, pp.340-344, 2010. https://doi.org/10.1016/j.bbrc.2010.05.125
  10. R. S. Wang, L. Y. Wu, Z. P. Li, X. S. Zhang, "Haplotype reconstruction from SNP fragments by minimum error correction," Bioinformatics, Vol.21, pp.2456-2462, 2005. https://doi.org/10.1093/bioinformatics/bti352
  11. R. Lippert, R. Schwartza, G. Lancia, and S. Istrail, "Algorithmic Strategies for the SNPs Haplotype Assembly Problem," Briefings in Bioinformatics, Vol.3, No.1, pp.23-31, 2002. https://doi.org/10.1093/bib/3.1.23
  12. M, Xie, J. Wang, J. Chen, "A practical exact algorithm for the individual haplotyping problem MEC," in Proceedings of the 2008 International Conference on BioMedical Engineering and Informatics, pp.72-76, 2008.
  13. J. Wang, et al., "A Practical Exact Algorithm for the Individual Haplotyping Problem MEC/GI," Algorithmica, Vol.56, pp.283-296, 2010. https://doi.org/10.1007/s00453-009-9288-1
  14. H. S. Lim, I. S. Jeong, and S. H. Kang, "Individual haplotype assembly of Apis mellifera (honeybee) using a practical branch and bound algorithm," Journal of Asia Pacific Entomology, Vol.15, pp.375-381, 2012. https://doi.org/10.1016/j.aspen.2012.05.012
  15. R. Cilibrasi, L. Iersel,S. Kelk, and J. Tromp, "The Complexity of the Single Individual SNP Haplotyping Problem," Algorithmica, Vol.49, No.1, pp.13-36, 2007. https://doi.org/10.1007/s00453-007-0029-z