SNPchaser : DNA서열의 SNPs 치환 및 Heterozygosity 확인 프로그램

SNPchaser : A Web-based Program for Detecting SNPs Substitution and Heterozygosity Existence

  • 장진우 (한국폴리텍 바이오대학 바이오생명정보과) ;
  • 이현철 ((주)디앤피바이오텍) ;
  • 이명훈 ((주)디앤피바이오텍) ;
  • 최연식 (한국폴리텍 바이오대학 의생명동물과) ;
  • 추동원 (한국폴리텍 바이오대학 바이오생명정보과) ;
  • 박기정 ((주)스몰소프트 정보기술연구소) ;
  • 이대상 (한국폴리텍 바이오대학 바이오생명정보과)
  • 발행 : 2009.08.29

초록

단염기 다양성 (Single-Nucleotide Polymorphisms, SNPs)은 핵산수준에서의 개개인의 유전 서열간의 차이를 나타내는 말로 최근 맞춤의약 분야에서 각광 받고 있다. 일반적으로 SNPs존재 유무를 확인하는데 주로 사용되는 방법은 ABI automated DNA sequencer와 같은 대용량 염기서열 결정 기계에서 산출되는 결과물 파일로부터 DNA서열을 추출하여 BLAST와 같은 상동성 검색을 수행하는 것이다. 본 논문에서는 사용자로부터 참조서열, AB1파일, SNPs 존재 가능성을 가진 염기의 위치 정보를 입력 값으로 받아 해당 위치에 존재하는 염기의 SNPs 치환 및 heterozygosity 여부를 확인 할 수 있는 프로그램인 SNPchaser를 개발하였다. 특정 유전자 서열 내에서 SNPs를 보이는 염기의 위치에 대한 정보를 사용자가 알고 있는 경우, 전체 유전자 서열에 대해 SNPs유무를 조사할 필요 없이 SNPs를 보인다고 보고된 위치의 염기를 조사하여 SNPs유무를 판단하고, 해당지역의 염기의 chromatogram정보를 사용자에게 제공하는 기능을 가지고 있다. 또한 SNPchaser는 사람과 같은 2배체의 염색체를 가진 생명체에 존재 하는 SNPs지역의 염기에 대한 heterozygosity여부를 사용자가 손쉽게 판별할 수 있도록 하였다. 본 논문에서 개발한 SNPchaser는 http://www.bioinformatics.ac.kr/SNPchaser에서 사용 가능하다.

Single-nucleotide polymorphisms (SNPs) are the DNA sequences difference among the same species in the level of nucleic acids and are widely applied in clinical fields such as personalized medicine. The routine and labor-intensive methods to determine SNPs are performing the sequence homology search by using BLAST and navigating the trace of chromatogram files generated by high-throughput DNA sequencing machine by using Chromas program. In this paper, we developed SNPchaser, a web-based program for detecting SNPs substitution and heterozygosity existence, to improve the labor-intensive method in determining SNPs. SNPchaser performed sequence alignment and visualized the suspected region of SNPs by using user's reference sequence, AB1 files, and positional information of SNPs. It simultaneously provided the results of sequences alignment and chromatogram of relevant area of SNPs to user. In addition, SNPchaser can easily determine existence of heterozygosity in SNPs area. SNPchaser is freely accessible via the web site http://www.bioinformatics.ac.kr/SNPchaser and the source codes are available for academic research purpose.

키워드

참고문헌

  1. Kenneth, M. W. and Joseph, D. T. (2000), How many diseases does it take to map a gene with SNPs, Nature Genetics 26, 151-157
  2. Jakobsson, M., S. W. Scholz, P. Scheet, J. R. Gibbs, J. M. VanLiere, H. Fung, Z. A. Szpiech, J. H. Degnan, K. Wang, R. Guerreiro, J. M. Bras, J. C. Schymick, D. G. Hemandez, B. J. Traynor, J. Simon-Sanchez, M. Matarin, A. Britton, J. Leemput, I. Rafferty, M. Bucan, H. M. Cann, J. A. Hardy, N. A. Rosenberg, and A. B. Singleton (2008), Integrated genotype calling and association analysis of SNPs, common copy number polymorphisms and rare CNVs, Nature Genetics 40, 1253-1260 https://doi.org/10.1038/ng.237
  3. 조영훈, 박기정, 이대상 (2008), 핵산증폭용 특정 길이의 Primer 검색 프로그램, 한국미생물학회지 44, 164-167
  4. Matsuzaki, H., S. Dong, H. Loi, X. Di, G. Liu, E. Hubbell,J. Law, T. Bemtsen, M. Chadha, H. Hui, G. Yang, G. C. Kennedy, T. A. Webster, S. Cawley, P. S. Walsh, K. W. Jones, S. P. Fodor, and R. Mei (2004), Genotyping over 100,000 SNPs on a pair of oligonucleotide arrays, Nature Methods. 1, 109-111 https://doi.org/10.1038/nmeth718
  5. http:/ /blast.ncbi.nlm.nih.gov/
  6. S. F. Altsch띠, T. L. Madden, A. A. Schaffer, J. Zhang, Z. Zhang, W. Miller, and D. J. Lipman (1997), Gapped BLAST and PSI-BLAST : A new gεneration of protein database search programs, Nucleic Acids Res. 25, 3389-3402 https://doi.org/10.1093/nar/25.17.3389
  7. Yamada, K., M. Hirota, Y. Niimi, H. Nguyen, Y. Takahara, Y. Kami, and J. Kanek (2006), Nucleotide sequences and organization of the genes for carotovoricin (Ctv) from Erwinia carotovora indicate that ctv evolved from the same ancestor as Salmonella typhi prophage. Bioscience, Biotechnology, and Biochemistry 70, 2236-2247 https://doi.org/10.1271/bbb.60177
  8. Smith, T. F. and M. S. Waterman (1981), Identification of common molecular subsequence, J. Mol. Biol. 48, 443-453 https://doi.org/10.1016/0022-2836(70)90057-4
  9. Cho, H., W. Koh, Y. Ryu, C. Ki, M. Nam, J. Kim, and S. Lee (2007), Genetic polymorphisms of NAT2 and CYP2El associated with antituberculosis druginduced hepatotoxicity in Korean patients with pulmonary tuberculosis, Tuberculosis 87, 551-556 https://doi.org/10.1016/j.tube.2007.05.012
  10. Payne, K., W. Newman, E. Fargher, K. Tricker, I. N. Bruce, and W. E. R. Ollier (2007), TPMT testing in rheumatology : any better than routine monitoring, Rheumatology 46, 727-729 https://doi.org/10.1093/rheumatology/kel427