DOI QR코드

DOI QR Code

Tag-SNP selection and online database construction for haplotype-based marker development in tomato

유전자 단위 haplotype을 대변하는 토마토 Tag-SNP 선발 및 웹 데이터베이스 구축

  • 정혜리 ((주)씨더스 농업회사법인) ;
  • 이보미 ((주)씨더스 농업회사법인) ;
  • 이봉우 ((주)씨더스 농업회사법인) ;
  • 오재은 ((주)씨더스 농업회사법인) ;
  • 이정희 ((주)씨더스 농업회사법인) ;
  • 김지은 ((주)씨더스 농업회사법인) ;
  • 조성환 ((주)씨더스 농업회사법인)
  • Received : 2020.06.23
  • Accepted : 2020.07.22
  • Published : 2020.09.30

Abstract

This report describes methods for selecting informative single nucleotide polymorphisms (SNPs), and the development of an online Solanaceae genome database, using 234 tomato resequencing data entries deposited in the NCBI SRA database. The 126 accessions of Solanum lycopersicum, 68 accessions of Solanum lycopersicum var. cerasiforme, and 33 accessions of Solanum pimpinellifolium, which are frequently used for breeding, and some wild-species tomato accessions were included in the analysis. To select tag-SNPs, we identified 29,504,960 SNPs in 234 tomatoes and then separated the SNPs in the genic and intergenic regions according to gene annotation. All tag-SNP were selected from non-synonymous SNPs among the SNPs present in the gene region and, as a result, we obtained tag-SNP from 13,845 genes. When there were no non-synonymous SNPs in the gene, the genes were selected from synonymous SNPs. The total number of tag-SNPs selected was 27,539. To increase the usefulness of the information, a Solanaceae genome database website, TGsol (http://tgsol. seeders.co.kr/), was constructed to allow users to search for detailed information on resources, SNPs, haplotype, and tag-SNPs. The user can search the tag-SNP and flanking sequences for each gene by searching for a gene name or gene position through the genome browser. This website can be used to efficiently search for genes related to traits or to develop molecular markers.

유전체 정보가 공공 데이터베이스 내에 빠르게 축적이 되면서 유전체 데이터의 활용도를 높이기 위한 재가공 기술과 공유 기술이 지속적으로 중요해지고 있다. 특히 분자육종을 가속화하기 위해서 다양한 목적에 맞는 분자 마커 개발이 중요하다. 본 연구는 이러한 요구를 해소하기 위해 유전자 단위에서 haplotype을 기본단위로 구분하고 해당 유전자의 haplotype을 대변하는 tag-SNP를 선발하여 분자 마커 등을 개발하는데 사용할 수 있도록 관련 정보를 웹 사이트를 통해서 제공하고자 웹 데이터베이스를 구축하였다. 본 연구를 통해 선발된 각 tag-SNP는 하나의 유전자를 대변할 수 있고, 각 유전자의 haplotype을 구분할 수 있으며, 해당 유전자의 염색체 내 위치 정보, non-synonymous SNP의 정보를 담고 있다. 따라서 기존 무작위 방식으로 선발되어 사용되던 SNP에 비하여 정보력이 높은 tag-SNP를 활용해서 haplotype block을 확장할 수 있을 것이다. Haplotype의 기본 단위를 유전자로 설정함으로써 집단이 바뀜에 따라 발생하는 SNP의 유무, LD block의 크기 등이 변하는 문제점을 극복하고, 표준화된 haplotype library 작성이 가능할 것이며 이는 또한 분자육종을 위한 분자 마커를 선발하는데 활용될 수 있을 것으로 기대된다.

Keywords

References

  1. Barrett JC (2009) Haploview: Visualization and analysis of SNP genotype data. Cold Spring Harb Protoc 2009(10):pdb.ip71. doi:10.1101/pdb.ip71
  2. Bombarely A, Menda N, Tecle IY, Buels RM, Strickler S, Fischer-York T, Pujar A, Leto J, Gosselin J, Mueller LA. (2011) The Sol Genomics Network (solgenomics.net): growing tomatoes using Perl. Nucleic Acids Res. 39 (Database issue):D1149-55. doi: 10.1093/nar/gkq866.
  3. Choe J, Kim JE, Lee BW, Lee JH, Nam M, Park YI, Jo SH (2018) A comparative synteny analysis tool for target-gene SNP marker discovery: connecting genomics data to breeding in Solanaceae. Database (Oxford) bay047, doi:10.1093/database/bay047
  4. Collard BC, Mackill DJ (2008) Marker-assisted selection: an approach for precision plant breeding in the twenty-first century. Philos Trans R Soc Lond B Biol Sci 363(1491):557-572. doi:10.1098/rstb.2007.2170
  5. Cox MP, Peterson DA, Biggs PJ (2010) SolexaQA: At-a-glance quality assessment of Illumina second-generation sequencing data. BMC Bioinformatics 11:485. doi:10.1186/1471-2105-11-485
  6. de Haas LS, Koopmans R, Lelivelt CLC, Ursem R, Dirks R, Velikkakam James G (2017) Low-coverage resequencing detects meiotic recombination pattern and features in tomato RILs. DNA Res. 1;24(6):549-558. doi: 10.1093/dnares/dsx024
  7. Kim JE, Oh SK, Lee JH, Lee BM, Jo SH (2014) Genome-wide SNP calling using next generation sequencing data in tomato. Mol Cells 37(1):36-42. doi:10.14348/molcells.2014.2241
  8. Li H, Durbin R (2009) Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics (Oxford, England) 25(14):1754-1760. doi:10.1093/bioinformatics/btp324
  9. Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R, 1000 Genome Project Data Processing Subgroup (2009) The Sequence Alignment/Map format and SAMtools. Bioinformatics 25(16):2078-2079. doi:10.1093/bioinformatics/btp352
  10. Lin T, Zhu G, Zhang J, Xu X, Yu Q, Zheng Z, Zhang Z, Lun Y, Li S, Wang X, Huang Z, Li J, Zhang C, Wang T, Zhang Y, Wang A, Zhang Y, Lin K, Li C, Xiong G, Xue Y, Mazzucato A, Causse M, Fei Z, Giovannoni JJ, Chetelat RT, Zamir D, Städler T, Li J, Ye Z, Du Y, Huang S (2014) Genomic analyses provide insights into the history of tomato breeding. Nat Genet. 46(11):1220-6. doi: 10.1038/ng.3117
  11. Pook T, Schlather M, de Los Campos G, Mayer M, Schoen CC, Simianer H (2019) HaploBlocker: Creation of Subgroup-Specific Haplotype Blocks and Libraries. Genetics. 212(4): 1045-1061. doi: 10.1534/genetics.119.302283
  12. Shirasawa K, Fukuoka H, Matsunaga H, Kobayashi Y, Kobayashi I, Hirakawa H, Isobe S, Tabata S (2013) Genome-wide association studies using single nucleotide polymorphism markers developed by re-sequencing of the genomes of cultivated tomato. DNA Res. 20(6):593-603. doi: 10.1093/dnares/dst033
  13. Willer CJ, Scott LJ, Bonnycastle LL, Jackson AU, Chines P, Pruim R, Bark CW, Tsai YY, Pugh EW, Doheny KF, Kinnunen L, Mohlke KL, Valle TT, Bergman RN, Tuomilehto J, Collins FS, Boehnke M (2006) Tag SNP selection for Finnish individuals based on the CEPH Utah HapMap database. Genet Epidemiol. 30(2):180-90. doi: 10.1002/gepi.20131