Development of Contig Assembly Program for Nucleotide Sequencing

염기서열 해독작업을 위한 핵산 단편 조립 프로그램의 개발

  • 이동훈 (충북대 자연과학대학 생명과학부)
  • Published : 1999.06.01

Abstract

An effective computer program for assembling fragments in DNA sequencing has been developed. The program, called SeqEditor (Sequence Editor), is usable on the pcrsonal computer systems of MS-Widows which is the mosl popular operating system in Korea. It c'm recd several sequence file formats such as GenBak, FASTA, and ASCII. In the SeqEditor program, a dynamic programming algorihm is applied to compute the maximalscoring overlapping alignment between each pjlr of fragments. A novel feature of the program is that SeqEdilor implemnents interaclive operation with a graphical user interface. The performance lests of the prograln 011 fragmen1 data from 16s and 18s rDNA sequencing pi-ojects produced saiisIactory results. This program may be useful to a person who has work of time with large-scale DNA sequencing projects.

염기서열 해독작업에서 각 핵산 단편을 조립하는 contig 구성문제에 활용이 가능한 computer program을 개발하였다. 본 프로그램은 국내에서 광범위하게 사용되고 있는 MS-Windows 운영체제의 개인용 컴퓨터에서 작동이 가능하며, GenBank, FASTA, ASCII 등과 같은 다양한 형태의 염기서열 자료를 입력할 수 있다. 두 단편에서 최대 유사도를 나타내는 부분을 정렬하는 작업에는 염기서열의 국부적 상동성을 계산하고 dynamic programming 알고리즘을 적용하는 방법을 이용하였다. 또한 사용하기 편리한 그래픽 방식의 인터페이스를 제공하여 초보자라도 손쉽게 조작할 수 있다는 장점을 갖는다. 본 프로그램의 성능을 검증하기 위하여 세균과 곰팡이로부터 해독된 16S rRNA 와 18S rRNA 유전자의 단편 염기서열을 재구성하는 작업에 프로그램을 사용하였을 때에 효율적인 작업이 가능하였다.

Keywords

References

  1. The Microorganisms & Industry v.21 RNA 분석 프로그램의 개발 박기정;김승목;박찬규;박용하
  2. Kor. J. Microbiol. v.34 DNA 염기 서열로부터 contig 구성을 위한 프로그램 XFAP의 개발 이병욱;박기정;김승목
  3. Kor. J. Microbiol. Biotechnol. v.25 DNA 염기서열의 단편 조립 프로그램의 개발 이병욱;박기정;박완;박용하
  4. 정보과학회논문지(B) v.23 컴퓨터 모델링을 이용한 RNA 분자의 이차구조 예측 한정숙;김홍진
  5. Nucl. Acids Res. v.26 GenBank Benson, D.A.;M.S.Boguski;D.J. Lipman;J.Ostell;B.F. Ouellette
  6. Nucl. Acids Res. v.23 A new DNA sequence assembly program Bonfield, J.K.;K.F. Smith;R. Staden
  7. Nucl. Acids Res. v.16 A nomenclature for incompletely specified bases in nucleic acid sequences: recommendation Cornish-Bowden, A.
  8. J. Mol. Biol. v.162 An improved algorithm for matching biological sequences Gotoh, O.
  9. Genomics v.33 An improved sequence assembly program Huang, X.
  10. Genomics v.14 A contig assembly program based on sensitive detection of fragment overlaps Huang, X.
  11. Proc. Natl. Acad. Sci. USA v.82 Rapid determination of 16SrRNA sequences for phylogenetic anlaysis Lane, D.J.;B. Pace;G.J. Olsen;D.A. Stahl;M.L.Sogin;N.R. Pace
  12. Appl. Environ. Microbiol. v.62 Nonradioactive method to study genetic profiles of natural bacterial communities by PCR Single-Strand-Conformation Polymorphism Lee, D. H.;Y.G. Jo;S. J. Kim
  13. Kor. J. Microbiol. v.24 Rapid plasmid mapping computer program Lee, D. H.;Y.J.Kim;S.T.Lee;H.S. Kang
  14. Proc. Natl. Acad. Sci. USA v.72 Nucleotide sequence of the rightward operator of phage lambda Maniatis, T.;A. Jeffrey;D.G. Kleid
  15. J. Mol. Biol. v.5 Determination of base composition of deoxyribonucleic acid from its thermal denaturation temperature Marmur, J.;P. Doty
  16. Proc. Natl. Acad. Sci. USA v.85 Improved tools for biological sequence comparison Pearson, W.R.;D.J. Lipman
  17. Nucl. Acids Res. v.12 SEQAID: a DNA sequence assembling program based on a mathematical model Peltola, H.;H. Soderlund;E. Ukkonen
  18. DNA Seq. v.7 A method to direct sequence cosmid LAWRIT16 clones Repetto, M.;A. Ballabio;M. Zollo
  19. J. Mol. Biol. v.147 Identification of common molecular subsequences Smith, T.F.;M.S. Waterman
  20. Nucl. Acids Res. v.8 A new computer method for the storage and manipulation of DNA gel reading data Staden,R.
  21. Mathematical Biosciences v.77 A dynamic programming algorithm to find all solutions in a neighborhood of the optimum Waterman, M.S.;T.H. Byers
  22. PCR Protocols: a guide to methods and applications Amplification and direct sequencing of fungal ribosomal RNA genes for phylogenetics White, T.J.;T. Bruns;S.Lee;J. Taylor;M.A. Innis;D.H.Gelfand;J.J.Sninsky;T.J.White(ed.)