염기서열 해독작업을 위한 핵산 단편 조립 프로그램의 개발

Development of Contig Assembly Program for Nucleotide Sequencing

  • 이동훈 (충북대 자연과학대학 생명과학부)
  • 발행 : 1999.06.01

초록

염기서열 해독작업에서 각 핵산 단편을 조립하는 contig 구성문제에 활용이 가능한 computer program을 개발하였다. 본 프로그램은 국내에서 광범위하게 사용되고 있는 MS-Windows 운영체제의 개인용 컴퓨터에서 작동이 가능하며, GenBank, FASTA, ASCII 등과 같은 다양한 형태의 염기서열 자료를 입력할 수 있다. 두 단편에서 최대 유사도를 나타내는 부분을 정렬하는 작업에는 염기서열의 국부적 상동성을 계산하고 dynamic programming 알고리즘을 적용하는 방법을 이용하였다. 또한 사용하기 편리한 그래픽 방식의 인터페이스를 제공하여 초보자라도 손쉽게 조작할 수 있다는 장점을 갖는다. 본 프로그램의 성능을 검증하기 위하여 세균과 곰팡이로부터 해독된 16S rRNA 와 18S rRNA 유전자의 단편 염기서열을 재구성하는 작업에 프로그램을 사용하였을 때에 효율적인 작업이 가능하였다.

An effective computer program for assembling fragments in DNA sequencing has been developed. The program, called SeqEditor (Sequence Editor), is usable on the pcrsonal computer systems of MS-Widows which is the mosl popular operating system in Korea. It c'm recd several sequence file formats such as GenBak, FASTA, and ASCII. In the SeqEditor program, a dynamic programming algorihm is applied to compute the maximalscoring overlapping alignment between each pjlr of fragments. A novel feature of the program is that SeqEdilor implemnents interaclive operation with a graphical user interface. The performance lests of the prograln 011 fragmen1 data from 16s and 18s rDNA sequencing pi-ojects produced saiisIactory results. This program may be useful to a person who has work of time with large-scale DNA sequencing projects.

키워드

참고문헌

  1. The Microorganisms & Industry v.21 RNA 분석 프로그램의 개발 박기정;김승목;박찬규;박용하
  2. Kor. J. Microbiol. v.34 DNA 염기 서열로부터 contig 구성을 위한 프로그램 XFAP의 개발 이병욱;박기정;김승목
  3. Kor. J. Microbiol. Biotechnol. v.25 DNA 염기서열의 단편 조립 프로그램의 개발 이병욱;박기정;박완;박용하
  4. 정보과학회논문지(B) v.23 컴퓨터 모델링을 이용한 RNA 분자의 이차구조 예측 한정숙;김홍진
  5. Nucl. Acids Res. v.26 GenBank Benson, D.A.;M.S.Boguski;D.J. Lipman;J.Ostell;B.F. Ouellette
  6. Nucl. Acids Res. v.23 A new DNA sequence assembly program Bonfield, J.K.;K.F. Smith;R. Staden
  7. Nucl. Acids Res. v.16 A nomenclature for incompletely specified bases in nucleic acid sequences: recommendation Cornish-Bowden, A.
  8. J. Mol. Biol. v.162 An improved algorithm for matching biological sequences Gotoh, O.
  9. Genomics v.33 An improved sequence assembly program Huang, X.
  10. Genomics v.14 A contig assembly program based on sensitive detection of fragment overlaps Huang, X.
  11. Proc. Natl. Acad. Sci. USA v.82 Rapid determination of 16SrRNA sequences for phylogenetic anlaysis Lane, D.J.;B. Pace;G.J. Olsen;D.A. Stahl;M.L.Sogin;N.R. Pace
  12. Appl. Environ. Microbiol. v.62 Nonradioactive method to study genetic profiles of natural bacterial communities by PCR Single-Strand-Conformation Polymorphism Lee, D. H.;Y.G. Jo;S. J. Kim
  13. Kor. J. Microbiol. v.24 Rapid plasmid mapping computer program Lee, D. H.;Y.J.Kim;S.T.Lee;H.S. Kang
  14. Proc. Natl. Acad. Sci. USA v.72 Nucleotide sequence of the rightward operator of phage lambda Maniatis, T.;A. Jeffrey;D.G. Kleid
  15. J. Mol. Biol. v.5 Determination of base composition of deoxyribonucleic acid from its thermal denaturation temperature Marmur, J.;P. Doty
  16. Proc. Natl. Acad. Sci. USA v.85 Improved tools for biological sequence comparison Pearson, W.R.;D.J. Lipman
  17. Nucl. Acids Res. v.12 SEQAID: a DNA sequence assembling program based on a mathematical model Peltola, H.;H. Soderlund;E. Ukkonen
  18. DNA Seq. v.7 A method to direct sequence cosmid LAWRIT16 clones Repetto, M.;A. Ballabio;M. Zollo
  19. J. Mol. Biol. v.147 Identification of common molecular subsequences Smith, T.F.;M.S. Waterman
  20. Nucl. Acids Res. v.8 A new computer method for the storage and manipulation of DNA gel reading data Staden,R.
  21. Mathematical Biosciences v.77 A dynamic programming algorithm to find all solutions in a neighborhood of the optimum Waterman, M.S.;T.H. Byers
  22. PCR Protocols: a guide to methods and applications Amplification and direct sequencing of fungal ribosomal RNA genes for phylogenetics White, T.J.;T. Bruns;S.Lee;J. Taylor;M.A. Innis;D.H.Gelfand;J.J.Sninsky;T.J.White(ed.)