• 제목/요약/키워드: FASTA

검색결과 19건 처리시간 0.034초

BLAST/FASTA를 활용한 미생물 유전체 비교용 도구의 개발 (A Genomics Tool for Microbial Genome Comparison Using BLAST/FASTA)

  • 태홍석;이대상;박완;박기정
    • 미생물학회지
    • /
    • 제38권4호
    • /
    • pp.267-275
    • /
    • 2002
  • 미생물 유전체 프로젝트의 결과인 유전체 서열에 대해, 비교 유전체 분석을 수행할 수 있는 분석 도구인 GComp를 개발하였다. 이 도구는 국부 상동성 계산을 BLAST나 FASTA를 사용하여 수행한 후에 그 결과를 받아들여, 상동성을 보이는 부분을 분석하고 위치 파악 및 연결한 뒤, 두 유전체간의 상동성 정도를 일목요연하게 보여줄 수 있는 테이블과 파일들을 생성한다. 한편. 그 결과를 그래픽으로 표시하고 전체를 살펴볼 수 있는 인터페이스 기능을 구현하였다. 시험 데이터로 기존의 미생물 유전체 서열을 상대로 분석하면서, 유전체 서열의 핵산 및 단백질 수준에서의 비교분석 결과를 통해 두 유전체에 대한 비교 정보를 효과적으로 확인할 수 있었고, 보다 다양한 분석을 위한 도구 개발의 기준을 설정할 수 있었다.

BLAST/FASTA를 활용한 미생물 유전체 비교용 도구의 개발 (A genomice Tool for Microbial Genome Comparison Using BLAST/FASTA)

  • 태홍석;박기정
    • 한국미생물학회:학술대회논문집
    • /
    • 한국미생물학회 2002년도 추계학술대회
    • /
    • pp.185-193
    • /
    • 2002
  • We have developed GComp as an analysis tool for comparative analysis of microbial genomes. Thetool uses BLAST or FASTA as a preprocessing program for local alignments, parses the homology search results, and generates tables and files to show homology relationship between two genomes at a glance. The interface for graphical representation of the comparative genomic analysis has been also implemented. Through analysis of a few pairs of microbial genome sequences, the program has been proved to be practically useful and a few additional features have been devised and designed, which will be added in the further development.

  • PDF

염기서열 해독작업을 위한 핵산 단편 조립 프로그램의 개발 (Development of Contig Assembly Program for Nucleotide Sequencing)

  • 이동훈
    • 미생물학회지
    • /
    • 제35권2호
    • /
    • pp.121-127
    • /
    • 1999
  • 염기서열 해독작업에서 각 핵산 단편을 조립하는 contig 구성문제에 활용이 가능한 computer program을 개발하였다. 본 프로그램은 국내에서 광범위하게 사용되고 있는 MS-Windows 운영체제의 개인용 컴퓨터에서 작동이 가능하며, GenBank, FASTA, ASCII 등과 같은 다양한 형태의 염기서열 자료를 입력할 수 있다. 두 단편에서 최대 유사도를 나타내는 부분을 정렬하는 작업에는 염기서열의 국부적 상동성을 계산하고 dynamic programming 알고리즘을 적용하는 방법을 이용하였다. 또한 사용하기 편리한 그래픽 방식의 인터페이스를 제공하여 초보자라도 손쉽게 조작할 수 있다는 장점을 갖는다. 본 프로그램의 성능을 검증하기 위하여 세균과 곰팡이로부터 해독된 16S rRNA 와 18S rRNA 유전자의 단편 염기서열을 재구성하는 작업에 프로그램을 사용하였을 때에 효율적인 작업이 가능하였다.

  • PDF

카풀 및 그룹핑 기법을 이용한 유전자 서열 정렬 프로그램(FastA) 설계 (Design of Gene Alignment Program(FastA) Using Carpool and Grouping Schemes)

  • 이성준;김재훈;정진원;이원태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.124-126
    • /
    • 2003
  • 생물정보학에서 사용되는 많은 프로그램들은 데이터베이스로 부터 방대한 양의 데이터를 검색하고 처리한다. 이러한 환경에서 사용자의 요청마다 데이터베이스를 검색하는 경우 사용자들의 대기 시간이 길어지고 시스템 용량을 초과한다. 이러한 데이터베이스 액세스의 문제점을 해결하기 위하여 카플 기법과 그룹핑 기법이 제안되었다. 본 논문에서는 카플 기법과 그룹핑 기법을 이용하여 유전자 서열 비교 프로그램인 Fasta를 구현하였고 사용자 응답시간을 측정하여 프로그램의 성능을 높일 수 있음을 확인하였다.

  • PDF

MSMP 알고리즘과 RIFLE 알고리즘의 구현 및 성능비교 평가 (Implementation and Performance Evaluation of Comparing MSMP with RIFLE Algorithm)

  • 김동희;원영상;고영웅;김진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.304-306
    • /
    • 2004
  • 생물정보학에서 서열의 유사성을 예측하는 것은 가장 중요한 문제 중의 하나이다. 염기 서열의 유사성을 검색하는 유용한 검색도구들에는 BLAST와 FASTA 등이 있으며 이러한 도구들은 새로운 유기체에 대한 실제 염기 서열을 필요로 한다. 이 경우 서열을 얻기 위한 sequencing 작업이 필요로 하며 시간적인 면에 있어서 상당한 비용을 요구한다. 본 논문에서는 sequencing 작업을 하지 않고 간단한 실험에서 얻을 수 있는 부분적인 Sequence 정보만을 대상으로 데이터 베이스에서 검색을 할 수 있는 두 개의 RIFLE(Rapid Identification of Microorganisms by Fragment Length Evaluation), MSMP(Maximum Site Matching Problem) 알고리즘을 구현하고 실험을 통해 두 알고리즘을 비교 평가한다. 실험결과 RIFLE 알고리즘이 수행 속도 면에서 빠른 반면 MSMP가 산출한 결과에 비해서 신뢰성이 떨어짐을 확인하였다.

  • PDF

SSR-Primer Generator: A Tool for Finding Simple Sequence Repeats and Designing SSR-Primers

  • Hong, Chang-Pyo;Choi, Su-Ryun;Lim, Yong-Pyo
    • Genomics & Informatics
    • /
    • 제9권4호
    • /
    • pp.189-193
    • /
    • 2011
  • Simple sequence repeats (SSRs) are ubiquitous short tandem duplications found within eukaryotic genomes. Their length variability and abundance throughout the genome has led them to be widely used as molecular markers for crop-breeding programs, facilitating the use of marker-assisted selection as well as estimation of genetic population structure. Here, we report a software application, "SSR-Primer Generator " for SSR discovery, SSR-primer design, and homology-based search of in silico amplicons from a DNA sequence dataset. On submission of multiple FASTA-format DNA sequences, those analyses are batch processed in a Java runtime environment (JRE) platform, in a pipeline, and the resulting data are visualized in HTML tabular format. This application will be a useful tool for reducing the time and costs associated with the development and application of SSR markers.

RIFLE 알고리즘에 대한 실험 및 성능평가 (Experiment and Performance Evaluation of RIFLE Algorithm)

  • 김동회;원영상;고영웅;김진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.697-700
    • /
    • 2004
  • 서열의 유사성 검색에 잘 알려진 도구로는 BLAST 와 FASTA 가 있으며 이들 알고리즘은 알려지지 않은 유기체를 sequencing 작업을 통하여 얻어진 염기서열과 유전자 데이터베이스를 대상으로 유사성을 검색한다. 이때 서열의 유사성을 검색하기에 앞서 선행 되어야만 하는 sequencing작업은 시간적인 면에서 상당한 비용을 요구한다. 반면 sequencing 작업을 하기 않고도 간단한 실험에 의해 얻을 수 있는 부분적인 서열정보만을 대상으로 데이터베이스에서 검색 할 수 있는 알고리즘으로 RIFLE가 있다. 본 논문에서는 RIFLE 알고리즘을 구현하고 실험데이터를 생성하여 성능에 대한 분석 평가를 하고자 한다. 성능평가 결과 RIFLE 알고리즘은 시간복잡도 $O(n^2)$으로 빠른 반면 일부 서열에 있어서 실제 유사도에 비해 정확도가 낮게 평가되는 결과가 산출되었다.

  • PDF

A Simple GUI-based Sequencing Format Conversion Tool for the Three NGS Platforms

  • Rhie, A-Rang;Yang, San-Duk;Lee, Kyung-Eun;Thong, Chin Ting;Park, Hyun-Seok
    • Genomics & Informatics
    • /
    • 제8권2호
    • /
    • pp.97-99
    • /
    • 2010
  • To allow for a quick conversion of the proprietary sequence data from various sequencing platforms, sequence format conversion toolkits are required that can be easily integrated into workflow systems. In this respect, a format conversion tool, as well as quality conversion tool would be the minimum requirements to integrate reads from different platforms. We have developed the Pyrus NGS Sequencing Format Converter, a simple software toolkit which allows to convert three kinds of Next Generation Sequencing reads, into commonly used fasta or fastq formats. The converter modules are all implemented, uniformly, in Java GUI modules that can be integrated in software applications for displaying the data content in the same format.

다염기변이 유전체에 대한 서열 정렬 툴 분석 (Analysis of sequence alignment Tools on polymorphic genomes)

  • 김유선;김종현;여윤구;김우철;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.217-221
    • /
    • 2008
  • 생명공학 기술의 발달로 지놈 프로젝트를 통해 인간 초파리 등 여러 종의 유전체 정보가 밝혀 졌다. 그러나 Post-Genome 연구에 있어서 매우 중요한 생물체인 멍게(Ciona intestinalis)와 성게(Strongylocentrotus purpuratus)의 유전체 서열은 현재 공개되어 있으나 염기서열의 연속성(continuity)에는 심각한 문제점이 존재하고 있다. 이들은 염기서열에 변이가 많은 다염기변이 유전체(polymorphic genomes)로 그 특성이 반영되지 않은 전통적인 Whole Genome Shotgun Sequencing(WGSS)방법을 사용였기 때문이다. 이와 같은 다염기변이 유전체 서열 분석은 시스템 생물학이나 비교 유전체학 등의 후발 연구에 기초가 되므로 매우 중요하다. 본 논문에서는 다염기변이 유전체에 대해 알아보고 서열 조립 알고리즘의 기본이 되는 서열 정렬 툴들 중 가장 많이 사용되는 FASTA, BLAST, BLAT에 대해 분석하여 봄으로써 다염기변이 유전체에 적합한 서열 조립 전략 수립을 위해 고려해야 하는 사항들을 논의해 본다.

  • PDF

MiRPI: Portable Software to Identify Conserved miRNAs, Targets and to Calculate Precursor Statistics

  • Vignesh, Dhandapani;Parameswari, Paul;Im, Su-Bin;Kim, Hae-Jin;Lim, Yong-Pyo
    • Genomics & Informatics
    • /
    • 제9권1호
    • /
    • pp.39-43
    • /
    • 2011
  • MicroRNAs (miRNAs) are recently discovered small RNA molecules usually resulting in translational repression and gene silencing. Despite the fact that specific cloning of small RNA's is a method in practice, computational identification of miRNA's has been a major focus recent days, since is a rapid process following AB initio and sequence alignment methods. Here we developed new software called MiRPI that aims to identify the highly conserved miRNAs without any mismatches from given fasta formatted gene sequences by using non-repeated miRNA dataset of the user's interest. The new window embedded with the software is used to identify the targets for inputted mature miRNAs in the mRNA sequences. Also MiRPI is designed to measure the precursor miRNA statistics, majorly focusing the Adjusted Minimum Folding free Energy (AMFE) and Minimum Folding free Energy Index (MFEI), the most important parameters in miRNA confirmation. MiRPI is developed by PERL (Practical Extraction and Report Language) and Tk (Tool kit widgets) scripting languages. It is user friendly, portable offline software that works in all windows OS, sized to 3 MB.