• 제목/요약/키워드: Multiple Sequence Alignment

검색결과 101건 처리시간 0.024초

Cloning and Sequence Analysis of a Levansucrase Gene from Rahnella aquatilis ATCC15552

  • Kim, Hyun-Jin;Yang, Ji-Young;Lee, Hyeon-Gye;Cha, Jae-Ho
    • Journal of Microbiology and Biotechnology
    • /
    • 제11권4호
    • /
    • pp.693-699
    • /
    • 2001
  • An intracellular levansucrase gene, lscR from Rahnella aquatilis ATCC 15552, was cloned and its nucleotide sequence was determined. Nucleotide sequence analysis of this gene revealed a 1,238 bp open reading frame coding for a protein of 415 amino acids. The levansucrase was expressed by using a T7 promoter in Escherichia coli BL21 (DE3) and the enzyme activity was detected in the cytoplasmic fraction. The optimum pH and temperature of this enzyme for levan formation was pH 6 and $30^{\circ}C$, respectively. The deduced amino acid sequence of the lscR gene showed a high sequence similarity (59-89%) with Gram-negative levansucrses, while the level of similarity with Gram-positive enzymes was less than 42%. Multiple alignments of levansucrase sequences reported from Gram-negative and Gram-positive bacteria revealed seven conserved regions. A comparison of the catalytic properties and deduced amino acid sequence of lscR with those of other bacterial levansucrases strongly suggest that Gram-negative and Gram-positive levansucrases have an overall different structure, but they have a similar structure at the active site.

  • PDF

웹 기반 고성능 다중서열정렬시스템 설계 및 구현 (A Web-Based High Performance Multiple Sequence Alignment System Design and Implementation)

  • 김태경;김훈기;최치환;정승현;허보경;조완섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.79-82
    • /
    • 2010
  • 다중서열정렬 알고리즘은 생명정보학 분야에서 서열기반의 계통분류 분석에 가장 많이 사용되며, 가장 대표적인 공개 프로그램은 ClustalW로 사용자가 로컬시스템에 설치하여 이용할 수 있다. 그러나 실제로 사용자들이 ClustalW을 설치한 후, 서열데이터의 준비, 가공, 처리 및 타 시스템과 연동 등과 같은 작업을 하는데 여러 가지 어려움이 있다. 따라서 본 논문에서는 다중서열정렬 작업을 편리하고 빠르게 수행할 수 있는 웹기반의 고성능 다중서열정렬시스템을 제안한다. 제안된 시스템의 특징은, (1) Inter-Query 라우팅 알고리즘을 통해 다수의 PC 자원을 효율적으로 활용하여 계산 성능을 극대화하였으며, (2) 사용자 편의성을 고려한 웹인터페이스의 제공을 통해 개인화된 데이터관리, 실시간 모니터링, 데이터 편집 등을 지원하여 사용자가 손쉽게 서열데이터의 수집, 관리 및 처리할 수 있도록 지원한다.

  • PDF

Bioinformatics를 활용한 토양미생물인 Gordonia westfalica Epoxide Hydrolase 생촉매 개발 및 Chiral Epoxides 제조 특성 분석 (Bioinformatics based Identification and Characterization of Epoxide Hydrolase of Gordonia westfalica for the Production of Chiral Epoxides)

  • 이수정;이은정;김희숙;이은열
    • KSBB Journal
    • /
    • 제20권4호
    • /
    • pp.311-316
    • /
    • 2005
  • EH의 catalytic nucleophile residue, His-Asp로 구성된 charge relay system, oxyanion hole 등의 EH 관련 conserved domain의 아미노산 공통 서열을 참고로 하여 G. westfalica megaplasmid로부터 putative EH를 선별할 수 있었다. Bioinformatics를 기반으로 스크리닝한 G. westfalica에 의한 라세믹 styrene oxide 기질에 대한 입체선택성 가수분해 반응에 있어 중요 반응 parameter들인, pH 및 온도 등이 초기 가수분해반응속도에 미치는 영향을 분석하고, 최적 회분식 반응조건을 결정하였다. 최적 반응조건인 pH 7, 반응 온도 $30^{\circ}C$, 생촉매량 40 mg의 조건에서 약 5시간 20분간 반응을 통해 20 mM 라세믹 기질로부터 광학순도 $100\%$ ee인 (S)-styrene oxide를 $36.5\%$의 수율로 얻을 수 있었다.

Global Sequence Homology Detection Using Word Conservation Probability

  • Yang, Jae-Seong;Kim, Dae-Kyum;Kim, Jin-Ho;Kim, Sang-Uk
    • Interdisciplinary Bio Central
    • /
    • 제3권4호
    • /
    • pp.14.1-14.9
    • /
    • 2011
  • Protein homology detection is an important issue in comparative genomics. Because of the exponential growth of sequence databases, fast and efficient homology detection tools are urgently needed. Currently, for homology detection, sequence comparison methods using local alignment such as BLAST are generally used as they give a reasonable measure for sequence similarity. However, these methods have drawbacks in offering overall sequence similarity, especially in dealing with eukaryotic genomes that often contain many insertions and duplications on sequences. Also these methods do not provide the explicit models for speciation, thus it is difficult to interpret their similarity measure into homology detection. Here, we present a novel method based on Word Conservation Score (WCS) to address the current limitations of homology detection. Instead of counting each amino acid, we adopted the concept of 'Word' to compare sequences. WCS measures overall sequence similarity by comparing word contents, which is much faster than BLAST comparisons. Furthermore, evolutionary distance between homologous sequences could be measured by WCS. Therefore, we expect that sequence comparison with WCS is useful for the multiple-species-comparisons of large genomes. In the performance comparisons on protein structural classifications, our method showed a considerable improvement over BLAST. Our method found bigger micro-syntenic blocks which consist of orthologs with conserved gene order. By testing on various datasets, we showed that WCS gives faster and better overall similarity measure compared to BLAST.

Cloning and characterization of a cDNA encoding a paired box protein, PAX7, from black sea bream, Acanthopagrus schlegelii

  • Choi, Jae Hoon;Han, Dan Hee;Gong, Seung Pyo
    • 한국동물생명공학회지
    • /
    • 제36권4호
    • /
    • pp.314-322
    • /
    • 2021
  • Paired box protein, PAX7, is a key molecule for the specification, maintenance and skeletal muscle regeneration of muscle satellite cells. In this study, we identified and characterized the cDNA and amino acid sequences of PAX7 from black sea bream (Acanthopagrus schlegelii) via molecular cloning and sequence analysis. A. schlegelii PAX7 cDNA was comprised of 1,524 bp encoding 507 amino acids and multiple sequence alignment analysis of the translated amino acids showed that it contained three domains including paired DNA-binding domain, homeobox domain and OAR domain which were well conserved across various animal species investigated. Pairwise Sequence Alignment indicated that A. schlegelii PAX7 had the same amino acid sequences with that of yellowfin seabream (A. latus) and 99.8% identity and similarity with that of gilt-head bream (Sparus aurata). Molecular phylogenetic analysis confirmed that A. schlegelii PAX7 formed a monophyletic group with those of teleost and most closely related with those of the fish that belong to Sparidae family including A. latus and S. aurata. In the investigation of its tissue specific mRNA expression, the expression was specifically identified in skeletal muscle tissue and a weak expression was also shown in gonad tissue. The cultured cells derived from skeletal muscle tissues expressed PAX7 mRNA at early passage but the expression was not observed after several times of subculture.

Apache Spark을 이용한 병렬 DNA 시퀀스 지역 정렬 기법 구현 (Implementation of Parallel Local Alignment Method for DNA Sequence using Apache Spark)

  • 김보성;김진수;최도진;김상수;송석일
    • 한국콘텐츠학회논문지
    • /
    • 제16권10호
    • /
    • pp.608-616
    • /
    • 2016
  • Smith-Waterman(SW) 알고리즘은 DNA 시퀀스 분석에서 중요한 연산 중 하나인 지역 정렬을 처리하는 알고리즘이다. SW 알고리즘은 동적 프로그래밍 방법으로 최적의 결과를 도출할 수 있지만 수행시간이 매우 길다는 문제가 있다. 이를 해결하기 위해서 다수의 노드를 이용한 병렬 분산 처리 기반의 SW 알고리즘이 제안되었다. Apache Spark을 기반으로 하는 병렬 분산 DNA 처리 프레임워크인 ADAM에서도 SW 알고리즘을 병렬로 처리하고 있다. 하지만, ADAM의 SW 알고리즘은 Smith-Waterman 이 동적프로그래밍 기법이라는 특성을 고려하지 않고 있어 최대의 성능을 얻지 못하고 있다. 이 논문에서는 ADAM의 병렬 SW 알고리즘을 개선한다. 제안하는 병렬 SW 기법은 두 단계에 걸쳐 실행된다. 첫 번째 단계에서는 지역정렬 대상인 DNA 시퀀스를 다수의 파티션(partition)으로 분할하고 분할된 각 파티션에 대해서 SW 알고리즘을 병렬로 수행한다. 두 번째 단계에서는 파티션 각각에 대해서 독립적으로 SW를 적용함으로써 발생하는 오류를 보완하는 과정을 역시 병렬로 수행한다. 제안하는 병렬 SW 알고리즘은 ADAM을 기반으로 구현하고 기존 ADAM의 SW와 비교를 통해서 성능을 입증한다. 성능 평가 결과 제안하는 병렬 SW 알고리즘이 기존의 SW에 비해서 2배 이상의 좋은 성능을 내는 것을 확인하였다.

A Simple Java Sequence Alignment Editing Tool for Resolving Complex Repeat Regions

  • Ham, Seong-Il;Lee, Kyung-Eun;Park, Hyun-Seok
    • Genomics & Informatics
    • /
    • 제7권1호
    • /
    • pp.46-48
    • /
    • 2009
  • Finishing is the most time-consuming step in sequencing, and many genome projects are left unfinished due to complex repeat regions. Here, we have developed BACContigEditor, a prototype shotgun sequence finishing tool. It is essentially an editor that visualizes assemblies of shotgun sequence fragment reads as gapped multiple alignments. The program offers some flexibility that is needed to rapidly resolve complex regions within a working session. The sole purpose of the release is to promote collaborative creation of extensible software for fragment assembly editors, foster collaborative development, and reduce barriers to initial tool development effort. We describe our software architecture and identify current challenges. The program is available under an Open Source license.

복수 서열 정렬을 위한 시스템 개발에 관한 연구 (A study of system development for multiple sequence alignment)

  • 김동회;김진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1027-1030
    • /
    • 2003
  • 유전체 서열결정이 폭발적으로 증가해 가고 있다. 인간 유전체사업(Human genome project)의 궁극적인 목적은 인간 염색체에 있는 30억개의 뉴클레오티드와 10만개의 유전자를 밝혀내는 것이고 생의학에서 새로운 발견이나 옹용을 위한 정보로 이용하는 것이다. 이 사업은 1980년대 후반에 시작되었고 현재 서열의 결정이 완료된 상태이다. 본 논문에서는 인간 유전체 사업에서 파생된 가장 중요한 문제 중의 하나인 복수 염기서열 정렬 문제와 복수 염기서열 정렬 시스템의 구현에 대하여 논한다.

  • PDF