• 제목/요약/키워드: pairwise alignment sequence comparison

검색결과 4건 처리시간 0.02초

진화 알고리즘을 사용한 복수 염기서열 정렬 (Multiple Sequence Aligmnent Genetic Algorithm)

  • 김진;송민동;최홍식;장연아
    • 미생물학회지
    • /
    • 제35권2호
    • /
    • pp.115-120
    • /
    • 1999
  • 3개 이상의 DNA 혹은 단백질의 염기서열을 정렬하는 복수 염기서열 정렬은 염기서열들 사이의 진화관계, gene regulation, 단백질의 구조와 기능에 관한 연구에 필수적인 도구이다. 복수 염기서열 정렬을 얻기 위한 기존의 방법은 progressive pairwise alignment 와같이 빠른 실행시간 내에 만족할 만한 복수 염기서열 정렬을 제공하는 방법과, 최적의 복수 여기서열 정렬을 제공하나 실행시간이 상대적으로 긴 dynamic programming 과 같은 방법 등이 있다. 본 논문에서는 진화 알고리즘을 사용하여 기존의 방법에서 제공하는 복수 염기서열 정렬을 짧은 시간내에보다 개선된 복수 염기서열 정렬을 획득하게 하는 방법을 제시하였으며, 진화 알고리즘의 구성내용을 설명하였으며, 실제의 염기서열을 사용하여 이 방법의 장점을 보였다.

  • PDF

Identification of Viral Taxon-Specific Genes (VTSG): Application to Caliciviridae

  • Kang, Shinduck;Kim, Young-Chang
    • Genomics & Informatics
    • /
    • 제16권4호
    • /
    • pp.23.1-23.5
    • /
    • 2018
  • Virus taxonomy was initially determined by clinical experiments based on phenotype. However, with the development of sequence analysis methods, genotype-based classification was also applied. With the development of genome sequence analysis technology, there is an increasing demand for virus taxonomy to be extended from in vivo and in vitro to in silico. In this study, we verified the consistency of the current International Committee on Taxonomy of Viruses taxonomy using an in silico approach, aiming to identify the specific sequence for each virus. We applied this approach to norovirus in Caliciviridae, which causes 90% of gastroenteritis cases worldwide. First, based on the dogma "protein structure determines its function," we hypothesized that the specific sequence can be identified by the specific structure. Firstly, we extracted the coding region (CDS). Secondly, the CDS protein sequences of each genus were annotated by the conserved domain database (CDD) search. Finally, the conserved domains of each genus in Caliciviridae are classified by RPS-BLAST with CDD. The analysis result is that Caliciviridae has sequences including RNA helicase in common. In case of Norovirus, Calicivirus coat protein C terminal and viral polyprotein N-terminal appears as a specific domain in Caliciviridae. It does not include in the other genera in Caliciviridae. If this method is utilized to detect specific conserved domains, it can be used as classification keywords based on protein functional structure. After determining the specific protein domains, the specific protein domain sequences would be converted to gene sequences. This sequences would be re-used one of viral bio-marks.

개머루와 까마귀머루의 유전적 유연관계 분석 (Genetic Relationship of the Ampelopsis brevipedunculata var. heterophylla and Vitis thunbergii var. sinuata with the Other Vitis Plants)

  • 배영민
    • 생명과학회지
    • /
    • 제27권1호
    • /
    • pp.89-94
    • /
    • 2017
  • 포도과(Vitaceae) 포도속(Vitis) 식물들 19종의 intergenic spacer 1 및 intergenic spacer 2의 염기서열을 Genbank에서 수집하였다. 그러나 국내에서 흔하게 발견되는 포도과 포도속 식물인 까마귀머루(Vitis thunbergii var. sinuata)와 포도과 개머루속 식물인 개머루(Ampelopsis brevipedunculata var. heterophylla)의 염기서열은 Genbank에서 발견할 수 없었다. 따라서 개머루와 까마귀머루를 채집하고 genomic DNA를 분리하여서 18S rDNA, ITS1, 5.8S rDNA, ITS2 및 28S rDNA의 일부를 증폭하고, 그 염기서열을 분석하였다. 이렇게 얻어진 염기서열을 다른 포도속 식물들의 염기서열과 MUSCLE (Multiple sequence comparison by log-expectation) algorithm으로 서로 비교하여 neighbor-joining tree 및 pairwise distance (p-distance)를 계산해 보았다. 그 결과 국내 자생종인 개머루와 까마귀 머루는 서로 간에는 높은 상동성을 보이지만 외국의 포도속 식물들과는 유전적 상관관계가 상당히 멀다는 것을 발견할 수 있었다. 이것은 아마도 우리나라 자생종들의 경우에 오랜 시간 동안 외국의 포도속 식물들과 지리적으로 격리된 상태에서 독립적으로 진화한 결과가 아닌가 생각된다. 또한 개머루와 까마귀머루의 염기서열의 상동성이 높은 데에도 불구하고, 형태를 기준으로 하는 기존의 분류체계에 따라서 개머루는 개머루속으로 까마귀머루는 포도속으로 분류가 되고 있다. 형태를 기준으로 하는 기존의 분류체계와 염기서열을 기준으로 하는 유전적 분류체계간의 괴리를 본 연구에서 다시 한 번 확인할 수 있었다.

정보 알고리즘 기반 아리랑의 계통도 및 상관관계 분석 (Correlation Analysis of the Arirangs Based on the Informatics Algorithms)

  • 김학용
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.407-417
    • /
    • 2014
  • 우리 민족의 대표적인 민요이면서 동시에 유네스코 인류무형문화유산인 아리랑을 정보알고리즘 기법을 도입하여 후렴구를 중심으로 계통도를 분석하고 아리랑들 사이의 상관관계는 본문 단어중심으로 분석하였다. 아리랑의 계통도 분석은 생명체의 진화관계를 분석하는 알고리즘인 다중서열정렬 기법을 사용하였다. 분석한 아리랑 106개 중에서 38개 아리랑이 빠른 템포를 가지고 있었으며, 나머지 68개 아리랑이 느린 템포를 가지고 있었다. 이를 바탕으로 후렴구 기반 아리랑 계통도를 완성하였다. 아리랑 본문 단어는 아리랑에 있는 단어와 아리랑 제목을 노드로 하는 bipartate네트워크를 구축하고 이들로부터 73개 아리랑 및 104개의 핵심 단어를 추출하였다. 먼저, 이 데이터를 바탕으로 쌍대비교분석 기법을 사용하여 아리랑들 사이의 상관관계를 분석하였다. 또한, 네트워크 연결계수가 1인 노드를 단계적으로 제거하여 핵심네트워크를 구축한 다음 네트워크 기반으로 아리랑들 사이의 상관관계를 분석하였다. 그동안 아리랑을 어원 중심의 인문과학이나 음률적인 접근을 통하여 아리랑의 어원, 계통도, 상관관계를 분석하려는 연구가 있었다. 본 연구에서는 이러한 시도를 벗어나 과학적 접근방법인 정보알고리즘을 사용하여 아리랑을 분석함으로써 세계적인 문화유산의 위상을 한층 더 높이고 객관적인 결과를 통해서 아리랑의 대중화 및 세계화의 기틀을 마련함에 있어 그 방법론을 제시하였다.