• Title/Summary/Keyword: 서열

Search Result 3,677, Processing Time 0.026 seconds

An Analysis System for Whole Genomic Sequence Using String B-Tree (스트링 B-트리를 이용한 게놈 서열 분석 시스템)

  • Choe, Jeong-Hyeon;Jo, Hwan-Gyu
    • The KIPS Transactions:PartA
    • /
    • v.8A no.4
    • /
    • pp.509-516
    • /
    • 2001
  • As results of many genome projects, genomic sequences of many organisms are revealed. Various methods such as global alignment, local alignment are used to analyze the sequences of the organisms, and k -mer analysis is one of the methods for analyzing the genomic sequences. The k -mer analysis explores the frequencies of all k-mers or the symmetry of them where the k -mer is the sequenced base with the length of k. However, existing on-memory algorithms are not applicable to the k -mer analysis because a whole genomic sequence is usually a large text. Therefore, efficient data structures and algorithms are needed. String B-tree is a good data structure that supports external memory and fits into pattern matching. In this paper, we improve the string B-tree in order to efficiently apply the data structure to k -mer analysis, and the results of k -mer analysis for C. elegans and other 30 genomic sequences are shown. We present a visualization system which enables users to investigate the distribution and symmetry of the frequencies of all k -mers using CGR (Chaotic Game Representation). We also describe the method to find the signature which is the part of the sequence that is similar to the whole genomic sequence.

  • PDF

Nucleotide Sequence and Secondary Structure of 16S rRNA from Sphingomonas chungbukensis DJ77 (Sphingomonas chungbukensis DJ77의 16S rRNA 염기서열과 이차구조)

  • Lee Kwan-Young;Kwon Hae-Ryong;Lee Won-Ho;Kim Young-Chang
    • Korean Journal of Microbiology
    • /
    • v.41 no.2
    • /
    • pp.125-128
    • /
    • 2005
  • A 16S ribosomal RNA gene from S. chungbukensis DJ77 has been sequenced. This sequence had a length of 1,502 bp and was extended for 29 bp at 5' and for 37 bp at 3' from the partial sequence (1,435 bp) registered in 2000 year. Besides, 1 bp was newly added near to the 3' end. We made the secondary structure of the 16S rRNA based on E. coli model and found four specific regions. We found constant and variable regions in genus Sphingomonas as the result of multiple alignment of 16S rRNA gene sequences from Sphingomonas spp. and S. chungbukensis DJ77. We found a stem loop structure in S. chungbukensis DJ77, which was only discovered in C. jejuni to date. It showed the structural agreement despite the difference of the sequences from the both organisms. Finally, S. chungbukensis DJ77 belonged to cluster II (Sphingobium) group, after the classification using phylogenetic analysis and nucleotide signature analysis.

Genetic Identification of Hybrids between Rhodeus uyekii and R. notatus by Sequence Analysis of RAG-1 Gene (RAG-1 유전자의 염기서열 분석에 의한 각시붕어 Rhodeus uyekii와 떡납줄갱이 R. notatus 잡종의 동정)

  • Yun, Young-Eun;Lee, Il-Ro;Park, Sang-Yong;Kang, Eon-Jong;Kim, Eung-O;Yang, Sang-Keun;Nam, Yoon-Kwon;Bang, In-Chul
    • Journal of Aquaculture
    • /
    • v.22 no.1
    • /
    • pp.79-82
    • /
    • 2009
  • Reciprocal interspecific hybrids between two bitterling species Rhodeus uyekii (RU) and R. notatus (RN) were genetically identified based on the partial sequence analysis of recombination activating gene-1 (RAG-1) gene. Out of 863 bp positions analyzed, 13 nucleotide substitutions were detected between the two parental species (RU and RN genotypes). Both the induced hybrids (RU female$\times$RN male; UN genotype) and their reciprocal counterparts (RN female$\times$RU male; NU genotype) displayed the double peaks (or polymorphism) of sequence chromatograms at the 13 diagnostic positions, indicating that those hybrids were actual karyogamy derived from the two parental haploid genomes. However, it was not possible to distinguish between the reciprocal interspecific hybrids.

Exome Sequencing in Mendelian Disorders (엑솜 염기서열 분석 방법을 이용한 단일유전자질환의 원인 유전자 발굴)

  • Lee, Jong-Keuk
    • Journal of Genetic Medicine
    • /
    • v.7 no.2
    • /
    • pp.119-124
    • /
    • 2010
  • More than 7,000 rare Mendelian diseases have been reported, but less than half of all rare monogenic disorders has been discovered. In addition, the majority of mutations that are known to cause Mendelian disorders are located in protein-coding regions. Therefore, exome sequencing is an efficient strategy to selectively sequence the coding regions of the human genome to identify novel genes associated with rare genetic disorders. The "exome" represents all of the exons in the human genome, constituting about 1.5% of the human genome. Exome sequencing is carried out by targeted capture and intense parallel sequencing. After the first report of successful exome sequencing for the identification of causal genes and mutations in Freeman Sheldon syndrome, exome sequencing has become a standard approach to identify genes in rare Mendelian disorders. Exome sequencing is also used to search the causal genes and variants in complex diseases. The successful use of exome sequencing in Mendelian disorders and complex diseases will facilitate the development of personalized genomic medicine.

The Complete Chloroplast DNA Sequences of Viola selkirkii (뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열 분석)

  • Ah-Reum Go;Yun-Sun Lee;Kyung-Ah Kim;Kyeong-Sik Cheon;Ki-Oug Yoo
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2020.12a
    • /
    • pp.55-55
    • /
    • 2020
  • 뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열을 차세대염기서열분석법(NGS)을 이용하여 분석하였다. 재료는 강원도 화천군 일산과 제주도 한라산의 2개체를 사용하였다. 분석결과, 염기서열의 길이는 일산의 뫼제비꽃이 156,774 bp (GC content: 36.30%), 한라산의 뫼제비꽃이 157,451 bp(GC content: 36.30%)로 한라산 개체가 길게 분석되었다. 구간별로 LSC(Large single copy)지역은 한라산 개체(85,950 bp)가 일산 개체(85,930 bp)보다 20 bp 길었으며, SSC(Small single copy)지역은 한라산 개체(17,261 bp)보다 일산 개체가 17,982 bp로 길게 분석되었다. IR(Inverted repeat)지역은 한라산 개체가 27,120 bp로 일산 개체(26,431 bp)보다 길게 분석되었다. 이러한 염기서열 길이의 차이는 종내 개체 간 빈번하게 발생하는 현상으로 IGS와 intron 구간에서 확인 된 단순반복서열의 일부 누락과 IR지역 내의 수축과 확장에 의한 것으로 판단된다. 뫼제비꽃 2개체의 엽록체 게놈을 구성하는 유전자 수는 총 111개로 동일하였으며, protein coding gene 77개, tRNA(transfer RNA) gene 30개, 그리고 rRNA (ribosomal RNA) gene 4개로 구성되어 있었다. 이는 기 발표된 엽록체 DNA 전체 염기서열이 밝혀진 제비꽃속 (Viola) 종류들과 동일한 결과이다.

  • PDF

Prediction of promoter by Backpropagation (Backpropagation을 이용한 Promoter 예측 방법)

  • 허미영;김홍기;최진성
    • Proceedings of the IEEK Conference
    • /
    • 2003.07d
    • /
    • pp.1569-1572
    • /
    • 2003
  • 최근 생명공학 분야의 기술이 혁신적으로 발달함에 따라 게놈 프로젝트가 본래 계획보다 2년 앞당겨져 2003 년 4 월 인간 유전자의 완전한 서열을 밝히고 성공적으로 완료됨으로서 관련 연구자들은 인간의 유전자에 대한 대량의 서열 데이터를 얻게 되었다. 그래서 게놈 프로젝트의 다음 단계로서 엄청난 양의서열 정보 분석으로부터 유전자의 기능을 파악하고자 하는 연구들이 이미 세계적으로 활발히 진행되고 있다. 이러한 연구들의 최종적 목표는 질병 치료와 생명연장의 실현이라고 볼 수 있다. 유전자 연구를 위해선 우선 일차적으로 유전자 부위를 파악해야 한다. 유전자는 구조적으로 다시 여러 부분으로 나뉘는데 유전자 발현의 개시에 매우 중요한 요소 중 하나가 바로 프로모터 (Promoter) 이다. 프로모터 내에는 TATA box 가 있는데 이는 프로모터의 핵심 요소이다. 프로모터는 생명체의 종 그리고 RNA 중합효소의 종류에 따라 다르다. 이 논문에서는 다양한 신경망 알고리즘 중의 하나인 Backtpropagation 을 이용하여 밝혀지지 알은 서열에서 인간을 포함하는 원핵생물의 프로모터 서열을 예측할 수 있는 방법을 얻었기에 소개하고자 한다.

  • PDF

An efficient optimization method for multiple sequence alignment (효율적인 복수서열정렬 최적화기법)

  • Kim, Jin;Jung, Woo-Cheol;Uhmn, Saang-Yong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.368-370
    • /
    • 2003
  • 단백질들의 복수서열정렬은 단백질 서열간의 관계를 유추할 수 있는 유용한 도구이다. 최적화된 복수서열정렬을 얻기 위해 사용되는 가장 유용한 방법은 dynamic programming이다. 그러나 dynamic programming은 특정한 비용함수를 사용할 수 없기 때운에 특별한 경우 최적의 복수서열정렬을 제공하지 못하는 문제점이 있다. 우리는 이러한 문제점을 해결하기 위하여 부분정렬개선기법을 사용한 알고리즘을 제안하였으며, 이 알고리즘이 dynamic programming의 문제점을 효과적으로 해결함을 보였다.

  • PDF

흡혈 박쥐(Desmodus rotundus)집단에 있어서의 서열관계

  • 박시룡
    • The Korean Journal of Zoology
    • /
    • v.31 no.4
    • /
    • pp.243-250
    • /
    • 1988
  • 남미산 흡혈박쥐구esmodus rohndusl의 서열관계에 대해 자연상태와 유사한 조건하에서 사육상태의 집단을 연구하였다. 이들의 서열은 먹이장소에서 2마리의 성체들이 만났을때 4가지로 서로 다른 행동들(도망가기, 날아가기, 기다리기, 피하기)에 의해 결정했다. 공격행동(싸움후 도망가기)은 관찰된 전체행동들 가운데 16호로 비교적 적게 나타났다. 암컷들의 서열은 일부 먹이 서열에 의해서도 반영되었다. Harem수컷은 non-harem수컷들에 대해서 우위를 차지하였으며 열세 행동을 보여 주었다. 그러나 이 harem 수컷은 그의 성적 파트너에 대해서는 공격행동을 보이지 않았다. Dominance relationship was investigated in a captive of Desmodus rotundus, a neotopical sangivorous bat, under seminaturalistic conditions. The hierarchy was determined from four different behaviors (flee, fly-out, avoid, wait) by the encounter of ho adult bats on the feeding site. The aggressive action (flee after fighting) was relatively low (16%) compare to the other three observed behaviors. The hierarchy of the females reflected sometimes in the feeding order The harem male dominated the non-harem males and exhibited his territorial behavior. However, to his sex partners he didn't show aggressions.

  • PDF

Pathway Reconstruction System using Orthlogs Database (Ortholog 데이터베이스를 이용한 생물 경로 재구축 시스템)

  • Jung, Tae-Sung;Oh, Jeong-Su;Cho, Wan-Sup
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.280-282
    • /
    • 2005
  • 현재 국내외 적으로 많은 대사경로 재구축을 위한 소프트웨어들이 개발 보급되고 있다. 그러나 기존의 소프트웨어들은 유전자 서열의 주해 작업이 끝난 게놈에 대해서만 가능하다. 따라서 대사경로를 예측하고자 할 경우는 주해 작업이 선행되어야 하는 어려움이 있었다. 본 논문에서는 주해 작업이 완료되지 않은 유전자 서열로부터 유전자의 기능 예측뿐만 아니라 대사경로를 예측할 수 있는 시스템을 제안한다. 제안된 시스템은 Orthologous 데이터베이스를 활용하여 새롭게 밝혀진 유전자 서열을 대상으로 비교적 정확성이 높은 대사경로를 예측하는 기능을 제공한다. 이 방법을 통해 주해 작업이 완료되지 않은 유전자 서열을 이용하여 서열 내에 포함된 유전자의 기능을 예측할 뿐만 아니라 예측된 유전자 정보를 이용하여 대사 경로를 예측할 수 있다.

  • PDF

Determination of Nucleotide Sequences of cDNA from Cucumber Mosaic Virus-As RNA4 (As계의 오이 모자이크 바이러스 RNA4의 염기서열 결정)

  • 김상현;박원목;이세영;박영인
    • Korean Journal Plant Pathology
    • /
    • v.12 no.2
    • /
    • pp.176-181
    • /
    • 1996
  • Aster yomena로부터 분리한 오이 모자이크 바이러스(cucumber mosaic virus) (CMV-As)의 RNA4로부터 완전한 길이의 cDNA를 합성하고 그 전체적인 염기서열(1,043 nt`s)을 결정하였다. CMV-As RNA4는 73개의 염기로 구성된 5`말단의 leader 부위, 657개의 염기로 구성된 외피단백질(coat protein) 유전자 부위 및 312개의 염기로 구성된 3` 말단의 비번역 부위로 구성되어 있음을 확인하였다. 외피단백질 유전자 부위의 염기서열을 다른 계통의 CMV와 비교해 볼 때 그 염기서열이 보전적으로 존재하고 있으나 그 외의 부분은 다양함을 확인하였다. 특히 3` 말단부위의 61개의 염기로 구성된 부위(959-1019)는 다른 계통의 CMV에서는 상당히 유사하지만 CMV-As도 다른 CMV처럼 tRNA와 유사한 구조를 역시 형성함을 확인하였다. CMV-As의 RNA4 염기서열을 다른 계통의 CMV와 비교할 때 CMV-I17F와 가장 유사하였으며(91.9%) S형의 CMV-M과는 가장 낮은 동일성을 보였다(71.1%). 외와 같은 염기성열의 비교 결과와 EcoRI 제한효소 인식부위의 존재로 미루어 CMV-As는 WT형으로 분류된다.

  • PDF