• Title/Summary/Keyword: 서열분석

Search Result 2,631, Processing Time 0.037 seconds

Development of Expressed Sequence Tags(ESTs) from Korean Native Chicken cDNA Libraries

  • Shin, Sang-Su;Song, Ki-Duk;Shin, Jee-Hye;Lee, Sun-Duck;Lee, Young-Mok;Kim, Jin-Kyu;Han, Jae-Yong
    • Proceedings of the Korea Society of Poultry Science Conference
    • /
    • 2003.11a
    • /
    • pp.67-68
    • /
    • 2003
  • 한국 재래 닭의 유전적 특성 규명 및 기능 유전체 연구의 기초재료를 확보하고자 대량 EST 염기서열 결정 및 생물정보학 분석을 실시하였다. 대량 EST 염기서열 분석을 위한 첫 번째 단계로 재래 닭의 뇌, 비장, 정소, 배아 생식기를 이용하여 cDNA library를 구축하였다. 각각의 library로부터 총 15,121개의 클론을 선정하여 염기서열을 결정하였다. 생물정보학 분석결과 15,121개의 염기서열은 총 10,353개의 contig로 정리되었다. 이들 염기서열을 기존 데이터베이스를 대상으로 tBlastX(http://www.ncbi.nlm.nih.gov/BLAST) 분석을 실시한 결과, 염기서열 중 56 %가 기존 데이터베이스에 존재하는 유전자와의 상동성을 보였다. 상동성을 보이는 유전자들은 유전자의 구조 및 기능 분석에 이용될 것이고, 상동성을 보이지 않는 유전자들은 microarray와 같은 대량 유전자 발현분석 시스템을 이용하여 선별한 후 기능분석이 실시될 것이다.

  • PDF

Probe Selection of DNA Microarrays Using Genetic Algorithms (유전 알고리즘을 이용한 DNA Microarray의 Probe 선택)

  • Kim, Sun;Zhang, Byoung-Tak
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.183-187
    • /
    • 2002
  • DNA microarray는 분자생물학 및 DNA 컴퓨팅 분야에 널리 사용되고 있는 실험 도구이다. DNA microarray를 이용하는 한 예는 알려진 유전자 집합을 바탕으로 하여 hybridization을 통해 새로운 DNA 서열을 분석하는 것이다. 이를 위한 가장 간단한 방법은 알려진 유전자의 모든 서열을 DNA microarray 상에 올려놓는 것이지만 이는 결과의 정확도 및 칩 제작비용 면에서 비효율적이다. 따라서 일반적으로는 유전자 서열 정보를 파악한 후 일련의 DNA 서열을 선택하는 probe 디자인 과정을 거친다. 그러나 현재 유전자 서열을 바탕으로 최적의 probe 집합을 찾는 결정적인 방법이 존재하고 있지 않다. 이에 본 논문은 oligo DNA microarray을 이용한 DNA 서열 분석 문제에 있어서 가능한 많은 유전자를 인식하면서 최소의 probe 개수를 갖는 집합을 찾는 방법을 제안한다. 제시된 방법은 가능한 probe 집합들로 해집합을 구성한 후, 유전알고리즘을 이용한 진화 과정을 통해 목적하는 probe 집합을 찾는다. 본 논문에서는 GenBank로부터 얻은 일련의 유전자 집합을 대상으로 실험하였으며 그 결과를 분석하였다.

  • PDF

A Visualization Tool for Similarity Estimation of Sequence Data (서열 정보의 유사성 검사를 위한 가시화 도구)

  • 황미녕;강영민;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.559-561
    • /
    • 2000
  • 현재 활발한 연구가 진행중인 유전자 분석과 같은 분야에서는 유전자 염기 서열과 같은 대규모 서열 정보들에 대한 효과적인 분석기술을 요구하고 있다. 본 논문은 이러한 서열 정보들 사이의 유사도를 측정하고 분석하는 작업을 효과적으로 지원하기 위한 가시화 도구의 개발을 다룬다. 본 논문에서 사용하는 유사도 가시화 기법은 유전자 정보의 유사도 가시화를 위해 제안되었던 시각적 점-행렬 도면(Graphical Dot-Matrix Plots) 기법을 이용하는데, 이 시각적 점-행렬 도면 기법은 비교 대상이 되는 서열 정보의 크기가 커지면 효율적으로 가시화하기가 힘들다는 단점을 가진다. 본 논문은 시각적 점-행렬 도면 기법의 이러한 문제를 해결하기 위해 서열 정보 유사도 비교 결과를 화면의 해상도 내에서 표현할 수 있도록 데이터를 영역별로 분할하고 각 영역별 일치도를 이분 그래프(bipartite graph)의 최대 평면 일치(maximal planar matching)를 이용하여 결정하고 이를 하나의 화소(pixel)로 출력하는 기법을 제안한다.

  • PDF

The Complete Chloroplast DNA Sequences of Viola selkirkii (뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열 분석)

  • Ah-Reum Go;Yun-Sun Lee;Kyung-Ah Kim;Kyeong-Sik Cheon;Ki-Oug Yoo
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2020.12a
    • /
    • pp.55-55
    • /
    • 2020
  • 뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열을 차세대염기서열분석법(NGS)을 이용하여 분석하였다. 재료는 강원도 화천군 일산과 제주도 한라산의 2개체를 사용하였다. 분석결과, 염기서열의 길이는 일산의 뫼제비꽃이 156,774 bp (GC content: 36.30%), 한라산의 뫼제비꽃이 157,451 bp(GC content: 36.30%)로 한라산 개체가 길게 분석되었다. 구간별로 LSC(Large single copy)지역은 한라산 개체(85,950 bp)가 일산 개체(85,930 bp)보다 20 bp 길었으며, SSC(Small single copy)지역은 한라산 개체(17,261 bp)보다 일산 개체가 17,982 bp로 길게 분석되었다. IR(Inverted repeat)지역은 한라산 개체가 27,120 bp로 일산 개체(26,431 bp)보다 길게 분석되었다. 이러한 염기서열 길이의 차이는 종내 개체 간 빈번하게 발생하는 현상으로 IGS와 intron 구간에서 확인 된 단순반복서열의 일부 누락과 IR지역 내의 수축과 확장에 의한 것으로 판단된다. 뫼제비꽃 2개체의 엽록체 게놈을 구성하는 유전자 수는 총 111개로 동일하였으며, protein coding gene 77개, tRNA(transfer RNA) gene 30개, 그리고 rRNA (ribosomal RNA) gene 4개로 구성되어 있었다. 이는 기 발표된 엽록체 DNA 전체 염기서열이 밝혀진 제비꽃속 (Viola) 종류들과 동일한 결과이다.

  • PDF

Analysis of sequence alignment Tools on polymorphic genomes (다염기변이 유전체에 대한 서열 정렬 툴 분석)

  • Kim, Yoo-Sun;Kim, Jong-Hyun;Yeo, Yun-Ku;Kim, Woo-Cheol;Park, Sang-Hyun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.217-221
    • /
    • 2008
  • 생명공학 기술의 발달로 지놈 프로젝트를 통해 인간 초파리 등 여러 종의 유전체 정보가 밝혀 졌다. 그러나 Post-Genome 연구에 있어서 매우 중요한 생물체인 멍게(Ciona intestinalis)와 성게(Strongylocentrotus purpuratus)의 유전체 서열은 현재 공개되어 있으나 염기서열의 연속성(continuity)에는 심각한 문제점이 존재하고 있다. 이들은 염기서열에 변이가 많은 다염기변이 유전체(polymorphic genomes)로 그 특성이 반영되지 않은 전통적인 Whole Genome Shotgun Sequencing(WGSS)방법을 사용였기 때문이다. 이와 같은 다염기변이 유전체 서열 분석은 시스템 생물학이나 비교 유전체학 등의 후발 연구에 기초가 되므로 매우 중요하다. 본 논문에서는 다염기변이 유전체에 대해 알아보고 서열 조립 알고리즘의 기본이 되는 서열 정렬 툴들 중 가장 많이 사용되는 FASTA, BLAST, BLAT에 대해 분석하여 봄으로써 다염기변이 유전체에 적합한 서열 조립 전략 수립을 위해 고려해야 하는 사항들을 논의해 본다.

  • PDF

Cloning and Characterization of Highly Repetitive Sequences in the Genome of Allium sativum L. (마늘(Allium sativum L.) 게놈의 고반복서열의 분이와 특성 조사)

  • 이동희
    • Journal of Plant Biology
    • /
    • v.39 no.1
    • /
    • pp.49-55
    • /
    • 1996
  • We have studied the DNA of Allium sativum L. with respect to highly repetitive sequences. Fast reassociated DNA fragments expected to be highly repetitive sequences based on $C_{o}t$ curve were isolated and characterized. Their copy numbers were approximately $10^{5}~10^{7}$ per haploid genome. Nucleotide sequences analysis of six candidates reveals that their G/C content were low, 25-40% and typical patterns of repeating sequences exist. Repeat sequences were used as probes to access restriction fragment length polymorphism (RFLP) of genomic DNAs of four local clones, Tanyang, Mungyong, So san, and Uisong. The hybridization pattern were very similar among these four local clones.clones.

  • PDF

Feature selection and frequent pattern analysis in protein motif sequence (모티프 서열에서의 특징추출 및 빈발패턴 분석)

  • Kim, Dae-Sung;Lee, Bum-Ju;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.10-13
    • /
    • 2007
  • 모티프는 진화과정을 거치면서 단백질 서열상에서 부분적으로 높게 보존된 지역을 의미한다. 이러한 모티프는 단백질의 기능과 구조를 예측하거나 생물학적으로 관련성이 있는 단백질의 공통적인 특성을 기술하는데 사용된다. 또한, 모티프와 단백질 서열의 상관관계는 생물학적 기능 예측에 필수적이며, 이러한 예측 문제는 모티프 검색을 통해 서열에 존재하는 빈발한 서열패턴과 구조패턴을 통해 단백질 서열에 대한 분석이 가능하다. 이 논문에서는 단백질 서열에 존재하는 2차 구조 특성과 빈발패턴을 검색하고 추출된 정보를 이용하여 단백질 기능 분류에 활용하고자 한다.

  • PDF

An Analysis System for Whole Genomic Sequence Using String B-Tree (스트링 B-트리를 이용한 게놈 서열 분석 시스템)

  • Choe, Jeong-Hyeon;Jo, Hwan-Gyu
    • The KIPS Transactions:PartA
    • /
    • v.8A no.4
    • /
    • pp.509-516
    • /
    • 2001
  • As results of many genome projects, genomic sequences of many organisms are revealed. Various methods such as global alignment, local alignment are used to analyze the sequences of the organisms, and k -mer analysis is one of the methods for analyzing the genomic sequences. The k -mer analysis explores the frequencies of all k-mers or the symmetry of them where the k -mer is the sequenced base with the length of k. However, existing on-memory algorithms are not applicable to the k -mer analysis because a whole genomic sequence is usually a large text. Therefore, efficient data structures and algorithms are needed. String B-tree is a good data structure that supports external memory and fits into pattern matching. In this paper, we improve the string B-tree in order to efficiently apply the data structure to k -mer analysis, and the results of k -mer analysis for C. elegans and other 30 genomic sequences are shown. We present a visualization system which enables users to investigate the distribution and symmetry of the frequencies of all k -mers using CGR (Chaotic Game Representation). We also describe the method to find the signature which is the part of the sequence that is similar to the whole genomic sequence.

  • PDF

Web-based Research Assistant Tools for Analysis of Microbial Diversity (미생물 다양성 분석을 위한 웹기반의 생물정보도구 개발)

  • Kang, Byeong-Chul;Kim, Hyun-Jin;Park, Jun-Hyung;Park, Hee-Kyung;Kim, Cheol-Min
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.5
    • /
    • pp.545-550
    • /
    • 2004
  • The study of available genotypes (biodiversity analysis) in bacterial communities is of growing importance in several fields such as ecology, environmental technology, clinical diagnostics, etc. These culture-independent genotyping techniques, especially amplifying 16S rRNA genes, attempt to overcome some shortcomings of conventional cultivation method. Biodiversity analysis based on molecular technique were laborious for base-calling chromatogram, trimming primer sites, correcting strand directions, electing representative operation taxonomic units (OTU), etc. Also, biologists wanted intuitively to confirm results of the above processes. For making up these demands, we developed the web application based on Folder-Process-Filter (FPF) modeling with correspondence to classical Model-View-Controller model. The model of web application leads to keep virtues of simplicity and directness for development and management of the stepwise web interfaces. The web application was developed in Perl and CGI on Linux workstation. It can be freely accessed from http://home.pusan.ac.kr/~genome/tools/rat.htm.

Development of an efficient sequence alignment algorithm and sequence analysis software (효율적인 복수서열정렬 최적화기법 및 서열 분석 소프트웨어 개발)

  • Hwang, Jae-Jun;Kim, Dong-Hoi;Uhmn, Saang-Yong;Kim, Jin
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.847-849
    • /
    • 2003
  • 단백질들의 복수서열정렬은 단백질 서열간의 관계를 유추할 수 있는 유용한 도구이다. 최적화된 복수서열 정렬을 얻기 위해 사용되는 가장 유용한 방법인 dynamic programming은 특정한 비용함수를 사용할 수 없기 때문에 특별한 경우 최적의 복수서열정렬을 제공하지 못하는 문제점이 있어 이를 해결하기 위하여 이 논문에서는 부분정렬 개선 기법을 사용한 알고리즘을 제안하였으며, 서열정렬을 하는 사용자가 윈도우 시스템의 GUI환경을 사용하여 서열정렬을 보다 편하게 할 수 있도록 우리가 제안한 알고리즘과 다양한 서열정렬 알고리즘을 및 여러 개의 서열포맷형식을 하나의 프로그램으로 통합한 서열정렬 및 편집 프로그램을 Visual C++ 사용하여 개발하였다.

  • PDF