• Title/Summary/Keyword: 염기서열

Search Result 2,641, Processing Time 0.031 seconds

Universal Oligonucleotide Tag Design using Genetic Algorithm (유전알고리즘을 이용한 범용 올리고뉴클레오타이드 태그 디자인)

  • Lim Hee-Woong;Yoo Suk-In;Zhang Byound-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.256-258
    • /
    • 2005
  • 올리고뉴크레오타이드 서열의 디자인은 일반 분자 생물학 뿐만 아니라 DNA 컴퓨팅 분야에서도 중요한 문제이다. DNA나 RNA와 같은 생체 물질간의 화학반응을 이용하여 계산을 수행하는데 사용되는 염기 서열의 품질은 계산의 정확도에 큰 영향을 미치기 때문에, 문제의 특성에 따른 요구 조건에 안는 염기 서열을 디자인 하기위한 방법에 대해 여러 가지 연구가 있어왔다. 기존의 DNA 컴퓨팅을 위한 염기서열 디자인은 주어진 녹는점의 범위에서 단순히 서로 독립적인 염기서열들의 집합을 디자인 하거나, 분자생물학 실험에 사용되는 올리고 프로브나 프라이머 셋을 디자인 하는 것을 중심으로 이루어졌다. 반면, 본 논문에서는 세포에서 추출된 DNA/RNA 분자가 섞여있는 환경에서 어느 DNA/RNA 분자와도 흔성화 반응물 하지않는 범용 올리고뉴클레오타이드 태그를 디자인하는 간단한 유전 알고리즘을 제시하며, 이를 이용해서 디자인된 염기서열 결과를 제시한다.

  • PDF

Development of Expressed Sequence Tags(ESTs) from Korean Native Chicken cDNA Libraries

  • Shin, Sang-Su;Song, Ki-Duk;Shin, Jee-Hye;Lee, Sun-Duck;Lee, Young-Mok;Kim, Jin-Kyu;Han, Jae-Yong
    • Proceedings of the Korea Society of Poultry Science Conference
    • /
    • 2003.11a
    • /
    • pp.67-68
    • /
    • 2003
  • 한국 재래 닭의 유전적 특성 규명 및 기능 유전체 연구의 기초재료를 확보하고자 대량 EST 염기서열 결정 및 생물정보학 분석을 실시하였다. 대량 EST 염기서열 분석을 위한 첫 번째 단계로 재래 닭의 뇌, 비장, 정소, 배아 생식기를 이용하여 cDNA library를 구축하였다. 각각의 library로부터 총 15,121개의 클론을 선정하여 염기서열을 결정하였다. 생물정보학 분석결과 15,121개의 염기서열은 총 10,353개의 contig로 정리되었다. 이들 염기서열을 기존 데이터베이스를 대상으로 tBlastX(http://www.ncbi.nlm.nih.gov/BLAST) 분석을 실시한 결과, 염기서열 중 56 %가 기존 데이터베이스에 존재하는 유전자와의 상동성을 보였다. 상동성을 보이는 유전자들은 유전자의 구조 및 기능 분석에 이용될 것이고, 상동성을 보이지 않는 유전자들은 microarray와 같은 대량 유전자 발현분석 시스템을 이용하여 선별한 후 기능분석이 실시될 것이다.

  • PDF

개선된 다이나믹 프로그래밍과 품질 정보 및 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘

  • Lee, Seung-Hwan;Park, Choong-Shik;Kim, Kwang-Baek
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2007.05a
    • /
    • pp.341-350
    • /
    • 2007
  • DNA 염기 서열 배치 알고리즘은 분자 생물학 분야에서 단백질과 핵산 서열들의 분석에서 중요한 방법이다. 생물학적인 염기 서열들은 그들 사이의 유사성과 차이점을 나타내기 위해 정렬된다. 본 논문에서는 기존의 DNA 염기 서열 배치 방법을 개선하기 위하여 DP(Dynamic Programming) 알고리즘의 비용증가( O (nm) ) 문제를 해결하는 Quadrant 방법과 품질 정보 및 퍼지 추론시스템(fuzzy inference system)을 적용한 DNA 염기 서열 배치 알고리즘을 제안한다. 본 논문에서 제안한 DNA 염기 서열 배치 알고리즘은 Quadrant 방법을 적용하여 Needleman-Wunsch의 DP 기반 알고리즘에서의 행렬 생성 단계에서 발생하는 불필요한 정렬 계산을 제거하여 전체 수행 시간을 단축하고, 각 DNA 염기 서열 단편 각각의 길이 차이와 낮은 품질의 DNA 염기 빈도를 퍼지 추론 시스템에 적용하여 지능적으로 갭 비용(gap cost)을 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI (National Center for Biotechnology Information)의 실제 유전체 데이터로 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질정보만을 이용한 알고리즘보다 개선된 것을 확인하였다.

  • PDF

A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method (품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘)

  • Kim, Kwang-Baek
    • Journal of Intelligence and Information Systems
    • /
    • v.13 no.2
    • /
    • pp.55-68
    • /
    • 2007
  • DNA sequence alignment algorithms in computational molecular biology have been improved by diverse methods. In this paper, we proposed a DNA sequence alignment algorithm utilizing quality information and a fuzzy inference method utilizing characteristics of DNA sequence fragments and a fuzzy logic system in order to improve conventional DNA sequence alignment methods using DNA sequence quality information. In conventional algorithms, DNA sequence alignment scores were calculated by the global sequence alignment algorithm proposed by Needleman-Wunsch applying quality information of each DNA fragment. However, there may be errors in the process for calculating DNA sequence alignment scores in case of low quality of DNA fragment tips, because overall DNA sequence quality information are used. In the proposed method, exact DNA sequence alignment can be achieved in spite of low quality of DNA fragment tips by improvement of conventional algorithms using quality information. And also, mapping score parameters used to calculate DNA sequence alignment scores, are dynamically adjusted by the fuzzy logic system utilizing lengths of DNA fragments and frequencies of low quality DNA bases in the fragments. From the experiments by applying real genome data of NCBI (National Center for Biotechnology Information), we could see that the proposed method was more efficient than conventional algorithms using quality information in DNA sequence alignment.

  • PDF

한국 여성의 Lactadherin 유전자의 Polymorphism 연구

  • 전길수;염행철
    • Proceedings of the Korean Society of Developmental Biology Conference
    • /
    • 2003.10a
    • /
    • pp.94-94
    • /
    • 2003
  • Rotavirus는 유아나 어린아이들에게 가장 일반적으로 나타나는 심한 위장염의 원인자이며 설사로 인한 심한 탈수 증세를 일으켜 급속히 성장하는 유아의 균형적인 영양 공급을 방해함으로써 유아들의 발육과 성장 그리고 심하면 생명에 커다란 영향을 미치게 된다. 한편 모유로 키운 유아들은 설사병의 낮은 발병율과 연관이 있었다. 특히 모유의 뮤신 복합체는 rotavirus에 특이적으로 결합하여 항 바이러스활동을 보여주는 것으로 나타났다. 이러한 배경에서 본 연구는 human breast tissue로부터 lactadherin의 cloning 및 sequence 분석을 통하여 유전자의 다양성을 조사하기로 하였다. 한국 여성 9명의 유두 근처 조직에서 lactadherin을 cloning하여 그 sequence를 보고 된 서양여성의 염기서열과 비교 분석결과 여러 곳에서 single nucleotide variation이 발견되었고 본 연구에서 클론한 lactadherin(31bp-1518bp)의 염기서열과 보고된 서양여성 lactadherin gene의 SNP와 비교하였을 때 8개의 SNP중 3부분만이 일치한다는 것을 확인하였다. 또한 같은 조직중 정상 조직과 암 조직 부분에서 각각 lactadherin을 클론하여 염기서열을 비교 분석하였는데 정상 조직에서 2곳의 silent mutation있었고 암조직에서 2곳의 mutation과 1곳의 silent mutation을 발견하였으며 전체 적으로 정상조직과 암 조직 부분에서 lactadherin을 clone하여 염기서열을 분석해본 결과 암조직일수록 유전자의 변이 비율이 높다는 것을 알 수 있었다. 그리고 동일한 염기서열 상에서 많은 변이가 일어났는데 286dp(A->C), 1418dp(G->C)은 mutation이었고 327dp (A->G), 454(C->T)은 silent mutation이었다. 그 외 DNA상에서 여러 부근에 변이가 존재하였는데 이 결과로 보아 coding region에 위치한 cSNP 중 amino acid 변화를 일으켜 protein structure 또는 function에 영향을 줄 수 있는 non-synonymous cSNP 일 것으로 예상되어지며 natural selection의 영향을 받고 있음을 암시하고 있다. 본 연구에서 관찰되어진 각각의 염기 서열의 변이는 한국 사람이 가지는 lactadherin gene의 cSNP의 일부라고 판단하였다.

  • PDF

The Complete Chloroplast DNA Sequences of Viola selkirkii (뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열 분석)

  • Ah-Reum Go;Yun-Sun Lee;Kyung-Ah Kim;Kyeong-Sik Cheon;Ki-Oug Yoo
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2020.12a
    • /
    • pp.55-55
    • /
    • 2020
  • 뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열을 차세대염기서열분석법(NGS)을 이용하여 분석하였다. 재료는 강원도 화천군 일산과 제주도 한라산의 2개체를 사용하였다. 분석결과, 염기서열의 길이는 일산의 뫼제비꽃이 156,774 bp (GC content: 36.30%), 한라산의 뫼제비꽃이 157,451 bp(GC content: 36.30%)로 한라산 개체가 길게 분석되었다. 구간별로 LSC(Large single copy)지역은 한라산 개체(85,950 bp)가 일산 개체(85,930 bp)보다 20 bp 길었으며, SSC(Small single copy)지역은 한라산 개체(17,261 bp)보다 일산 개체가 17,982 bp로 길게 분석되었다. IR(Inverted repeat)지역은 한라산 개체가 27,120 bp로 일산 개체(26,431 bp)보다 길게 분석되었다. 이러한 염기서열 길이의 차이는 종내 개체 간 빈번하게 발생하는 현상으로 IGS와 intron 구간에서 확인 된 단순반복서열의 일부 누락과 IR지역 내의 수축과 확장에 의한 것으로 판단된다. 뫼제비꽃 2개체의 엽록체 게놈을 구성하는 유전자 수는 총 111개로 동일하였으며, protein coding gene 77개, tRNA(transfer RNA) gene 30개, 그리고 rRNA (ribosomal RNA) gene 4개로 구성되어 있었다. 이는 기 발표된 엽록체 DNA 전체 염기서열이 밝혀진 제비꽃속 (Viola) 종류들과 동일한 결과이다.

  • PDF

Next Generation Sequencing and Bioinformatics (차세대 염기서열 분석기법과 생물정보학)

  • Kim, Ki-Bong
    • Journal of Life Science
    • /
    • v.25 no.3
    • /
    • pp.357-367
    • /
    • 2015
  • With the ongoing development of next-generation sequencing (NGS) platforms and advancements in the latest bioinformatics tools at an unprecedented pace, the ultimate goal of sequencing the human genome for less than $1,000 can be feasible in the near future. The rapid technological advances in NGS have brought about increasing demands for statistical methods and bioinformatics tools for the analysis and management of NGS data. Even in the early stages of the commercial availability of NGS platforms, a large number of applications or tools already existed for analyzing, interpreting, and visualizing NGS data. However, the availability of this plethora of NGS data presents a significant challenge for storage, analyses, and data management. Intrinsically, the analysis of NGS data includes the alignment of sequence reads to a reference, base-calling, and/or polymorphism detection, de novo assembly from paired or unpaired reads, structural variant detection, and genome browsing. While the NGS technologies have allowed a massive increase in available raw sequence data, a number of new informatics challenges and difficulties must be addressed to improve the current state and fulfill the promise of genome research. This review aims to provide an overview of major NGS technologies and bioinformatics tools for NGS data analyses.

Analysis of ITS DNA Sequences of Korean Oxalis Species (Oxalidaceae) (한국산 괭이밥속(Oxalis) 식물 ITS DNA 염기서열 분석)

  • Koo, Jachoon;Chae, Mi Suk;Lee, Jeoung-Ki;Whang, Sung Soo
    • Korean Journal of Plant Taxonomy
    • /
    • v.37 no.4
    • /
    • pp.419-430
    • /
    • 2007
  • This study was conducted to know the taxonomic features of nuclear ribosomal ITS DNA sequences, ITS1, ITS3 and 5.8S regions, as to nine individuals belonging to four Oxalis species in Korea and an induced species. Sequences of the same regions of sixteen taxa deposited in GenBank were also aligned with those of Korean species as outgroups. The length of ITS sequences aligned in this study is 679 by in total. Evidences, from not only the sequence similarities and divergences but also the phylogenetic and statistical treatments with ITS sequences aligned, were useful for the taxonomy of the genus. The similarity of sequences, among both cauline and acauline taxa, is high as 89% and 95% respectively, but between cauline and acauline taxa, relatively low in the range of 64~69%. The sequence divergences, among both cauline and acauline taxa, is also high as much as 0.36~0.42, but between both cauline and both acauline taxa, low as 0.04~0.06. Two groups between cauline and acauline taxa are paraphyletic, and each group makes a single Glade with a high bootstrap value. The analysis of variance, using ITS sequence aligned, revealed that taxa are significantly different in the level of 0.5%, and O. corymbosa, an induced speices, is also separated from the Korean taxa in the Duncan analysis.

A DNA Sequence Search Algorithm Using Integer Type Transformation (정수형 변환을 이용한 DNA 서열 검색 알고리즘)

  • Yoon, Kyong-Oh;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.357-359
    • /
    • 2012
  • 초 고성능 바이오 서열 분석 장비 기술의 발달로 대량의 바이오 정보가 쏟아져 나오고 있으며, 바이오산업의 발달로 개인별 유전체 정보에 의한 맞춤의학의 시대가 도래되고 있다. 수많은 서열에 대한 분석에는 많은 저장장치 및 주기억장치가 필요하므로 슈퍼컴퓨터 급의 서버와 대량의 데이터를 빠르게 처리할 수 있는 프로그램이 필요하다. 이러한 분석에는 염기서열 일치 검색과 이를 기반으로 하는 Alignment와 Assembly 분석이 있으며, 이를 수행하는 기존의 알고리즘 및 대부분의 프로그램들은 염기서열을 문자열로 취급하고, 해쉬 인덱스 테이블, Brujin 그래프의 사용, 버러우즈 휠러 변환(BWT) 등의 기법을 활용하여 효율적인 분석을 도모하였다. 본 논문에서는 염기서열을 문자열이 아닌 k-mer 묶음의 정수형 하나로 변환하여 검색함으로써 저장 공간의 크기를 약 28% 이상으로 줄이고 형 변환 상태에서의 검색을 수행할 수 있는 알고리즘을 제안한다. Assembly 분석 프로그램인 CalcGen 프로그램을 개발하여 본 알고리즘의 효용성 및 효율성을 실험을 통해 검증하였다. 이 연구의 결과는 향후 대량의 유전체 염기서열의 효율적 분석과 저장 및 처리에 또 하나의 새로운 접근 방법을 제안하는데에 그 의미를 둘 수 있다.

A study of system development for multiple sequence alignment (복수 서열 정렬을 위한 시스템 개발에 관한 연구)

  • Kim, Dong-Hoi;Kim, Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.1027-1030
    • /
    • 2003
  • 유전체 서열결정이 폭발적으로 증가해 가고 있다. 인간 유전체사업(Human genome project)의 궁극적인 목적은 인간 염색체에 있는 30억개의 뉴클레오티드와 10만개의 유전자를 밝혀내는 것이고 생의학에서 새로운 발견이나 옹용을 위한 정보로 이용하는 것이다. 이 사업은 1980년대 후반에 시작되었고 현재 서열의 결정이 완료된 상태이다. 본 논문에서는 인간 유전체 사업에서 파생된 가장 중요한 문제 중의 하나인 복수 염기서열 정렬 문제와 복수 염기서열 정렬 시스템의 구현에 대하여 논한다.

  • PDF