• Title/Summary/Keyword: DNA 염기 서열

Search Result 1,573, Processing Time 0.047 seconds

A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method (품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘)

  • Kim, Kwang-Baek
    • Journal of Intelligence and Information Systems
    • /
    • v.13 no.2
    • /
    • pp.55-68
    • /
    • 2007
  • DNA sequence alignment algorithms in computational molecular biology have been improved by diverse methods. In this paper, we proposed a DNA sequence alignment algorithm utilizing quality information and a fuzzy inference method utilizing characteristics of DNA sequence fragments and a fuzzy logic system in order to improve conventional DNA sequence alignment methods using DNA sequence quality information. In conventional algorithms, DNA sequence alignment scores were calculated by the global sequence alignment algorithm proposed by Needleman-Wunsch applying quality information of each DNA fragment. However, there may be errors in the process for calculating DNA sequence alignment scores in case of low quality of DNA fragment tips, because overall DNA sequence quality information are used. In the proposed method, exact DNA sequence alignment can be achieved in spite of low quality of DNA fragment tips by improvement of conventional algorithms using quality information. And also, mapping score parameters used to calculate DNA sequence alignment scores, are dynamically adjusted by the fuzzy logic system utilizing lengths of DNA fragments and frequencies of low quality DNA bases in the fragments. From the experiments by applying real genome data of NCBI (National Center for Biotechnology Information), we could see that the proposed method was more efficient than conventional algorithms using quality information in DNA sequence alignment.

  • PDF

개선된 다이나믹 프로그래밍과 품질 정보 및 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘

  • Lee, Seung-Hwan;Park, Choong-Shik;Kim, Kwang-Baek
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2007.05a
    • /
    • pp.341-350
    • /
    • 2007
  • DNA 염기 서열 배치 알고리즘은 분자 생물학 분야에서 단백질과 핵산 서열들의 분석에서 중요한 방법이다. 생물학적인 염기 서열들은 그들 사이의 유사성과 차이점을 나타내기 위해 정렬된다. 본 논문에서는 기존의 DNA 염기 서열 배치 방법을 개선하기 위하여 DP(Dynamic Programming) 알고리즘의 비용증가( O (nm) ) 문제를 해결하는 Quadrant 방법과 품질 정보 및 퍼지 추론시스템(fuzzy inference system)을 적용한 DNA 염기 서열 배치 알고리즘을 제안한다. 본 논문에서 제안한 DNA 염기 서열 배치 알고리즘은 Quadrant 방법을 적용하여 Needleman-Wunsch의 DP 기반 알고리즘에서의 행렬 생성 단계에서 발생하는 불필요한 정렬 계산을 제거하여 전체 수행 시간을 단축하고, 각 DNA 염기 서열 단편 각각의 길이 차이와 낮은 품질의 DNA 염기 빈도를 퍼지 추론 시스템에 적용하여 지능적으로 갭 비용(gap cost)을 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI (National Center for Biotechnology Information)의 실제 유전체 데이터로 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질정보만을 이용한 알고리즘보다 개선된 것을 확인하였다.

  • PDF

Nucleotide Sequences and Expression of cDNA Clones Encoding Uricase II in Canavalia lineata (해녀콩 Uricase II의 cDNA 염기서열과 발현)

  • 김호방
    • Journal of Plant Biology
    • /
    • v.36 no.4
    • /
    • pp.415-423
    • /
    • 1993
  • 대두의 uricase II cDNA를 탐침으로 plaque 혼성화 방법에 의해 해녀콩의 뿌리를 cDNA library로부터의 두 개의 phage 클론(λCINUO-01, λCINUO-02)을 선별하였다. 두 phage 클론은 약 1.6 kb와 1.0 kb의 insert를 갖고 있었으며 이들의 염기서열을 결정하기 위하여 pUC19과 pBSKS vector에 subcloing(pcCLNUO-01, pcCLNUO-02)하였다. Sanger법에 의해 염기서열을 결정한 결과, 두 클론은 각각 1,611 bp와 1,024 bp로 이루어져 있었으며 pcCINUO-01은 308개의 아미노산, pcCINUO-02는 301개의 아미노산을 암호화하는 open reading frame(ORF)을 갖고 있었다. 두 클론의 ORF의 염기서열은 대두의 uricase II와 각각 88.9%, 89.3%의 상동성을 보여주었으며, 아미노산 서열은 84.1%, 85.4%의 상동성을 보여주었다. pcCINUO-01의 경우, 종결코돈으로부터 313 NT 하류쪽에 진핵생물의 poly(A) 첨가신호인 AATAAA 서열이 존재하였으며 이로부터 21 NT 하류쪽에 17 잔기의 poly(A)가 존재하였다. 두 클론의 염기서열에서 추정된 아미노산 서열의 카르복시 말단에는 세포질에서 합성된 몇몇 단백질들이 peroxisome으로 수송되는데 필요한 신호서열인 Ser-Lys-Leu-COOH 서열이 존재하고 있었다. 두 클론의 염기서열을 토대로 아미노산 조성을 살펴본 결과, 염기성 아미노산(Arg, His, Lys)과 산성 아미노산(Asp, Glu)이 각각 46 대 35, 47 대 35의 비를 보여주었는데 이는 uricase II 단백질의 염기성 성질을 보여주는 결과로 추정된다. Northern 혼성화 결과 해녀콩에서 uricase II는 뿌리혹에서만 특이적으로 발현됨을 알 수 있었고 게놈 혼성화 반응 결과는 uricase II 유전자가 해녀콩 게놈상에 유전자 가족으로는 존재할 수 있음을 보여주었다.

  • PDF

A Paternity Testing Method Using DNA Repetive Sequences (DNA의 반복염기 서열 데이터베이스를 활용한 친자확인 방법)

  • Lee, Un;Lim, Jong-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1729-1732
    • /
    • 2002
  • DNA의 염기서열이 밝혀지면서 인간 생체에 대한 다양한 연구가 활발히 진행되고 있다. 응용분야 중 친자확인에 DNA 염기서열을 이용하려는 시도가 최근에 연구되고 있다. 본 연구는 DNA의 반복 염기서열을 이용하여 수작업으로 이루어지고 있는 친자 찬인 방법을 데이터베이스 기술을 이용하여 수행하는 최초의 연구이다. 방대한 양의 자료에서 친자확률을 계산하는데 걸리는 시간은 DB를 구축하는 방법에 크게 좌우된다. 본 논문에서는 친자확률을 계산하는 시간을 최소화할 수 있는 DB를 설계하고 또한 최소 시간내에 질의 결과를 획득하는 질의 구성하는 방법을 제안한다.

  • PDF

Universal Oligonucleotide Tag Design using Genetic Algorithm (유전알고리즘을 이용한 범용 올리고뉴클레오타이드 태그 디자인)

  • Lim Hee-Woong;Yoo Suk-In;Zhang Byound-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.256-258
    • /
    • 2005
  • 올리고뉴크레오타이드 서열의 디자인은 일반 분자 생물학 뿐만 아니라 DNA 컴퓨팅 분야에서도 중요한 문제이다. DNA나 RNA와 같은 생체 물질간의 화학반응을 이용하여 계산을 수행하는데 사용되는 염기 서열의 품질은 계산의 정확도에 큰 영향을 미치기 때문에, 문제의 특성에 따른 요구 조건에 안는 염기 서열을 디자인 하기위한 방법에 대해 여러 가지 연구가 있어왔다. 기존의 DNA 컴퓨팅을 위한 염기서열 디자인은 주어진 녹는점의 범위에서 단순히 서로 독립적인 염기서열들의 집합을 디자인 하거나, 분자생물학 실험에 사용되는 올리고 프로브나 프라이머 셋을 디자인 하는 것을 중심으로 이루어졌다. 반면, 본 논문에서는 세포에서 추출된 DNA/RNA 분자가 섞여있는 환경에서 어느 DNA/RNA 분자와도 흔성화 반응물 하지않는 범용 올리고뉴클레오타이드 태그를 디자인하는 간단한 유전 알고리즘을 제시하며, 이를 이용해서 디자인된 염기서열 결과를 제시한다.

  • PDF

Cloning and DNA Sequencing for Unstable Minisatellites DNA Regions in E. coli. (대장균 내에서 불안정한 Minisatellite DNA 영역의 클론닝 및 DNA 염기서열 결정)

  • 임선희;김재우;김광섭;정윤희;윤세련;배호정;안태진;선우양일
    • Korean Journal of Microbiology
    • /
    • v.40 no.2
    • /
    • pp.65-72
    • /
    • 2004
  • Instability of some eukaryotic sequence propagated in prokaryotic hosts is a frequently observed phenomenon. It is well documented that long inverted repeats, AT-rich sequences with structures like Z-DNA are extremely unstable in E. coli. These sequences may either be under-represented or even lost when cloned in E. coli. When we analyzed the polymorphic pattern for several tandom repeat (TR) in human SCKI gene, we found some TR regions were frequently deleted from plasmids and had difficult problem for their sequencing. These regions may result in non-clonability of the DNA sequence. Here we have cloned two difficult TR regions under low temperature and made two library for DNA sequencing using a nebulizer or sonicator. This study will help to determine the unstable genomic elements in complex mammalian genome.

Direct detection of hemophilia B F9 gene mutation using multiplex PCR and conformation sensitive gel electrophoresis (Multiplex PCR과 Conformation Sensitive Gel Electrophoresis를 이용한 혈우병B F9 유전자 돌연변이 직접 진단법)

  • Yoo, Ki Young;Kim, Hee Jin;Lee, Kwang Chul
    • Clinical and Experimental Pediatrics
    • /
    • v.53 no.3
    • /
    • pp.397-407
    • /
    • 2010
  • Purpose : The F9 gene is known to be the causative gene for hemophilia B, but unfortunately the detection rate for restriction fragment length polymorphism-based linkage analysis is only 55.6%. Direct DNA sequencing can detect 98% of mutations, but this alternative procedure is very costly. Here, we conducted multiplex polymerase chain reactions (PCRs) and conformation sensitive gel electrophoresis (CSGE) to perform a screened DNA sequencing for the F9 gene, and we compared the results with direct sequencing in terms of accuracy, cost, simplicity, and time consumption. Methods : A total of 27 unrelated hemophilia B patients were enrolled. Direct DNA sequencing was performed for 27 patients by a separate institute, and multiplex PCR-CSGE screened sequencing was done in our laboratory. Results of the direct DNA sequencing were used as a reference, to which the results of the multiplex PCR-CSGE screened sequencing were compared. For the patients whose mutation was not detected by the 2 methods, multiplex ligation-dependent probe amplification (MLPA) was conducted. Results : With direct sequencing, the mutations could be identified from 26 patients (96.3%), whereas for multiplex PCRCSGE screened sequencing, the mutations could be detected in 23 (85.2%). One patient's mutation was identified by MLPA. A total of 21 different mutations were found among the 27 patients. Conclusion : Multiplex PCR-CSGE screened DNA sequencing detected 88.9% of mutations and reduced costs by 55.7% compared with direct DNA sequencing. However, it was more labor-intensive and time-consuming.

Gene Reangement through 151 bp Repeated Sequence in Rice Chloroplast DNA (벼 엽록체 DNA내의 151 bp 반복염기서열에 의한 유전자 재배열)

  • Nahm, Baek-Hie;Kim, Han-Jip
    • Applied Biological Chemistry
    • /
    • v.36 no.3
    • /
    • pp.208-214
    • /
    • 1993
  • To investigate the gene rearrangement via short repeated sequences in chloroplast DNA, the pattern of heterologous gene clusters containing the 151 bp repeated sequence with the development of plastid was compared in rice and the homologous gene clusters from various plant sources were searched for comparative analysis. Southern blot analysis of rice DNA using rp12 gene containing 151 bp repeated sequence as a probe showed the presence of heterologous gene clusters. Such heterologous gene clusters varied with the development of plastid. Also it was observed that the heterologous gene clusters were observed in all of the rice cultivars used in this work. Finally the comparative analysis of DNA sequence of the homologous gene clusters from various plants showed the evolutionary gene rearragngement via short repeated sequence among plants. These results suggest the possible relationship between the plastid development and gene rearrangement through short repeated sequences.

  • PDF

Diversity Census of Fungi in the Ruminal Microbiome: A meta-analysis (반추위 곰팡이 다양성 조사 : 메타분석)

  • Song, Jaeyong;Jeong, Jin Young;Kim, Minseok
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.18 no.12
    • /
    • pp.466-472
    • /
    • 2017
  • This study was designed to examine the diversity census of fungi in rumen microbiome via meta-analysis of fungal 28S rDNA sequences. Both terms, "rumen" and "ruminal," were searched to retrieve the sequences of rumen fungi. As of September 2016, these sequences (n=165) of ruminal origin were retrieved from the Ribosomal Database Project (RDP; http://rdp.cme.msu.edu), an archive of all 28S rDNA sequences and were assigned to the phyla Ascomycota, Neocallimastigomycota, and Basidiomycota, which accounted for 109, 48, and 8 of the 165 sequences, respectively. Ascomycota sequences were assigned to the genera Pseudonectria, Magnaporthe, Alternaria, Cochliobolus, Cladosporium, and Davidiella, including fungal plant pathogens or mycotoxigenic species. Moreover, Basidiomycota sequences were assigned to the genera Thanatephorus and Cryptococcus, including fungal plant pathogens. Furthermore, Neocallimastigomycota sequences were assigned to the genera Cyllamyces, Neocallimastix, Anaeromyces, Caecomyces, Orpinomyces, and Piromyces, which may degrade the major structural carbohydrates of the ingested plant material. This study provided a collective view of the rumen fungal diversity using a meta-analysis of 28S rDNA sequences. The present results will provide a direction for further studies on ruminal fungi and be applicable to the development of new analytic tools.

Determination of Nucleotide Sequences of cDNA from Cucumber Mosaic Virus-As RNA4 (As계의 오이 모자이크 바이러스 RNA4의 염기서열 결정)

  • 김상현;박원목;이세영;박영인
    • Korean Journal Plant Pathology
    • /
    • v.12 no.2
    • /
    • pp.176-181
    • /
    • 1996
  • Aster yomena로부터 분리한 오이 모자이크 바이러스(cucumber mosaic virus) (CMV-As)의 RNA4로부터 완전한 길이의 cDNA를 합성하고 그 전체적인 염기서열(1,043 nt`s)을 결정하였다. CMV-As RNA4는 73개의 염기로 구성된 5`말단의 leader 부위, 657개의 염기로 구성된 외피단백질(coat protein) 유전자 부위 및 312개의 염기로 구성된 3` 말단의 비번역 부위로 구성되어 있음을 확인하였다. 외피단백질 유전자 부위의 염기서열을 다른 계통의 CMV와 비교해 볼 때 그 염기서열이 보전적으로 존재하고 있으나 그 외의 부분은 다양함을 확인하였다. 특히 3` 말단부위의 61개의 염기로 구성된 부위(959-1019)는 다른 계통의 CMV에서는 상당히 유사하지만 CMV-As도 다른 CMV처럼 tRNA와 유사한 구조를 역시 형성함을 확인하였다. CMV-As의 RNA4 염기서열을 다른 계통의 CMV와 비교할 때 CMV-I17F와 가장 유사하였으며(91.9%) S형의 CMV-M과는 가장 낮은 동일성을 보였다(71.1%). 외와 같은 염기성열의 비교 결과와 EcoRI 제한효소 인식부위의 존재로 미루어 CMV-As는 WT형으로 분류된다.

  • PDF