• 제목/요약/키워드: DNA 염기 서열

검색결과 1,574건 처리시간 0.043초

품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘 (A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method)

  • 김광백
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.55-68
    • /
    • 2007
  • 분자 생물학(computational molecular biology) 분야에서 DNA 염기 서열 배치 알고리즘은 다양한 방법으로 개선되어 왔다. 본 논문에서는 기존의 DNA 염기의 품질 정보(quality information)를 이용한 DNA 염기 서열 배치 방법을 개선하기 위하여 퍼지 논리 시스템(fuzzy logic system)과 DNA 염기 서열 단편의 특징을 적용한 품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘을 제안한다. 기존의 알고리즘은 Needleman-Wunsch가 제안한 전역 배치 알고리즘에 각 DNA 염기의 품질 정보를 적용하여 DNA 염기 서열 배치 점수를 계산하였다. 그러나 전체 DNA 염기의 품질 정보를 이용하여 계산하기 때문에 DNA 염기 말단 부분의 품질이 낮은 경우에는 DNA 염기 서열 배치 점수를 계산하는 과정에서 오차가 발생한다. 본 논문에서는 기존의 품질 정보를 이용한 알고리즘을 개선하여 DNA 염기 서열의 말단 부위의 품질이 낮은 경우에도 정확히 서열을 배치할 수 있도록 한다. 또한 DNA 염기 서열 단편의 길이와 낮은 품질의 DNA 염기 빈도를 퍼지 논리 시스템에 적용하여 DNA 염기 서열 배치 점수를 계산하는데 적용되는 매핑 점수 인자(parameter)를 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI(National Center for Biotechnology Information)의 실체 유전체 데이터를 받아 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질 정보만을 이용한 알고리즘 보다 DNA 염기 서열 배치에 있어서 효율적임을 확인하였다.

  • PDF

개선된 다이나믹 프로그래밍과 품질 정보 및 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘

  • Lee, Seung-Hwan;Park, Choong-Shik;Kim, Kwang-Baek
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.341-350
    • /
    • 2007
  • DNA 염기 서열 배치 알고리즘은 분자 생물학 분야에서 단백질과 핵산 서열들의 분석에서 중요한 방법이다. 생물학적인 염기 서열들은 그들 사이의 유사성과 차이점을 나타내기 위해 정렬된다. 본 논문에서는 기존의 DNA 염기 서열 배치 방법을 개선하기 위하여 DP(Dynamic Programming) 알고리즘의 비용증가( O (nm) ) 문제를 해결하는 Quadrant 방법과 품질 정보 및 퍼지 추론시스템(fuzzy inference system)을 적용한 DNA 염기 서열 배치 알고리즘을 제안한다. 본 논문에서 제안한 DNA 염기 서열 배치 알고리즘은 Quadrant 방법을 적용하여 Needleman-Wunsch의 DP 기반 알고리즘에서의 행렬 생성 단계에서 발생하는 불필요한 정렬 계산을 제거하여 전체 수행 시간을 단축하고, 각 DNA 염기 서열 단편 각각의 길이 차이와 낮은 품질의 DNA 염기 빈도를 퍼지 추론 시스템에 적용하여 지능적으로 갭 비용(gap cost)을 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI (National Center for Biotechnology Information)의 실제 유전체 데이터로 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질정보만을 이용한 알고리즘보다 개선된 것을 확인하였다.

  • PDF

해녀콩 Uricase II의 cDNA 염기서열과 발현 (Nucleotide Sequences and Expression of cDNA Clones Encoding Uricase II in Canavalia lineata)

  • 김호방
    • Journal of Plant Biology
    • /
    • 제36권4호
    • /
    • pp.415-423
    • /
    • 1993
  • 대두의 uricase II cDNA를 탐침으로 plaque 혼성화 방법에 의해 해녀콩의 뿌리를 cDNA library로부터의 두 개의 phage 클론(λCINUO-01, λCINUO-02)을 선별하였다. 두 phage 클론은 약 1.6 kb와 1.0 kb의 insert를 갖고 있었으며 이들의 염기서열을 결정하기 위하여 pUC19과 pBSKS vector에 subcloing(pcCLNUO-01, pcCLNUO-02)하였다. Sanger법에 의해 염기서열을 결정한 결과, 두 클론은 각각 1,611 bp와 1,024 bp로 이루어져 있었으며 pcCINUO-01은 308개의 아미노산, pcCINUO-02는 301개의 아미노산을 암호화하는 open reading frame(ORF)을 갖고 있었다. 두 클론의 ORF의 염기서열은 대두의 uricase II와 각각 88.9%, 89.3%의 상동성을 보여주었으며, 아미노산 서열은 84.1%, 85.4%의 상동성을 보여주었다. pcCINUO-01의 경우, 종결코돈으로부터 313 NT 하류쪽에 진핵생물의 poly(A) 첨가신호인 AATAAA 서열이 존재하였으며 이로부터 21 NT 하류쪽에 17 잔기의 poly(A)가 존재하였다. 두 클론의 염기서열에서 추정된 아미노산 서열의 카르복시 말단에는 세포질에서 합성된 몇몇 단백질들이 peroxisome으로 수송되는데 필요한 신호서열인 Ser-Lys-Leu-COOH 서열이 존재하고 있었다. 두 클론의 염기서열을 토대로 아미노산 조성을 살펴본 결과, 염기성 아미노산(Arg, His, Lys)과 산성 아미노산(Asp, Glu)이 각각 46 대 35, 47 대 35의 비를 보여주었는데 이는 uricase II 단백질의 염기성 성질을 보여주는 결과로 추정된다. Northern 혼성화 결과 해녀콩에서 uricase II는 뿌리혹에서만 특이적으로 발현됨을 알 수 있었고 게놈 혼성화 반응 결과는 uricase II 유전자가 해녀콩 게놈상에 유전자 가족으로는 존재할 수 있음을 보여주었다.

  • PDF

DNA의 반복염기 서열 데이터베이스를 활용한 친자확인 방법 (A Paternity Testing Method Using DNA Repetive Sequences)

  • 이운;임종태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1729-1732
    • /
    • 2002
  • DNA의 염기서열이 밝혀지면서 인간 생체에 대한 다양한 연구가 활발히 진행되고 있다. 응용분야 중 친자확인에 DNA 염기서열을 이용하려는 시도가 최근에 연구되고 있다. 본 연구는 DNA의 반복 염기서열을 이용하여 수작업으로 이루어지고 있는 친자 찬인 방법을 데이터베이스 기술을 이용하여 수행하는 최초의 연구이다. 방대한 양의 자료에서 친자확률을 계산하는데 걸리는 시간은 DB를 구축하는 방법에 크게 좌우된다. 본 논문에서는 친자확률을 계산하는 시간을 최소화할 수 있는 DB를 설계하고 또한 최소 시간내에 질의 결과를 획득하는 질의 구성하는 방법을 제안한다.

  • PDF

유전알고리즘을 이용한 범용 올리고뉴클레오타이드 태그 디자인 (Universal Oligonucleotide Tag Design using Genetic Algorithm)

  • 임희웅;유석인;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.256-258
    • /
    • 2005
  • 올리고뉴크레오타이드 서열의 디자인은 일반 분자 생물학 뿐만 아니라 DNA 컴퓨팅 분야에서도 중요한 문제이다. DNA나 RNA와 같은 생체 물질간의 화학반응을 이용하여 계산을 수행하는데 사용되는 염기 서열의 품질은 계산의 정확도에 큰 영향을 미치기 때문에, 문제의 특성에 따른 요구 조건에 안는 염기 서열을 디자인 하기위한 방법에 대해 여러 가지 연구가 있어왔다. 기존의 DNA 컴퓨팅을 위한 염기서열 디자인은 주어진 녹는점의 범위에서 단순히 서로 독립적인 염기서열들의 집합을 디자인 하거나, 분자생물학 실험에 사용되는 올리고 프로브나 프라이머 셋을 디자인 하는 것을 중심으로 이루어졌다. 반면, 본 논문에서는 세포에서 추출된 DNA/RNA 분자가 섞여있는 환경에서 어느 DNA/RNA 분자와도 흔성화 반응물 하지않는 범용 올리고뉴클레오타이드 태그를 디자인하는 간단한 유전 알고리즘을 제시하며, 이를 이용해서 디자인된 염기서열 결과를 제시한다.

  • PDF

대장균 내에서 불안정한 Minisatellite DNA 영역의 클론닝 및 DNA 염기서열 결정 (Cloning and DNA Sequencing for Unstable Minisatellites DNA Regions in E. coli.)

  • 임선희;김재우;김광섭;정윤희;윤세련;배호정;안태진;선우양일
    • 미생물학회지
    • /
    • 제40권2호
    • /
    • pp.65-72
    • /
    • 2004
  • 진핵생물의 특정 염기배열을 원핵생물 내에서 증폭시킬 때 불안정성이 비교적 빈번히 관찰되어진다. 특히 long inverted repeats나 AT-rich sequences그리고 Z-DNA와 같은 구조를 지닌 염기배열은 대장균 내에서 매우 불안정하다. 이러한 염기서열은 대장균 내에서 부분적으로 결실되거나 완전히 손실된다. 본 연구실에서 human SCKI 유전자에 존재하는 몇 개의 tandem repeat (TR)에 대하여 다형성을 조사하였을 때, 어떤 TR 부분은 플라스미드로부터 빈번히 결실되어 그에 대한 염기서열 결정이 어려웠다. 그 결과 이러한 부분은 클론닝 될 수 없는 염기서열로 남게 되었다. 본 연구에서는 클론닝이 어려운 두 개의 TR 영역을 저온에서 클론닝하고 nebulizer나 sonicator를 이용하여 두 개의 library를 만들어 DNA 염기서열을 결정하였다. 이러한 연구는 복잡한 고등생물의 게놈연구에서 불안정한 게놈부분의 염기서열을 결정하는데 도움을 줄 것으로 사료된다.

Multiplex PCR과 Conformation Sensitive Gel Electrophoresis를 이용한 혈우병B F9 유전자 돌연변이 직접 진단법 (Direct detection of hemophilia B F9 gene mutation using multiplex PCR and conformation sensitive gel electrophoresis)

  • 유기영;김희진;이광철
    • Clinical and Experimental Pediatrics
    • /
    • 제53권3호
    • /
    • pp.397-407
    • /
    • 2010
  • 목 적 : F9 유전자는 혈우병B의 병인 유전자이다. 기존의 RFLP를 이용한 연관분석은 정보제공율이 55.6%에 불과하였다. 직접 염기서열 분석법은 98%의 돌연변이를 진단할 수 있지만, 고가의 비용이 든다. 본 연구는 F9 유전자를 대상으로 돌연변이의 선별검사로써 mPCR-CSGE를 사용하고, 이후 특정 유전자 부위만을 염기서열 분석하여 mPCR-CSGE의 유용성을 확인하기 위해 고안되었다. 방 법 : 연구대상은 비혈연 관계인 27명의 혈우병B 환자였다. 직접염기서열 분석법은 독립된 다른 기관에서 시행하였고, mPCR-CSGE 선별 후 염기서열 분석법은 본 연구자의 기관에서 시행되었다. 직접 염기서열 분석법의 결과가 참고치가 되어 mPCR-CSGE 선별 후 염기서열 분석법을 정확성, 경제성, 신속성, 편이성 측면에서 비교하였다. 두가지 방법으로 진단이 되지 않는 환자에게는 MLPA를 이용하여 돌연변이를 발견하였다. 결 과 : 직접 염기서열 분석법으로 26명(96.3%)의 환자에서 돌연변이를 확인할 수 있었다. mPCR-CSGE 선별 후 염기서열 분석법으로는 23명(85.2%)의 환자에서 돌연변이를 찾아낼 수 있었다. 1명의 환자는 MLPA로써 돌연변이를 확인할 수 있었다. 27명의 환자에게 21개의 독립적인 돌연변이가 있었다. mPCR-CSGE 선별 후 염기서열 분석법은 직접 염기서열 분석법에 비해 비용은 55.7%로 줄일 수 있었으나, 실험 단계는 더욱 복잡하였고, 시간도 하루가 더 걸렸으며, 세심한 실험상의 주의가 필요하였다. 결 론 : mPCR-CSGE 선별 후 염기서열 분석법은 85.2%의 높은 돌연변이 선별력을 보이고, 직접 염기서열 분석법의 57.7%의 비용만 소모하였으나, 실험과정에 세한 주의가 요구되었으며, 노동집약적이고, 실험 시간도 하루가 더 소요되었다.

벼 엽록체 DNA내의 151 bp 반복염기서열에 의한 유전자 재배열 (Gene Reangement through 151 bp Repeated Sequence in Rice Chloroplast DNA)

  • 남백희;김한집
    • Applied Biological Chemistry
    • /
    • 제36권3호
    • /
    • pp.208-214
    • /
    • 1993
  • 엽록체 DNA 내에서 반복 염기서열의 존재와 이들에 의한 유전자 재배열 현상을 고찰하기 위하여 151bp Repeated Sequence 갖는 이질적인 유전인자군의 존재를 여러가지 품종의 벼 엽록체 DNA에서 관찰 하였다. 또한 쌀 DNA를 벼의 생장과 조직부위에 따라 분리하고, rp12 probe를 이용하여 Southern blot 분석하여 엽록체의 발달에 따르는 엽록체 DNA의 재배열 현상을 관찰하였다. 아울러 유전자 재배열 현상을 유발하는 반복염기서열을 database로부터 검색하여 유전자의 상호 비교 분석하였다. 그 결과 151bp Repeated Sequence와 유사한 염기 서열을 같는 rp123유전자를 포함하는 이질적인 유전인자군은 어느 특정한 품종의 벼에 국한되는것이 아니고 본 실험에 사용된 다양한 품종의 벼에 일반적으로 나타나는 현상임이 확인되었으며 또한 이들의 양상은 벼의 조직 부위에 따라 다르게 나타나고 있음을 확인하였다. 이러한 실험적 결과와 함께 엽록체 유전자 database의 검색과 유전자의 상호비교분석을 통하여 151bp 반복 염기 저열에 의한 벼 엽록체 DNA의 유전자 재배열현상은 식물 특히 단자엽 식물의 진화와 함께 발달된 현상으로 특히 151bp반복 염기 서열은 매우 다양한 유전자 재배열을 유발하는 변이유발 위치로 발달되어 왔음을 확인할 수 있었다. 따라서 이러한 반복염기서열에 의한 유전자 재배열 현상은 특히 벼에 있어서 plastid의 발달에 밀접하게 관여하고 있음을 제시하고 있다.

  • PDF

반추위 곰팡이 다양성 조사 : 메타분석 (Diversity Census of Fungi in the Ruminal Microbiome: A meta-analysis)

  • 송재용;정진영;김민석
    • 한국산학기술학회논문지
    • /
    • 제18권12호
    • /
    • pp.466-472
    • /
    • 2017
  • 본 연구의 목적은 곰팡이 28S rDNA 염기서열의 메타분석을 통하여 반추위 곰팡이의 다양성을 조사하는데 있다. 'rumen'과 'ruminal'이 반추위 곰팡이 유래 염기서열들을 회수하기 위한 검색어로 사용되었다. 2016년 9월부로 모든 28S rDNA 염기서열이 보관되어 있는 Ribosomal Database Project(RDP, http://rdp.cme.msu.edu) 데이터베이스에서 반추위 곰팡이 유래 28S rDNA 유전자 염기서열(n=165)을 획득하였다. 총 165개의 염기서열은 분류학상의 '문(phylum)'인 Ascomycota, Neocallimastigomycota 및 Basidiomycota로 분류되었고, 165개의 염기서열 중에서 각각 109개, 48개, 8개의 염기서열을 차지하였다. Ascomycota 염기서열은 식물병원성곰팡이나 마이코톡신을 생성하는 곰팡이를 포함하고 있는 '속(genus)' Pseudonectria, Magnaporthe, Alternaria, Cochliobolus, Cladosporium 및 Davidiella로 분류되었다. 또한, Basidiomycota 염기서열은 식물병원성곰팡이를 포함하고 있는 '속(genus)' Thanatephorus와 Cryptococcus로 분류되었다. 뿐만 아니라, Neocallimastigomycota 염기서열의 경우 섭취된 조사료의 주요 구조탄수화물을 분해하는 '속(genus)' Cyllamyces, Neocallimastix, Anaeromyces, Caecomyces, Orpinomyces, Piromyces로 분류되었다. 본 연구는 처음으로 28S rDNA 염기서열의 메타분석을 통해 반추위 곰팡이 다양성에 대한 정보를 통합적으로 제공하였다. 본 연구의 결과는 향후 반추위 곰팡이 연구에 대한 방향을 제공할 것이고, 새로운 분석도구 개발에 응용될 수 있을 것이다.

As계의 오이 모자이크 바이러스 RNA4의 염기서열 결정 (Determination of Nucleotide Sequences of cDNA from Cucumber Mosaic Virus-As RNA4)

  • 김상현;박원목;이세영;박영인
    • 한국식물병리학회지
    • /
    • 제12권2호
    • /
    • pp.176-181
    • /
    • 1996
  • Aster yomena로부터 분리한 오이 모자이크 바이러스(cucumber mosaic virus) (CMV-As)의 RNA4로부터 완전한 길이의 cDNA를 합성하고 그 전체적인 염기서열(1,043 nt`s)을 결정하였다. CMV-As RNA4는 73개의 염기로 구성된 5`말단의 leader 부위, 657개의 염기로 구성된 외피단백질(coat protein) 유전자 부위 및 312개의 염기로 구성된 3` 말단의 비번역 부위로 구성되어 있음을 확인하였다. 외피단백질 유전자 부위의 염기서열을 다른 계통의 CMV와 비교해 볼 때 그 염기서열이 보전적으로 존재하고 있으나 그 외의 부분은 다양함을 확인하였다. 특히 3` 말단부위의 61개의 염기로 구성된 부위(959-1019)는 다른 계통의 CMV에서는 상당히 유사하지만 CMV-As도 다른 CMV처럼 tRNA와 유사한 구조를 역시 형성함을 확인하였다. CMV-As의 RNA4 염기서열을 다른 계통의 CMV와 비교할 때 CMV-I17F와 가장 유사하였으며(91.9%) S형의 CMV-M과는 가장 낮은 동일성을 보였다(71.1%). 외와 같은 염기성열의 비교 결과와 EcoRI 제한효소 인식부위의 존재로 미루어 CMV-As는 WT형으로 분류된다.

  • PDF