• 제목/요약/키워드: 염기

검색결과 4,786건 처리시간 0.029초

DNA 염기의 토토머화에 의한 염기쌍 변이 연구: 염기쌍의 전이 돌연변이를 중심으로

  • 이연희;이민준;신석민
    • EDISON SW 활용 경진대회 논문집
    • /
    • 제4회(2015년)
    • /
    • pp.99-104
    • /
    • 2015
  • DNA 복제는 굉장한 정확도를 가지고 이루어진다. 하지만 내, 외부적인 여러 요인으로 돌연변이가 일어나기도 한다. 그 중 토토머화에 의해 치환 돌연변이가 일어난다는 가설은 오래전부터 그 가능성이 논의되어 왔고, 직접적인 증거를 찾으려는 노력도 있어 왔다. 토토머화에 의하여 DNA염기가 다른 형으로 변하면 왓슨-크릭 염기쌍 (아데닌-타이민, 시토신-구아닌이 수소결합한 염기쌍)이 아닌 다른 염기쌍이 생성될 수 있다. 이 염기쌍이 기준이 되어 DNA가 복제되기 때문에 결과적으로 전이 돌연변이(transition), 혹은 전환 돌연변이(transversion)된 염기쌍이 생성될 수 있다. 우리는 이런 사례 중에 염기쌍의 전이 돌연변이를 중심으로 연구하고자 한다. A-T염기쌍중 하나가 지배적인 아민형(amine form)이 아니라 이민형(imine form)으로 존재할 때 아민형과는 다른 수소결합이 가능해지며 보통 잘 생성되지 않는 A-C, G-T결합이 생성될 수 있다. 이후 그 염기쌍이 기준이 되어 DNA가 복제될 때에는 왓슨-크릭 염기쌍이 주로 생성되어 A-T염기쌍이 G-C 염기쌍으로 치환되는 DNA가닥이 생기게 된다. 우리는 이러한 과정을 에너지와 반응속도 측면에 집중하여 분석해보았다. 계산 결과, $A-C^*$, $A^*-C$, $G-C^*$, $G^*-C$의 염기쌍 생성이 왓슨-크릭 염기쌍과 비슷하거나 더 큰 정도로 에너지 면에서 유리하였으며 대부분의 돌연변이가 에너지 측면에서 보았을 때 $A-C^*$ 염기쌍을 통하여 생김을 알 수 있었다. 계산된 값은 약 $10^{-6}$ 정도의 빈도를 보였다.

  • PDF

다염기변이 및 메타유전체 염기서열 생성도구에 관한 연구 (A Study on a tool to generate polymorphic genome and metagenome sequences)

  • 김종현;김우철;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.262-263
    • /
    • 2007
  • 유전체학 (genomics)의 가장 기초적인 기반이 되는 것은 염기서열을 정확하게 결정해 내는 것이다. 많은 진핵생물들 (eukaryotes)은 두개의 상동염색체를 가지며 두개의 염색체의 염기서열에는 차이가 존재한다. 현재의 유전체 염기서열 결정방법으로는 염기변이가 많이 존재할 경우 유전체의 염기서열을 결정하기 어렵다. 특정한 장소에 서식하는 무수히 많은 미생물들의 유전체의 염기서열을 동시에 결정하는 문제도 미생물학에서 중요성을 인정받는 문제이지만, 미생물들간의 염기변이의 정도는 단일개체의 경우보다 복잡하며 염기서열을 효과적으로 결정하기 힘들다. 따라서 염기변이가 많은 생물들과 미생물들 집합의 염기서열을 결정할 수 있는 방법론의 개발이 시급한 실정이다. 본 논문에서는 조립된 다염기변이 유전체및 메타유전체의 염기서열의 정확성을 평가하기 위한 유전체 서열과 시뮬레이션에 기반한 read 들을 생성하는 도구를 개발하는 것을 목표로 한다.

As계의 오이 모자이크 바이러스 RNA4의 염기서열 결정 (Determination of Nucleotide Sequences of cDNA from Cucumber Mosaic Virus-As RNA4)

  • 김상현;박원목;이세영;박영인
    • 한국식물병리학회지
    • /
    • 제12권2호
    • /
    • pp.176-181
    • /
    • 1996
  • Aster yomena로부터 분리한 오이 모자이크 바이러스(cucumber mosaic virus) (CMV-As)의 RNA4로부터 완전한 길이의 cDNA를 합성하고 그 전체적인 염기서열(1,043 nt`s)을 결정하였다. CMV-As RNA4는 73개의 염기로 구성된 5`말단의 leader 부위, 657개의 염기로 구성된 외피단백질(coat protein) 유전자 부위 및 312개의 염기로 구성된 3` 말단의 비번역 부위로 구성되어 있음을 확인하였다. 외피단백질 유전자 부위의 염기서열을 다른 계통의 CMV와 비교해 볼 때 그 염기서열이 보전적으로 존재하고 있으나 그 외의 부분은 다양함을 확인하였다. 특히 3` 말단부위의 61개의 염기로 구성된 부위(959-1019)는 다른 계통의 CMV에서는 상당히 유사하지만 CMV-As도 다른 CMV처럼 tRNA와 유사한 구조를 역시 형성함을 확인하였다. CMV-As의 RNA4 염기서열을 다른 계통의 CMV와 비교할 때 CMV-I17F와 가장 유사하였으며(91.9%) S형의 CMV-M과는 가장 낮은 동일성을 보였다(71.1%). 외와 같은 염기성열의 비교 결과와 EcoRI 제한효소 인식부위의 존재로 미루어 CMV-As는 WT형으로 분류된다.

  • PDF

위치기반 상대빈도차 기반의 바이러스 염기서열 시그너쳐 추출 기법 (A Nucleotide Sequence Signature Extraction Method based on Position-Specific Relative Base Frequency Differences)

  • 황경순;이혜리;이건명;이찬희;윤형우;김성수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.167-170
    • /
    • 2007
  • 동일한 집단에 속하는 개체를 다른 집단에 속하는 개체로부터 구별할 수 있는 염기의 특징을 해당 집단의 시그너쳐라고 한다. 학습 데이터는 두 집단에 속하는 염기서열들이고, 염기서열에 대한 시그너쳐는 개체를 다른 집단과 구별할 수 있는 위치의 염기들로 구성된 서열이다. 제안한 방법에서는 각 집단에 대해서 위치별로 염기의 발생빈도를 계산하고, 가장 발생빈도가 높은 염기를 결정한 다음, 다른 집단의 대응 위치에서 해당 염기의 빈도를 계산하여, 빈도차이가 지정한 분류임계값 이상이면, 해당 위치의 염기를 시그너쳐를 구성하는 특징으로 간주한다. 시그너쳐를 대한 임의의 염기서열에 대한 부합정도는 시그너쳐에 속하는 염기의 학습집단에서의 상대빈도값을 가중치로 하여 계산한다. 임의의 염기서열이 특정 집단에 속하는지 판단하기 위해서는 해당 집단의 시그너쳐에 대한 부합정도를 계산하게 되는데, 부합정도가 얼마이상이 되어야 해당 집단에 속하는 것으로 간주할지 기준이 되는 임계값을 엄밀도 임계값이라고 한다. 엄밀도 임계값은 학습 데이터 집합에 대해서 주어진 시그너쳐에 대한 엄밀도 임계값이 민감도와 특이도를 최대로 하는 것을 선택한다. 제안한 방법을 구현한 바이오인포매틱스 도구를 개발하여, 한국형 HIV-1 바이러스 시그너쳐 추출에 적용하여 분류특성이 우수한 시그너쳐를 추출할 수 있음을 확인하였다.

  • PDF

복수 염기서열 정렬을 위한 한 유용성 알고리즘 (An effcient algorithm for multiple sequence alignment)

  • 김진;송민동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.51-53
    • /
    • 1998
  • 3개 이상의 DNA 혹은 단백질의 염기서열을 정렬하는 복수 염기서열 정렬(multiple sequence alignment)방법은 염기서열들 사이의 진화관계, gene regulation, 단백질의 구조와 기능에 관한 연구에 필수적인 도구이다. 복수 염기서열 정렬문제는 NP-complete 문제군에 속하며, 이 문제를 해결하기 위하여 가장 유용하게 사용되는 알고리즘으로는 dynamic programming이 있다. Dynamic programming은 주어진 입력 염기서열 군들에 대한 최적의 정렬을 생산할 수 있다. 그러나 dynamic programming의 단점은 오랜 실행시간이 요구되며, 때로는 dynamic programming의 속성 때문에 이 알고리즘을 사용하여도 주어진 입력 염기서열 군들에 대한 최적의 정렬을 얻어내지 못하는 경우가 있다. 본 연구에서는 이러한 dynamic programming의 문제를 해결하기 위하여 genetic algorithm을 복수 염기서열 정렬문제에 적용하였다. 본 논문에서는 genetic algorithm의 design과 적용방법을 기술하였다. 본 연구에서 제안된 genetic algorithm을 사용하여 dynamic programming의 단점이었던 오랜 실행시간을 줄일 수 있었으며, dynamic programming이 제공하지 못하는 최적의 염기서열 정렬을 제공할 수 있었다.

  • PDF

한우 2번 염색체 양적형질좌위 영역에서 육질 연관 후보 DNA 마커 규명에 관한 연구 (Study on identification of candidate DNA marker related with beef quailty in QTL region of BTA 2 in Hanwoo population)

  • 이윤석;오동엽;여정수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.661-669
    • /
    • 2011
  • 한우산업은 유전적으로 우수한 개체를 선발하기 위하여 전통적인 육종방법에 유전체정보를 활용하여 정확하게 예측하는 기술을 개발하고 있는 실정이다. 따라서 본 연구에서는 이미 규명되어진 한우 2번 염색체 양적형질좌위을 바탕으로 발현염기서열표식 (EST) 단일염기 다형성 연관지도상에서 선발된 12개의 염기표식영역 표지인자내 단일염기다형성들과 한우집단의 육질과의 연관성을 평가하였다. 한우 2번 염색체 양적형질좌위영역에 있는 12개의 염기표식영역 표지인자를 이용하여 30차에서 33차 후대검정우 집단에서 가계정보가 서로 다른 20두에서 직접 염기서열분석을 한 결과 10개의 다형성이 있는 단일염기다형성를 확인할 수 있었다. 이 중에서 근내지방도 정규분포상 양쪽 집단과 단일염기다형성 유전자형간 빈도분석을 한 결과 HWSNP_1-1과 HWSNP_9-4 단일염기다형성에서 40%이상의 빈도차이를 나타내었다. 이 2개의 단일염기다형성들로 한우집단 (n=233)에서 근내 지방도와의 연관성을 살펴본 결과 HWSNP_1-1 단일염기다형성에서만 유의적인 차이를 나타내었다 (P<0.05). 따라서 본 연구에서는 HWSNP_1-1 단일염기다형성는 유전체정보를 활용한 한우 육질 개량에 있어 가장 효율적인 보조수단으로 활용가치가 높을 것이라 판단된다.

염기분포와 대치 비교를 이용한 염기서열 집단의 고유 시그너쳐 추출 (Characteristic Signature Extraction using the Base Distribution Substitution Comparison)

  • 황경순;이혜리;이건명;김성수;이찬희;이성덕;윤형우
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.419-422
    • /
    • 2007
  • 유전자 변이가 쉽게 일어나는 바이러스 등은 변이 계통에 따라 집단을 형성하게 된다. 이러한 집단들에 대한 분석은 해당 바이러스 집단에 대한 추적, 백신 및 치료약 개발에서 필수적이다. 어떤 집단의 염기 서열의 특성을 효과적으로 표현하는 패턴을 시그너쳐라 하며, 이러한 시그너쳐는 특정 염기서열 집단의 고유한 특성을 나타내면서 다른 집단과 구별되는 정보를 포함하는 것이 바람직하다. 이 논문에서는 가능한 후보 시그너쳐들을 염기분포를 이용하여 생성해가면서, 시그너쳐 해당부위의 염기를 상대 서열집단의 공통 서열의 염기로 변환하여 집단간의 상대거리를 측정함으로써, 후보 시그너쳐에 의한 집단의 고유성질 표현능력과 집단간 차별화 능력을 고려하여 시그너쳐를 추출하는 방법을 제안한다.

  • PDF

품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘 (A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method)

  • 김광백
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.55-68
    • /
    • 2007
  • 분자 생물학(computational molecular biology) 분야에서 DNA 염기 서열 배치 알고리즘은 다양한 방법으로 개선되어 왔다. 본 논문에서는 기존의 DNA 염기의 품질 정보(quality information)를 이용한 DNA 염기 서열 배치 방법을 개선하기 위하여 퍼지 논리 시스템(fuzzy logic system)과 DNA 염기 서열 단편의 특징을 적용한 품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘을 제안한다. 기존의 알고리즘은 Needleman-Wunsch가 제안한 전역 배치 알고리즘에 각 DNA 염기의 품질 정보를 적용하여 DNA 염기 서열 배치 점수를 계산하였다. 그러나 전체 DNA 염기의 품질 정보를 이용하여 계산하기 때문에 DNA 염기 말단 부분의 품질이 낮은 경우에는 DNA 염기 서열 배치 점수를 계산하는 과정에서 오차가 발생한다. 본 논문에서는 기존의 품질 정보를 이용한 알고리즘을 개선하여 DNA 염기 서열의 말단 부위의 품질이 낮은 경우에도 정확히 서열을 배치할 수 있도록 한다. 또한 DNA 염기 서열 단편의 길이와 낮은 품질의 DNA 염기 빈도를 퍼지 논리 시스템에 적용하여 DNA 염기 서열 배치 점수를 계산하는데 적용되는 매핑 점수 인자(parameter)를 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI(National Center for Biotechnology Information)의 실체 유전체 데이터를 받아 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질 정보만을 이용한 알고리즘 보다 DNA 염기 서열 배치에 있어서 효율적임을 확인하였다.

  • PDF

진화 알고리즘을 사용한 복수 염기서열 정렬 (Multiple Sequence Aligmnent Genetic Algorithm)

  • 김진;송민동;최홍식;장연아
    • 미생물학회지
    • /
    • 제35권2호
    • /
    • pp.115-120
    • /
    • 1999
  • 3개 이상의 DNA 혹은 단백질의 염기서열을 정렬하는 복수 염기서열 정렬은 염기서열들 사이의 진화관계, gene regulation, 단백질의 구조와 기능에 관한 연구에 필수적인 도구이다. 복수 염기서열 정렬을 얻기 위한 기존의 방법은 progressive pairwise alignment 와같이 빠른 실행시간 내에 만족할 만한 복수 염기서열 정렬을 제공하는 방법과, 최적의 복수 여기서열 정렬을 제공하나 실행시간이 상대적으로 긴 dynamic programming 과 같은 방법 등이 있다. 본 논문에서는 진화 알고리즘을 사용하여 기존의 방법에서 제공하는 복수 염기서열 정렬을 짧은 시간내에보다 개선된 복수 염기서열 정렬을 획득하게 하는 방법을 제시하였으며, 진화 알고리즘의 구성내용을 설명하였으며, 실제의 염기서열을 사용하여 이 방법의 장점을 보였다.

  • PDF

고추냉이에서 분리한 담배 모자이크 바이러스(TMV-W)의 전체 유전자 염기서열 분석 (Complete Nucleotide Sequence of Tobacco Mosaic Virus Isolated from Wasabi(Eutrema wasabi Maxim.))

  • 이귀재
    • 한국자원식물학회지
    • /
    • 제16권1호
    • /
    • pp.82-88
    • /
    • 2003
  • 고추냉이에 모자이크 병징을 나타내는 이병주로부터 고추냉이 모자이크 바이러스를 분리하였다. 고추냉이 모자이크 바이러스의 genomic RNA를 추출하여 전체 유전자 구조를 결정하였다. 유전자 전체길이는 6,298 염기를 가지고 있었으며, 4개 ORF로 구성 되어 있었다. ORF 1은 180KD 단백질, ORF 2는 130KD 단백질 , ORF 3은 30KD 단백질, ORF4는 18KD로 외피단백질로 구성되어 있었다. ORF 유전자간에는 ORF4와 ORF 3 유전자간 130개의 염기, ORF 2와 ORF 3 유전자갈 20개 염기 그리고 ORF 1 과 ORF2 유전자간에는 40개의 염기로 overlaps되어 있었다 3'NCR부분은 238개 염기, 외피단백질은 537개 염기, 30KD 이동단백질은 825개 염기, 130KD 단백질은 1,896개 염기와 180k단백질의 2,958개의 염기로 구성되어 있었다. TMV-WTF전체 염기 서열의 유전자 상동성에서는 비교 유전자에서 미보고된 일본의 TMV-WSF와 러시아의 TMV-crucifer와 각각 98.6%와 82.4%로 매우 높았다.