• 제목/요약/키워드: 서열

검색결과 3,677건 처리시간 0.029초

스트링 B-트리를 이용한 게놈 서열 분석 시스템 (An Analysis System for Whole Genomic Sequence Using String B-Tree)

  • 최정현;조환규
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.509-516
    • /
    • 2001
  • 생명 과학의 발전과 많은 게놈(genome) 프로젝트의 결과로 여러 종의 게놈 서열이 밝혀지고 있다. 생물체의 서열을 분석하는 방법은 전역정렬(global alignment), 지역정렬(local alignment) 등 여러 가지 방법이 있는데, 그 중 하나가 k-mer 분석이다. k-mer는 유전자의 염기 서열내의 길이가 k인 연속된 염기 서열로서 k-mer 분석은 염기서열이 가진 k-mer들의 빈도 분포나 대칭성 등을 탐색하는 것이다. 그런데 게놈의 염기 서열은 대용량 텍스트이고 k가 클 때 기존의 온메모리 알고리즘으로는 처리가 불가능하므로 효율적인 자료구조와 알고리즘이 필요하다. 스트링 B-트리는 패턴 일치(pattern matching)에 적합하고 외부 메모리를 지원하는 좋은 자료구조이다. 본 논문에서는 스트링 B-트리(string B-tree)를 k-mer 분석에 효율적인 구조로 개선하여, C. elegans 외의 30개의 게놈 서열에 대해 분석한다. k-mer들의 빈도 분포와 대칭성을 보여주기 위해 CGR(Chaotic Game Representation)을 이용한 가시화 시스템을 제시한다. 게놈 서열과 매우 유사한 서열 상의 어떤 부분을 시그니쳐(signature)라 하고, 높은 유사도를 가지는 최소 길이의 시그니쳐를 찾는 알고리즘을 제시한다.

  • PDF

Sphingomonas chungbukensis DJ77의 16S rRNA 염기서열과 이차구조 (Nucleotide Sequence and Secondary Structure of 16S rRNA from Sphingomonas chungbukensis DJ77)

  • 이관영;권해룡;이원호;김영창
    • 미생물학회지
    • /
    • 제41권2호
    • /
    • pp.125-128
    • /
    • 2005
  • S. chungbukensis DJ77로부터 16S rRNA유전자의 염기서열을 분식하였다. 염기서열은 총 1,502 bp로 2000 년에 등록된 부분 서열(1,435 bp)보다 5' 방향과 3' 방향으로 29 bp와 37 bp 길이만큼 각각 확장하였으며, 1 bp가 추가로 삽입되었다. E. coli의 16S rRNA유전자를 모델로 이차구조를 제작하였으며, 네 부위가 특이적임을 발견하였다. Sphnigomonas spp.의 16S rRNA 서열과 S. chungbukensis DJ77의 다중서열검색 결과, Sphingomonas종에서만 나타나는 보존부위와 가변부위를 발견할 수 있었다. 특히, Campylobacter jejuni에서만 나타나는 것으로 알려진 긴 stem loop구조가 서열은 조금 다르지만 구조적 일치를 보이는 유사한 구조를 S. chungbukensis DJ77에서도 발견하였다. 결과적으로, 다중서열검색을 통해 제작한 계통수와 nucleotide signatures분석에 근거하여 S. chugukensis DJ77을 cluster II (Sphingobium)로 분류하였다.

RAG-1 유전자의 염기서열 분석에 의한 각시붕어 Rhodeus uyekii와 떡납줄갱이 R. notatus 잡종의 동정 (Genetic Identification of Hybrids between Rhodeus uyekii and R. notatus by Sequence Analysis of RAG-1 Gene)

  • 윤영은;이일로;박상용;강언종;김응오;양상근;남윤권;방인철
    • 한국양식학회지
    • /
    • 제22권1호
    • /
    • pp.79-82
    • /
    • 2009
  • 한국 고유종인 각시붕어 R. uyekii와 떡납줄갱이 R. notatus로부터 유도된 정교배 및 상반교배 잡종어류의 분자생물학적 동정을 위하여 핵에서 encoding되는 RAG-1 유전자의 염기서열 분석을 실시하였다. 분석된 863 bp의 염기서열 중 각시붕어와 떡납줄갱이 사이에는 총 13개의 위치에서 염기서열 변이가 탐색되었다. 잡종어류의 RAG-1 유전자 염기서열을 분석한 결과 모계와 부계의 염기서열 차이를 보인 13개의 변이 부분에서 부모의 염기서열을 다같이 반영하는 double peaks 패턴을 보였으나 정교매체(UN 유전형)와 상반교배체(NU 유전형) 간의 염기서열 차이는 관찰되지 않았다.

엑솜 염기서열 분석 방법을 이용한 단일유전자질환의 원인 유전자 발굴 (Exome Sequencing in Mendelian Disorders)

  • 이종극
    • Journal of Genetic Medicine
    • /
    • 제7권2호
    • /
    • pp.119-124
    • /
    • 2010
  • 약 7,000 여개의 단일유전자질환이 보고되어 있지만 보고된 질환의 절반도 아직 원인 유전자가 밝혀지지 못한 상황이다. 그리고 기존에 밝혀진 원인 유전자의 돌연변이형들은 대부분 단백질을 코딩하는 부위의 돌연변이에 의하여 발생하고 있어서 인간 유전체에서 단백질을 코딩하는 엑손 부위만을 선별적으로 분리하여 염기서열을 분석하는 엑솜 염기서열 분석 방법은 희귀한 유전질환의 신규 원인 유전자 발굴을 위한 매우 효과적인 유전 분석법이 될 것이다. 엑솜은 전체 유전체의 약 1.5% 정도를 차지하고 있어서 매우 경제적으로 분석이 가능하다. 그리고 엑솜 염기서열 분석 방법은 엑솜 부위를 선별하는 기술과 대용량 염기서열 분석기술로 수행된다. Freeman-Sheldon 증후군의 원인 유전자를 엑솜 염기서열 분석 방법으로 발굴한 이후로 단일유전자질환의 원인 유전자 발굴을 위한 표준 분석법으로 엑솜 염기서열 분석방법이 사용되고 있다. 향후에는 엑솜 염기서열 분석 방법이 다양한 복합질병의 유전분석에도 활용되어 개인 맞춤의학의 실현을 앞당기는데 크게 기여할 것으로 기대된다.

뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열 분석 (The Complete Chloroplast DNA Sequences of Viola selkirkii)

  • 고아름;이윤순;김경아;천경식;유기억
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2020년도 추계국제학술대회
    • /
    • pp.55-55
    • /
    • 2020
  • 뫼제비꽃(Viola selkirkii)의 엽록체 DNA 염기서열을 차세대염기서열분석법(NGS)을 이용하여 분석하였다. 재료는 강원도 화천군 일산과 제주도 한라산의 2개체를 사용하였다. 분석결과, 염기서열의 길이는 일산의 뫼제비꽃이 156,774 bp (GC content: 36.30%), 한라산의 뫼제비꽃이 157,451 bp(GC content: 36.30%)로 한라산 개체가 길게 분석되었다. 구간별로 LSC(Large single copy)지역은 한라산 개체(85,950 bp)가 일산 개체(85,930 bp)보다 20 bp 길었으며, SSC(Small single copy)지역은 한라산 개체(17,261 bp)보다 일산 개체가 17,982 bp로 길게 분석되었다. IR(Inverted repeat)지역은 한라산 개체가 27,120 bp로 일산 개체(26,431 bp)보다 길게 분석되었다. 이러한 염기서열 길이의 차이는 종내 개체 간 빈번하게 발생하는 현상으로 IGS와 intron 구간에서 확인 된 단순반복서열의 일부 누락과 IR지역 내의 수축과 확장에 의한 것으로 판단된다. 뫼제비꽃 2개체의 엽록체 게놈을 구성하는 유전자 수는 총 111개로 동일하였으며, protein coding gene 77개, tRNA(transfer RNA) gene 30개, 그리고 rRNA (ribosomal RNA) gene 4개로 구성되어 있었다. 이는 기 발표된 엽록체 DNA 전체 염기서열이 밝혀진 제비꽃속 (Viola) 종류들과 동일한 결과이다.

  • PDF

Backpropagation을 이용한 Promoter 예측 방법 (Prediction of promoter by Backpropagation)

  • 허미영;김홍기;최진성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1569-1572
    • /
    • 2003
  • 최근 생명공학 분야의 기술이 혁신적으로 발달함에 따라 게놈 프로젝트가 본래 계획보다 2년 앞당겨져 2003 년 4 월 인간 유전자의 완전한 서열을 밝히고 성공적으로 완료됨으로서 관련 연구자들은 인간의 유전자에 대한 대량의 서열 데이터를 얻게 되었다. 그래서 게놈 프로젝트의 다음 단계로서 엄청난 양의서열 정보 분석으로부터 유전자의 기능을 파악하고자 하는 연구들이 이미 세계적으로 활발히 진행되고 있다. 이러한 연구들의 최종적 목표는 질병 치료와 생명연장의 실현이라고 볼 수 있다. 유전자 연구를 위해선 우선 일차적으로 유전자 부위를 파악해야 한다. 유전자는 구조적으로 다시 여러 부분으로 나뉘는데 유전자 발현의 개시에 매우 중요한 요소 중 하나가 바로 프로모터 (Promoter) 이다. 프로모터 내에는 TATA box 가 있는데 이는 프로모터의 핵심 요소이다. 프로모터는 생명체의 종 그리고 RNA 중합효소의 종류에 따라 다르다. 이 논문에서는 다양한 신경망 알고리즘 중의 하나인 Backtpropagation 을 이용하여 밝혀지지 알은 서열에서 인간을 포함하는 원핵생물의 프로모터 서열을 예측할 수 있는 방법을 얻었기에 소개하고자 한다.

  • PDF

효율적인 복수서열정렬 최적화기법 (An efficient optimization method for multiple sequence alignment)

  • 김진;정우철;엄상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.368-370
    • /
    • 2003
  • 단백질들의 복수서열정렬은 단백질 서열간의 관계를 유추할 수 있는 유용한 도구이다. 최적화된 복수서열정렬을 얻기 위해 사용되는 가장 유용한 방법은 dynamic programming이다. 그러나 dynamic programming은 특정한 비용함수를 사용할 수 없기 때운에 특별한 경우 최적의 복수서열정렬을 제공하지 못하는 문제점이 있다. 우리는 이러한 문제점을 해결하기 위하여 부분정렬개선기법을 사용한 알고리즘을 제안하였으며, 이 알고리즘이 dynamic programming의 문제점을 효과적으로 해결함을 보였다.

  • PDF

흡혈 박쥐(Desmodus rotundus)집단에 있어서의 서열관계

  • 박시룡
    • 한국동물학회지
    • /
    • 제31권4호
    • /
    • pp.243-250
    • /
    • 1988
  • 남미산 흡혈박쥐구esmodus rohndusl의 서열관계에 대해 자연상태와 유사한 조건하에서 사육상태의 집단을 연구하였다. 이들의 서열은 먹이장소에서 2마리의 성체들이 만났을때 4가지로 서로 다른 행동들(도망가기, 날아가기, 기다리기, 피하기)에 의해 결정했다. 공격행동(싸움후 도망가기)은 관찰된 전체행동들 가운데 16호로 비교적 적게 나타났다. 암컷들의 서열은 일부 먹이 서열에 의해서도 반영되었다. Harem수컷은 non-harem수컷들에 대해서 우위를 차지하였으며 열세 행동을 보여 주었다. 그러나 이 harem 수컷은 그의 성적 파트너에 대해서는 공격행동을 보이지 않았다. Dominance relationship was investigated in a captive of Desmodus rotundus, a neotopical sangivorous bat, under seminaturalistic conditions. The hierarchy was determined from four different behaviors (flee, fly-out, avoid, wait) by the encounter of ho adult bats on the feeding site. The aggressive action (flee after fighting) was relatively low (16%) compare to the other three observed behaviors. The hierarchy of the females reflected sometimes in the feeding order The harem male dominated the non-harem males and exhibited his territorial behavior. However, to his sex partners he didn't show aggressions.

  • PDF

Ortholog 데이터베이스를 이용한 생물 경로 재구축 시스템 (Pathway Reconstruction System using Orthlogs Database)

  • 정태성;오정수;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.280-282
    • /
    • 2005
  • 현재 국내외 적으로 많은 대사경로 재구축을 위한 소프트웨어들이 개발 보급되고 있다. 그러나 기존의 소프트웨어들은 유전자 서열의 주해 작업이 끝난 게놈에 대해서만 가능하다. 따라서 대사경로를 예측하고자 할 경우는 주해 작업이 선행되어야 하는 어려움이 있었다. 본 논문에서는 주해 작업이 완료되지 않은 유전자 서열로부터 유전자의 기능 예측뿐만 아니라 대사경로를 예측할 수 있는 시스템을 제안한다. 제안된 시스템은 Orthologous 데이터베이스를 활용하여 새롭게 밝혀진 유전자 서열을 대상으로 비교적 정확성이 높은 대사경로를 예측하는 기능을 제공한다. 이 방법을 통해 주해 작업이 완료되지 않은 유전자 서열을 이용하여 서열 내에 포함된 유전자의 기능을 예측할 뿐만 아니라 예측된 유전자 정보를 이용하여 대사 경로를 예측할 수 있다.

  • PDF

As계의 오이 모자이크 바이러스 RNA4의 염기서열 결정 (Determination of Nucleotide Sequences of cDNA from Cucumber Mosaic Virus-As RNA4)

  • 김상현;박원목;이세영;박영인
    • 한국식물병리학회지
    • /
    • 제12권2호
    • /
    • pp.176-181
    • /
    • 1996
  • Aster yomena로부터 분리한 오이 모자이크 바이러스(cucumber mosaic virus) (CMV-As)의 RNA4로부터 완전한 길이의 cDNA를 합성하고 그 전체적인 염기서열(1,043 nt`s)을 결정하였다. CMV-As RNA4는 73개의 염기로 구성된 5`말단의 leader 부위, 657개의 염기로 구성된 외피단백질(coat protein) 유전자 부위 및 312개의 염기로 구성된 3` 말단의 비번역 부위로 구성되어 있음을 확인하였다. 외피단백질 유전자 부위의 염기서열을 다른 계통의 CMV와 비교해 볼 때 그 염기서열이 보전적으로 존재하고 있으나 그 외의 부분은 다양함을 확인하였다. 특히 3` 말단부위의 61개의 염기로 구성된 부위(959-1019)는 다른 계통의 CMV에서는 상당히 유사하지만 CMV-As도 다른 CMV처럼 tRNA와 유사한 구조를 역시 형성함을 확인하였다. CMV-As의 RNA4 염기서열을 다른 계통의 CMV와 비교할 때 CMV-I17F와 가장 유사하였으며(91.9%) S형의 CMV-M과는 가장 낮은 동일성을 보였다(71.1%). 외와 같은 염기성열의 비교 결과와 EcoRI 제한효소 인식부위의 존재로 미루어 CMV-As는 WT형으로 분류된다.

  • PDF