• 제목/요약/키워드: 서열

검색결과 3,677건 처리시간 0.031초

5'-UTR 영역의 그룹특이적 염기서열에 의한 HGV의 계통분석 (Phylogenetic ANalysis of Hepatitis G Virus by Group-Specific Sequences in the 5-Untranslated Region)

  • 김부경;박성우;김종경;백형석;장경립
    • 생명과학회지
    • /
    • 제8권3호
    • /
    • pp.279-284
    • /
    • 1998
  • 한국인 환자의 혈청에서 분리한 HGV 5'-UTR영역의 염기서열을 결정하였다. 이들 염기서열을 이미 보고된 서열들과 비교한 결과, 한국 분리주들은 일본 분리주들과 더 높은 상동성을 나타내어 지리적 격리에 의해 HGV의 염기서열의 변이가 축적되었음을 알 수 있다. 흥미롭게도 동일 지역에서 분리된 HGV 분리주들 간에는 고도로 보존되어 있어 HGV의 분류에 이용가능한 세 개의 영역이 5'-UTR에서 발견되었다. 이들 그룹-특이적 영역에 기초하여, 24 HGV 분리주들을 5개의 그룹으로 분류할 수 있었다.

  • PDF

Hitting Set 문제를 이용한 Next Generation Sequencing Read의 효율적인 처리 (Efficient Processing of Next Generation Sequencing Reads Using Hitting Set Problem)

  • 박태원;김소라;최석문;조환규;이도훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.466-469
    • /
    • 2011
  • 최근에 등장한 Next Generation Sequencing(NGS)은 전통적인 방법에 비해 빠르고 저비용으로 대용량의 시퀀스 데이터를 이용한 차세대 시퀀싱 기술을 말한다. 이렇게 얻은 NGS 데이터를 분석하는 단계 중에서 alignment 단계는 시퀀서에서 얻은 대량의 read를 참조 염기서열에 맵핑하는 단계로 NGS 데이터 분석의 가장 기본이면서 핵심인 단계이다. alignment 도구는 긴 참조 염기서열을 색인화해서 짧은 read를 빠르게 맵핑하는 용도로 사용된다. 현재 많이 사용되고 있는 일반적인 alignment 도구들은 입력데이터에 대한 별도의 전처리 과정이 없으며 나열된 read를 순차적으로 맵핑하는 단순한 구조를 가지고 있다. 본 논문은 NGS 데이터의 특징 중에 특히 read간의 중복성이 존재하고 이를 이용한 read의 효율적 공통부분 서열을 찾는다. 중복이 가능한 read의 공통부분서열과 read의 관계를 그래프 이론의 Hitting Set 문제로 모델링하고 여러 read가 포함하는 공통 부분서열을 사용해서 alignment 단계의 효율을 높일 수 방법을 제안한다.

그리드 컴퓨팅을 이용한 BLAST 성능개선 및 유전체 서열분석 시스템 구현 (Performance Improvement of BLAST using Grid Computing and Implementation of Genome Sequence Analysis System)

  • 김동욱;최한석
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.81-87
    • /
    • 2010
  • 본 논문에서는 현재 생물정보학 연구에서 가장 많이 사용하고 있는 BLAST의 문제점을 분석하고 이에 따른 해결책을 제시하기 위하여 그리드 컴퓨팅을 이용한 G-BLAST(Grid Computing을 이용한 Basic Local Alignment Search Tool)를 제안한다. 본 연구에서 제안하고 있는 G-BLAST을 이용한 시스템은 이기종 분산 환경에서 수행이 가능한 서열분석 통합 소프트웨어 패키지이며 기존 서열분석 서비스의 취약점인 검색 성능을 개선하여 BLAST 검색 기능을 강화 하였다. 또한, BLAST 결과를 사용자가 관리 및 분석이 용이하도록 데이터베이스 및 유전체 서열분석 서비스 시스템을 구현하였다. 본 논문에서는 G-BLAST시스템의 성능확인을 위하여 병렬컴퓨팅 성능테스트 기법을 도입하여 구현된 시스템을 기존 BLAST와 속도 및 효율부분에서 비교하여 성능개선을 확인하였으며 서열결과 분석에 필요한 자료를 사용자관점에서 제공해주고 있다.

용균성 야생 점액세균의 분리 (Isolation and Characterization of Bacteriolytic Wild Myxobacteria)

  • 박수연;이봉수;김지훈;이차율;장은혜;조경연
    • 한국미생물·생명공학회지
    • /
    • 제32권3호
    • /
    • pp.218-223
    • /
    • 2004
  • 용균성 야생 점액세균 204균주를 국내 토양으로부터 순수분리하였고, 분리균주의 16S rRNA 부분 염기서열을 결정하였다. Ribosomal Database Project(RDP) II를 이용하여 분리균주 각각의 16S rRNA 염기서열을 분석한 결과 전체 분리균주의 65%를 차지하는 132 균주들이 Myxococcus 속에 속할 것으로 예상되었으며, 29%를 차지하는 59 균주들이 Corallococcus 속, 4 균주가 Archangium 속, 그리고 4 균주가 Stigmatella 속에 속할 것으로 분석되었다. 그리고 나머지 5 균주는 알려진 균주와의 유연관계가 멀어 분류가 확실하지 않았다. 한편, 16S rRNA염기서열의 비교분석은 분리균주의 50%가 16S rRNA부분 염기서열상에 적어도 한 염기 이상의 차이를 지니고 있음을 보여주었다. 하지만 동일한 염기서열을 지니는 것으로 분석된 균주에서도 서로 다른 집락모서리를 형성하는 등 다른 균주로 판명되는 것으로 보아 전체 분리균주는 다양성이 81% 이상인 다양한 균주들인 것으로 사료되었다.

Bradyrhizobium sp. SNU001의 nodD와 nodA의 염기서열 (Nucleotide Sequences of nodD and nodA from Bradyrhizobium sp. SNU001)

  • 나영순;심웅섭;안정선
    • 미생물학회지
    • /
    • 제31권3호
    • /
    • pp.189-196
    • /
    • 1993
  • 대두(Glycine max) 뿌리혹의 질소고정 공생균주 Bradyhizobium sp. SNU001 의 nod D 와 nodA 의 염기서열을 결정하였다. 총 314개의 아미노산을 암호화하는 nod D 의 open reading frame (ORF) 은 942bp 로 B. japonicum USDA110 의 nodD1 과 99.4% 의 유사성을 보여주었으며, 총 210개의 아미노산을 암호화하고 콩과식물의 Bradyrhizobium 에서는 처음으로 염기서열이 결정된 nodA 의 ORF 는 630bp 로 B. sp. (Parasponia) 의 nodA 와 81.5% 의 유사성을 보여주었다. nodYAB 오페론과 nodD 상류에서는 9bp의 반복서열을 각각 4번, 2번 가지는 보존적인 nodbox 가 발견되었으며 nodD 의 상류에서는 A, T-rich 서열도 존재하였다.

  • PDF

녹섹(NOGSEC): A NOnparametric method for Genome SEquence Clustering (NOGSEC: A NOnparametric method for Genome SEquence Clustering)

  • 이영복;김판규;조환규
    • 미생물학회지
    • /
    • 제39권2호
    • /
    • pp.67-75
    • /
    • 2003
  • 비교유전체학의 주요 주제 중 유전자서열을 분류하고 단백질기능을 예측하는 연구가 있으며, 이를 위해 단백질 구조, 공통서열 및 바인딩 위치 예측등의 방법과 함께, 전유전체 서열에서 구해지는 유사도 그래프를 분석해 상동유전자를 검색하는 계산학적인 접근방법이 있다. 유사도그래프를 사용한 방법은 서열에 대한 기존 지식에 의존하지 않는 장점이 있지만 유사도 하한값과 같은 주관적인 임계값이 필요한 단점이 있다. 본 논문에서는 반복적으로 그래프를 분해하는 이전의 방법을 일반화시켜, 유사도 그래프에 기반한 유전자 서열군집분석 방법론과 객관적이고 안정적인 파라미터 임계값 계산 방법을 제안한다. 제시된 방법으로 알려진 미생물 유전체 서 열을 분석하여 이전의 방법인 BAG 알고리즘 결과와 비교했다.

N과 X를 포함하는 DNA 서열을 위한 효율적인 지역정렬 알고리즘 (An Efficient Local Alignment Algorithm for DNA Sequences including N and X)

  • 김진욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권3호
    • /
    • pp.275-280
    • /
    • 2010
  • 지역정렬(local alignment) 알고리즘은 주어진 두 서열에서 서로 유사한 부분 문자열을 찾아내는 알고리즘이다. DNA 서열은 A, C, G, T 외에 N과 X도 가질 수 있는데, N과 X는 DNA로부터 염기배열 정보를 뽑아낼 때 실험적인 이유로 혹은 다른 이유로 일부 배열 정보를 잃어버린 경우에 사용된다. 본 논문에서는 A, C, G, T 이외에 N과 X를 모두 갖는 DNA 서열의 affine gap penalty metric에 대한 지역정렬을 찾는 효율적인 알고리즘을 제시한다. 이는 N만 처리할 수 있는 Kim-Park 알고리즘을 N과 X를 모두 처리할 수 있도록 성공적으로 확장한 결과이며, 더불어 새로운 문자가 추가되더라도 바로 적용이 가능한 일반화된 결과이다.

유전체 상호간의 BLAST 최대 히트(best-hit)를 사용하여 서열화가 완성된 다수의 유전체로부터 Orthologous 단백질그룹을 자동적으로 클러스터링하는 기법 (Automatic Orthologous-Protein-Clustering from Multiple Complete-Genomes by the Best Reciprocal BLAST Hits)

  • 김선신;이충세;류근호
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.207-214
    • /
    • 2006
  • 서열화가 완성된 유전체의 수가 최근에 빠르게 상승하고 있지만, 상동성에 의한 단백질 기능을 예측하는 방법은 충분히 연구되고 있지 않다. 서열화가 완성된 다수의 유전체로부터 유전체 상호간의 BLAST 최대 히트(best-hit)를 사용하여 OPCs(Orthologous Protein Clusters)를 만드는 일은 성공적으로 연구되어 왔다. 그러나 OPCs를 수작업으로 구축하는 것은 시간과 노력이 많이 드는 일이다. 이 논문에서 우리는 서열화가 완성된 다수의 유전체로부터 OPs(Orthologous Proteins)를 클러스터링하는 자동화 방법을 제시하고, 해당 클러스터링의 타당성을 수학적으로 증명 한다.

맞춤의학 시대의 개인 유전체 서열의 해독과 스마트한 이용 (Individual Genome Sequences and Their Smart Application In Personalized Medicine)

  • 김동민;정해영;김일철;원용관
    • 스마트미디어저널
    • /
    • 제2권4호
    • /
    • pp.34-40
    • /
    • 2013
  • 다양하고 빠른 차세대 유전체 서열 분석기를 사용한 개인 유전체 분석은 생명과학 연구뿐만 아니라 질병의 진단과 치료를 포함하는 의학 분야까지 새로운 지평을 열고 있다. 저렴한 비용으로 읽혀진 개인 유전체 서열은 통합 과정을 거쳐 유전체 이상을 점검할 수 있고, 얻어진 서열 데이터는 유전자 변이성 연구, 유전체 발현 연구, 후성유전학적 연구, 유전체 주석화 등에 이용될 수 있다. 개인 유전체 데이터는 생물학적 연구 결과와 임상 연구 데이터를 연계하여 질환 위험도의 예측과 맞춤 치료에 이용할 수 있게 되었다. 개인 맞춤의학 시대에 전문적 데이터와 일반인 사용자의 간극을 메우기 위해 스마트 미디어 기기와 같은 적극적인 인터페이스의 개발이 시급하다.

  • PDF

Streptomyces somaliensis가 생산하는 세포외 Phospholipase D의 유전자 서열 분석과 Transphosphatidylation 활성 특성 (Nucleotide Sequence of an Extracellular Phospholipase D Gene from Streptomyces somaliensis and Transphosphatidylation Activity of Its Enzyme)

  • 정수진;이선희;엄태붕
    • 미생물학회지
    • /
    • 제40권3호
    • /
    • pp.211-216
    • /
    • 2004
  • 세포외 phospholipase D (PLD)를 과량 생산하는 균주 JE-11을 토양으로부터 분리하였다. 16S rDNA에 의한 분석과 형태적, 생리적 특성을 조사한 결과 이 균은 Streptomyces somaliensis로 동정되었다. 선발한 S. somaliensis로 부터 PLD를 암호화하는 유전자(sspld) 분리하고 염기서열을 조사하였다. Open reading frame을 분석한 결과 33개의 아미노산으로 이루어진 분비 signal peptide와 505개의 아미노산으로 구성된 PLD단백질을 암호화하는 것으로 예상되었다. 또한, sspld의 염기 서열로부터 유추된 단백질 서열은 기존에 보고된 다른 Streptomyces PLD들과 70-88%의 서열 유사성을 보였다. 이 PLD는 96-98%(㏖/㏖)의 수율로서, Phosphatidylcholine을 glycerol과 serine을 기질로 하여 각각 phosphatidylglycerol 과phosphatidylserine으로 전환을 하였으나, 알코올 공여체인 inositol과 ethanolamine과는 반응하지 않았다.