• 제목/요약/키워드: 전체 유전체

검색결과 306건 처리시간 0.033초

시퀀스 유사도에 기반한 유전체 데이터베이스 압축 및 영향 분석 (The Analysis of Genome Database Compaction based on Sequence Similarity)

  • 권선영;이병한;박승현;조정희;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.250-255
    • /
    • 2017
  • 유전체 데이터의 급증 및 정밀의료 등 응용 분야 확대에 따라 유전체 데이터베이스의 효율적 관리에 대한 중요성이 커지고 있다. 전통적인 압축 기법을 통해 유전체 데이터를 압축할 경우, 압축효과는 크지만, 압축된 상태에서 데이터베이스를 비교하거나 검색하는 등의 작업이 용이하지 않게 된다. 유전체 데이터 분석에 소요되는 시간은 데이터베이스에 존재하는 시퀀스 수에 비례하며, 중복되거나 유사한 시퀀스가 다수 존재한다는 점에 착안하여, 본 논문에서는 유전체 데이터베이스 상에 존재하는 유사 시퀀스를 제거함으로써 전체 데이터베이스 크기를 줄이는 기법을 제안한다. 실험을 통해 시퀀스 유사도 1% 기준으로도 전체의 약 84% 시퀀스가 제거되며, 약 10배 빠른 분류분석이 가능함을 보인다. 또한 큰 폭의 압축효과에도 불구하고, 범주 다양성 및 분류 분석 등에 미치는 변화가 미미함을 확인함으로써, 시퀀스 유사도 기반의 제안 압축 기법이 유전체 데이터베이스 압축에 효과적인 방법임을 제시한다.

전유전체(Whole gerlome) 서열 분석과 가시화를 위한 워크벤치 개발 (Development of Workbench for Analysis and Visualization of Whole Genome Sequence)

  • 최정현;진희정;김철민;장철훈;조환규
    • 정보처리학회논문지A
    • /
    • 제9A권3호
    • /
    • pp.387-398
    • /
    • 2002
  • 최근 활발한 소단위 게놈 프로젝트의 수행으로 많은 생물체의 유전체 전체 서열이 밝혀짐에 따라서 전유전체(whole genome)를 기본 단위로 하여 개별 유전자나 그에 관련된 기능 연구가 매우 활발히 이루어지고 있다. 전유전체의 염기 서열은 수백만 bp(base pairs)에서 수백억 bp(base pairs) 정도의 대용량 텍스트 데이터이기 때문에 단순한 온라인 문자 일치(on-line string matching) 알고리즘으로 분석하는 것은 매우 비효율적이다. 본 논문에서는 대용량의 유전체 서열을 분석하는데 적합한 자료 구조인 스트링 B-트리를 사용하여 유전체 서열의 분석과 가시화를 위한 워크벤치를 개발한 과정을 소개한다. 본 연구에서 개발한 시스템은 크게 질의문 부분과 가시화 부분으로 나뉘어 진다. 질의문 부분에는 유전체 서열에 특정 서열이 나타나는 부분의 위치와 횟수를 알아보거나 k번 나타나는 서열을 조사하는 것과 같은 기본적인 패턴 검색 부분과 k-mer 분석을 위한 질의어가 다양하게 준비되어 있다. 가시화 부분은 전유전체 서열과 주석(annotation)을 보여주거나, 유전체 분석을 용이하도록 여러 가시화 방법, CGR(Chaos Game Representation), k-mer graph, RWP(Random Walk Plot) 등으로 생물학자들이 쉽게 전체 구조와 특성 파악할 수 있도록 도와준다. 본 논문이 제안하는 분석 시스템은 생물체의 진화적 관계를 밝히고, 염색체 내에 아직 알려지지 않은 새로운 유전자나 기능이 밝혀지지 않은 junk DNA들의 기능 등을 연구하는데 사용할 수 있다.

서열 정렬 알고리즘의 연구 동향 (A Survey of Sequence Alignment Algorithms)

  • 성종희;김동규
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.571-574
    • /
    • 2003
  • 서열 정렬(sequence alignment)은 새로운 서열의 기능적, 구조적, 진화적 분석을 용이하게 하기 때문에 분자 생물학(molecular biology) 등에서 널리 사용된다. 지금까지 서열 정렬 알고리즘들에 대한 연구는 활발히 진행되어 왔다. 특히, 생물학 데이터양의 기하급수적인 증가와 전체 유전체 서열의 분석이 이루어진 종(species)들이 증가하면서, 보다 빠르고 정확하게 서열 정력을 수행하는 알고리즘이 필요하게 되었다. 본 논문에서는 동적 프로그래밍 방식에서부터 전체 유전체 서열 알고리즘에 이르기까지 서열 정렬 알고리즘의 연구 동향을 분석하고자 한다.

  • PDF

다염기변이 및 메타유전체 염기서열 생성도구에 관한 연구 (A Study on a tool to generate polymorphic genome and metagenome sequences)

  • 김종현;김우철;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.262-263
    • /
    • 2007
  • 유전체학 (genomics)의 가장 기초적인 기반이 되는 것은 염기서열을 정확하게 결정해 내는 것이다. 많은 진핵생물들 (eukaryotes)은 두개의 상동염색체를 가지며 두개의 염색체의 염기서열에는 차이가 존재한다. 현재의 유전체 염기서열 결정방법으로는 염기변이가 많이 존재할 경우 유전체의 염기서열을 결정하기 어렵다. 특정한 장소에 서식하는 무수히 많은 미생물들의 유전체의 염기서열을 동시에 결정하는 문제도 미생물학에서 중요성을 인정받는 문제이지만, 미생물들간의 염기변이의 정도는 단일개체의 경우보다 복잡하며 염기서열을 효과적으로 결정하기 힘들다. 따라서 염기변이가 많은 생물들과 미생물들 집합의 염기서열을 결정할 수 있는 방법론의 개발이 시급한 실정이다. 본 논문에서는 조립된 다염기변이 유전체및 메타유전체의 염기서열의 정확성을 평가하기 위한 유전체 서열과 시뮬레이션에 기반한 read 들을 생성하는 도구를 개발하는 것을 목표로 한다.

  • PDF

경제동물 유전체학 연구의 최근 연구 동향 (Advances of Genome Research in Livestock Animals)

  • 송기덕;조병욱
    • 생명과학회지
    • /
    • 제18권4호
    • /
    • pp.572-579
    • /
    • 2008
  • 경제 동물의 유전체 연구는 최근에 급속하게 발전하여 초기의 유전체 지도로 부터 유전자의 발견에 필수적인 앙적/질적 형질 유전자를 확인 동정가능한 수준의 지도가 개발되었다. 이러한 발전은 경제동물의 전체 게놈 염기서열 결정과 대량 ESTs의 개발에 의해 가능해졌다. 특히 염시서열 결정은 경제형질과 연관된 대규모의 SNPs 개발에 의한 QTL 연구에 유용한 정보를 제공할 것으로 사료된다. 비교 유전체 연구를 통해 인간 및 설치류 모델동물에서 나온 유전체 정보를 이용하여 경제 동물의 유전체 연구에 있어 중요한 발견을 이루었다. 이러한 노력은 좀더 밀도 높은 QTL지도의 작성을 가능하게 하여 쉽게 측정하기 어려운 경제형질과 연관된 유전자의 확인 및 동정을 가능하게 하고 궁극적으로 산업체에서 이용 가능한 표지인자의 개발을 가능하게 할 것으로 사료된다. 이와 더불어, 경제동물 유전체 연구 성과는 인간의 생리현상의 유전체 측면의 이해를 더욱 증진시킬 것이다.

광대역에서 저반사 손실을 가지는 도파관 유전체 편파기 설계 기법 (A Design Method for Dielectric-slab Waveguide Polarizer With A Low Return Loss over A Wideband Frequencies)

  • 김도균;이석곤;이종대;안병철
    • 한국전자파학회:학술대회논문집
    • /
    • 한국전자파학회 2001년도 종합학술발표회 논문집 Vol.11 No.1
    • /
    • pp.161-164
    • /
    • 2001
  • 본 논문에서는 주어진 주파수대역에서 우수한 원편파 특성을 가지고 광대역에서 저반사 손실을 가지는 이종대역 안테나 피드용 원형도파관 유전체 편파기의 설계기법을 제시하였다. 양호한 편파특성을 위한 유전체판 두께와 원형 도판관 직경의 결정방법을 제시하였다. 또한 이종 대역 안테나 피드용으로 광대역에서 저반사 손실을 가지기 위한 유전체 형상 설계기법을 제시하였다.

  • PDF

BLAST/FASTA를 활용한 미생물 유전체 비교용 도구의 개발 (A Genomics Tool for Microbial Genome Comparison Using BLAST/FASTA)

  • 태홍석;이대상;박완;박기정
    • 미생물학회지
    • /
    • 제38권4호
    • /
    • pp.267-275
    • /
    • 2002
  • 미생물 유전체 프로젝트의 결과인 유전체 서열에 대해, 비교 유전체 분석을 수행할 수 있는 분석 도구인 GComp를 개발하였다. 이 도구는 국부 상동성 계산을 BLAST나 FASTA를 사용하여 수행한 후에 그 결과를 받아들여, 상동성을 보이는 부분을 분석하고 위치 파악 및 연결한 뒤, 두 유전체간의 상동성 정도를 일목요연하게 보여줄 수 있는 테이블과 파일들을 생성한다. 한편. 그 결과를 그래픽으로 표시하고 전체를 살펴볼 수 있는 인터페이스 기능을 구현하였다. 시험 데이터로 기존의 미생물 유전체 서열을 상대로 분석하면서, 유전체 서열의 핵산 및 단백질 수준에서의 비교분석 결과를 통해 두 유전체에 대한 비교 정보를 효과적으로 확인할 수 있었고, 보다 다양한 분석을 위한 도구 개발의 기준을 설정할 수 있었다.

감자 근연야생종 Solanum cardiophyllum의 엽록체 전장유전체 구명 및 이를 이용한 S. cardiophyllum 특이적 분자마커의 개발 (Chloroplast genome sequence and PCR-based markers for S. cardiophyllum)

  • 박태호
    • Journal of Plant Biotechnology
    • /
    • 제50권
    • /
    • pp.45-55
    • /
    • 2023
  • 멕시코 유래의 2배체 감자 근연야생종 Solanum cardiophyllum은 감자역병, 감자바이러스Y, 콜로라도감자잎벌레 등과 같은 병원균 및 해충에 대한 저항성을 가지고 있어 감자의 신품종 육성에 이용되고 있다. 재배종 감자에 이러한 형질을 도입하기 위해서는 전통적인 교잡육종에 의해 이루어질 수 있으나, 재배종 감자와 근연야생종과의 서로 다른 EBN에 따라 제한적이며, S. tuberosum과 S. cardiophyllum 간에도 생리적 불화합성이 존재한다. 따라서, 이러한 생리적 장벽의 극복을 위해 체세포융합에 의한 체세포잡종 계통을 육성하고 이를 감자 신품종 육성에 활용할 수 있는데, 분자 마커는 적절한 체세포잡종 계통 선발에 필요하다. 이에, 본 연구에서는 S. cardiophyllum의 전체 엽록체 유전체 정보를 구명하고 8개의 다른 Solanum 종의 전체 엽록체 유전체 정보와 비교하여 S. cardiophyllum 특이적인 분자마커를 개발하였다. S. cardiophyllum의 전체 엽록체 유전체의 길이는 155,570 bp였으며, 그 구조와 유전자 구성은 다른 Solanum 종들과 매우 유사하였고 가지과에 속해 다른 32개의 종들과의 계통수 분석을 통해 예상했던 바와 같이 다른 Solanum 종과 같은 그룹에 속해 있고 S. bulbocastanum과의 가장 근접한 유연관계를 확인하였다. S. cardiophyllum의 전체 엽록체 유전체와 8개 다른 Solanum 종의 전체 엽록체 유전체의 다중 정렬 결과로 총 13개의 S. cardiophyllum 특이적인 SNP 영역을 확인하였으며, 이 정보를 이용하여 4개의 PCR 기반 분자마커를 개발하였다. 본 연구의 결과는 S. cardiophyllum의 진화적 측면에서의 연구와 S. cardiophyllum를 이용한 감자 신품종 육성을 위한 연구에 기여를 할 수 있을 것이다.