• 제목/요약/키워드: 차세대염기서열분석

검색결과 92건 처리시간 0.027초

Minimac3와 Beagle 프로그램을 이용한 한우 770K chip 데이터에서 차세대 염기서열분석 데이터로의 결측치 대치의 정확도 분석 (Imputation Accuracy from 770K SNP Chips to Next Generation Sequencing Data in a Hanwoo (Korean Native Cattle) Population using Minimac3 and Beagle)

  • 안나래;손주환;박종은;채한화;장길원;임다정
    • 생명과학회지
    • /
    • 제28권11호
    • /
    • pp.1255-1261
    • /
    • 2018
  • DNA 염기서열의 발전과 많은 단일염기서열변이 정보(Single Nucleotide polymorphism, SNP)의 발굴은 유전 분석을 가능하게 만들었다. 단일염기서열변이 정보가 사람의 유전체뿐만 아니라 가축의 유전체에서도 이용할 수 있게 됨에 따라서 SNP 칩 마커를 통해 유전자형의 분석이 가능하게 되었다. 여러 유전자형 대치프로그램 중에서도 Minimac3 소프트웨어는 비교적 정확성이 높고, 계산의 효율성을 위해 분석을 단순화하여 유전자형의 결측치 대치 분석 시간을 단축시킨다. 따라서 본 연구에서는 Minimac3 프로그램을 사용하여 한우 1,226두 770K SNP 칩 데이터와 311두 차세대 염기서열분석 데이터를 이용하여 유전자형 결측치 대치를 실행해 보았다. 그 결과 염색체별 정확도는 약 94~96%의 정확도를 나타냈으며, 개체별 정확도는 약 92~98%의 정확도를 나타냈다. 유전자형의 결측치 대치의 완료 후, R Square ($R^2$) 값이 0.4 이상인 SNP는 총 SNP의 약 91%였다. $R^2$ 값이 0.6 이상인 SNP는 84%였으며, $R^2$ 값이 0.8 이상인 SNP는 70%였다. 대립유전자형빈도 차이를 기준으로 (0, 0.025), (0.025, 0.05), (0.05, 0.1), (0.1, 0.2), (0.2, 0.3), (0.3, 0.4), (0.4, 0.5)의 7구간에 해당하는 $R^2$ 값은 64~88%였다. 결측치 대치의 총 분석 시간은 약 12시간이 걸렸다. 추후의 유전체 데이터 세트의 크기와 복잡성이 증가하는 SNP 칩 연구에서 Minimac3를 사용한 유전체 결측치 대치법은 한우의 판별에 있어서 칩 데이터의 신뢰도를 향상 시킬 수 있을 것으로 본다.

차세대유전체해독 기법을 이용한 소 유전체 해독 연구현황 (Current Status of Cattle Genome Sequencing and Analysis using Next Generation Sequencing)

  • 최정우;채한화;유다영;이경태;조용민;임다정
    • 생명과학회지
    • /
    • 제25권3호
    • /
    • pp.349-356
    • /
    • 2015
  • 최근 차세대염기서열해독법(Next Generation Sequencing, NGS)의 급속한 발전에 힘입어, 다양한 가축 종에 대한 전장유전체 수준의 해독 및 분석 연구수행이 가능하게 되었다. 소의 경우 현재 한우, 칡소, 흑우, 제주흑우 4품종의 재래소가 국제연합식량농업기구 가축다양성 정보시스템에 등록돼 있는 상태이다. 이러한 재래유전자원은 최근 NGS 기술을 이용 전장유전체에 걸친 대용량의 단일염기다형성 정보를 얻는데 성공하였으며, 또한 한국 재래소품종이 유럽기원의 소 품종들과 유전학적으로 차이가 있다는 점이 밝혀졌다. 또한 소 유전체학 분야에서 이 NGS의 응용은 유전체의 구조적 변이 특히 종전 대용량으로 정확한 발굴이 어려웠던 전장유전체에 널리 퍼진 복제수변이의 발굴에 성공적으로 적용되었다. 이러한 일련의 성공에도 불구하고 최근 NGS를 이용한 연구는 내재적인 한계점이 있었는데, 이는 연구 당시 고가의 연구비용 및 분석의 난해함으로 인해 각 대표 소 품종의 단수 또는 소수 개체에 대해서만 적용되었다는 점이 그 대표적 예라 할 수 있을 것이다. 즉, NGS에서 파생된 데이터의 보다 정확한 생물학적 의의를 찾기 위해서는 추가 실험적 검증과 더불어 면밀한 해석이 필요하다는 점을 시사하는 것이다. 최근 차세대염기서열 해독 비용이 지속으로 하락하고 있으며, 이는 단수개체가 아닌 집단수준에서의 NGS 적용이 가능해 짐에 따라 다양한 집단유전체학적 이론이 접목된 연구가 가능해지고 있다. 현재 국내 재래소 품종에 대한 집단수준에서의 연구는 극히 미흡한 상태이나, 이러한 상황은 최근 고밀도 칩, 차세대염기서열 자료와 같은 대용량 유전정보를 생산, 분석 중에 있어 재래가축에 대한 집단수준에서의 연구가 일부 해소될 것으로 기대된다.

ChIP-seq 라이브러리 제작 및 Galaxy 플랫폼을 이용한 NGS 데이터 분석 (ChIP-seq Library Preparation and NGS Data Analysis Using the Galaxy Platform)

  • 강유진;강진;김예운;김애리
    • 생명과학회지
    • /
    • 제31권4호
    • /
    • pp.410-417
    • /
    • 2021
  • NGS (Next-generation sequencing), 즉 차세대염기서열분석은 유전체 수준의 방대한 DNA를 작은 절편으로 만들어서 그 절편들의 염기서열들을 동시에 읽어내는 기법이다. 현재 다양한 생명체의 유전체 염기서열 분석부터 cDNA (complementary DNA)나 ChIPed DNA (chromatin immunoprecipitated DNA)를 분석하는데 이 NGS 기법을 사용하고 있으며, 이 때 얻어진 데이터를 적절히 처리하고 분석하는 일은 생물학적으로 유의미한 결과를 얻기 위하여 중요하다. 하지만 대용량 데이터의 저장 및 활용, 그리고 컴퓨터 프로그래밍 바탕의 데이터 분석은 실험을 수행하는 일반 생물학자들에게 어려운 일이다. Galaxy 플랫폼은 다양한 NGS 데이터 분석 tool을 무료로 제공하는 웹 서비스이며, 생물정보학이나 프로그래밍에 대한 전문지식이 없는 연구자들에게 웹 브라우저만을 이용하여 데이터를 분석할 수 있는 환경을 제공한다. 본 논문에서는 ChIP-seq (chromatin immunoprecipitation-sequencing) 수행을 위한 라이브러리 제작 과정 및 Galaxy 플랫폼을 이용한 ChIP-seq 데이터 분석 과정을 설명하고, K562 세포주에서 수행한 히스톤 H3K4me1 ChIP-seq 결과가 public 데이터와 일치함을 보여준다. 따라서 Galaxy 플랫폼을 활용한 NGS 데이터 분석은 생물정보학에 대한 손쉬운 접근 방법을 제공할 것으로 기대된다.

주요 박과작물의 유전체 및 분자마커 연구 현황 (Genomics and Molecular Markers for Major Cucurbitaceae Crops)

  • 박기림;김나희;박영훈
    • 생명과학회지
    • /
    • 제25권9호
    • /
    • pp.1059-1071
    • /
    • 2015
  • 수박과 멜론은 경제적 중요성을 지니는 대표적인 박과 작물이다. 최근 유전자 지도 작성 및 차세대 유전체 염기서열 분석에 기반한 분자마커 개발과 염기서열변이 탐색은 마커 이용 선발 및 여교잡 등 분자육종을 통한 품종육성에 필수적 기술이다. 본 연구에서는 이들 작물에 대한 국내외 유전체 분석 과 분자마커 개발 현황에 대해 분석ㆍ정리함으로서 향후 분자육종에 활용할 수 있는 정보를 제공하고자 하였다. 수박과 멜론은 참조유전체의 염기서열이 밝혀졌으며 다수의 유전자 지도가 작성되어 수량, 과특성, 내병성과 같은 주요 형질과 연관된 마커의 개발과 관련 유전자의 탐색이 꾸준히 진행되고 있다. 현재까지 해외에서 보고된 유전자지도는 수박 멜론 각 각 16종 이상이며, 40개 이상의 주요형질에 대한 유전자좌와 연관 마커들이 존재한다. 더욱이 고밀도 유전자 지도와 유전자지도 기반 클로닝을 통해 이러한 형질을 조절하는 기능 유전자에 정보가 밝혀지고 있다. 또한 참조게놈정보를 기반으로 한 다양한 유전자원의 전장유전체염기서열 재분석이 꾸준히 이루어지고 있다. 새로운 분자마커의 자체적 개발과 더불어 이와 같이 현재 활용 가능한 공개된 마커들의 정보를 통해 유전체학 이용 육종과정을 크게 앞당길 수 있을 것이다.

고성능 클러스터와 분산 병렬 파일 시스템을 이용한 유전체데이터 전처리 작업의 효율적인 병렬화 기법 (An Efficient Parallelization Mechanism for Preprocessing of Genome Sequence Data on HPC environment)

  • 변은규;문지협;곽재혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.50-53
    • /
    • 2018
  • 차세대 염기서열 분석법이 생성한 유전체 원시 데이터를 기존의 방식대로 하나의 서버에서 분석하기 위해서는 수십 시간이 필요할 수 있고 이러한 시간을 최대한 줄여야 하는 응급 상황도 존재한다. 따라서 본 연구에서는 고속의 네트워크로 연결되고 병렬 파일 시스템을 공유하는 서버 클러스터를 활용하여 분석 시간을 크게 단축 시킬 수 있는 유전체 데이터 분석의 전처리 프로세스의 병렬화 방법을 제안한다. 기존의 검증된 분석도구를 기반으로 프로세스의 병렬화, 데이터의 분배 및 병렬 병합 기법을 개발하였고 실험을 통해 성능을 향상 시킬 수 있음을 증명하였다.

인간 세포 Lineage 의 계층적 표현에 관한 연구 (A Study on the Hierarchical Expression of Human Cell Lineage)

  • 박재순;권성규;오지원;이종혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.663-664
    • /
    • 2020
  • 차세대 염기서열 분석 기술은 성능과 비용 면에서 매우 향상되어 한 개체 내 여러 세포의 유전자 분석이 가능한 수준이다. 한 개체 내 여러 조직 세포의 유전자는 모두 동일하지 않기 때문에 여러 조직 세포의 Lineage 를 계층적으로 표현하고 이를 조직 세포 간 변이 정도를 파악하는 데 활용한다면 암 돌연변이 발생 등을 미리 예측할 수 있다. 본 논문은 한 개체 내 여러 조직 간 변이를 관찰하기 위해 변이 검출 데이터를 계층적 군집 방법을 이용해 분석하고 이를 시각화 하는 방법을 제안한다. 실제의 8 개 조직 세포의 유전자를 분석하고 변이를 검출하여 Dendrogram 그래프로 시각화 하였다.

차세대 염기서열 분석법을 이용한 전통 된장과 청국장의 미생물 분포 분석 (Comparison of Microbial Community Compositions between Doenjang and Cheonggukjang Using Next Generation Sequencing)

  • 하광수;김진원;신수진;정수지;양희종;정도연
    • 생명과학회지
    • /
    • 제31권10호
    • /
    • pp.922-928
    • /
    • 2021
  • 본 연구는 우리나라 전통 장류인 된장과 청국장의 미생물 분포와 시료간의 미생물학적 차이에 대해 차세대 염기서열 분석법(NGS)을 이용하여 분석하였다. α-diversity 분석 결과 된장에서 종 추정치와 풍부도가 통계학적으로 유의한 수준으로 높은 것으로 나타났다. 세균 분포를 분석한 결과 문 수준에서 Firmicutes가 된장에서 97.02%, 청국장에서 99.67%를 차지하여 공통적으로 가장 우점하는 것으로 나타났으며, 속 수준에서는 된장과 청국장에서 Bacillus가 각각 71.70%, 59.87%를 차지하여 가장 우점하는 것으로 확인되었다. 된장과 청국장의 미생물 분포에 차이가 있는지 분석하기 위해 PERMANOVA 분석을 수행한 결과 된장과 청국장의 미생물 분포에 통계학적으로 유의한 수준으로 차이가 나는 것으로 나타났다. 각 된장과 청국장 미생물 군집을 대표하는 biomarker를 분석하기 위해 LEfSe분석을 수행한 결과 된장에서 Bacillus subtilis, Tetragenococcus halophilus, Clostridium arbusti가 상대적으로 많이 분포하였으며, 청국장에서는 Bacillus thermoamylovorans, Enterococcus faecium, Lactobacillus sakei가 상대적으로 많이 분포하는 것으로 나타났다. 본 연구를 통해 콩을 주원료로 하는 우리나라 대표 전통장류인 된장과 청국장의 시료별 유사성과 차이점에 대한 미생물 분포를 정의하고 전통장류의 생화학적, 생리학적 특성과 미생물 분포의 상관관계를 규명하기 위한 기초 연구자료로 활용할 수 있을 것으로 기대된다.

이매패류(Sinonovacula constricta) 먹이원 NGS 분석 적용에 대한 연구 (Application of NGS Analysis for the Food Source of Bivalve)

  • 허유지;조현빈;정은송;김현우
    • 생태와환경
    • /
    • 제54권3호
    • /
    • pp.257-264
    • /
    • 2021
  • 본 연구에서는 가리맛조개(S. constricta)의 토사물을 현미경 검경과 차세대염기서열분석(NGS) 기법으로 먹이원을 확인하고, 이를 통해 형태학적 및 분자학적 방법에 따른 먹이원 분석을 비교하였다. 가리맛조개(S. constricta)의 먹이원은 분석방법에 따라 차이를 보였다. 먹이원생물은 위 내에서 분해되어 현미경 분석을 통한 생활사 확인과 정량적 분석이 가능하였으나 형태학적 및 해부학적 특성 파악이 불완전하였다. NGS 분석은 유기물 형태로 잔존하는 생물의 DNA 확인이 가능하여 현미경 검경 결과와의 상호보완적 적용 가능성을 확인하였다.

RNA-Seq data를 이용한 사과 과육색 판별 SNP 분자표지 개발 (Development of SNP markers for the identification of apple flesh color based on RNA-Seq data)

  • 김세희;박서준;조강희;이한찬;이정우;최인명
    • Journal of Plant Biotechnology
    • /
    • 제44권4호
    • /
    • pp.372-378
    • /
    • 2017
  • 과육색이 다르게 발현되는 사과(Malus domestica L.) 품종의 유전자 발현을 비교하기 위해 2개의 cDNA library를 제작하였다. 붉은 색 과육 품종인 'Redfield'와 백색 과육 품종인 'Granny Smith'의 유전자 발현 차이를 보기 위해 차세대 염기서열 분석(NGS) 기술을 사용하였고 두 품종으로부터 얻은 EST의 염기서열을 결정하고 기존에 보고된 유전자와의 상동성을 분석하였다. HRM 기술은 붉은 색 과육 품종 사과와 백색 과육 품종 사과의 짧은 PCR 증폭산물에서 한 개의 서로 다른 염기서열을 구분하여 분리해낼 수 있다. 'Redfield'와 'Granny Smith'의 EST database로부터 103쌍의 단일염기다형성(SNP) 분자표지를 선발하였고, 붉은 색 과육 품종 10개와 백색 과육 품종 11개를 구분할 수 있는 SNP 분자표지를 HRM 방법으로 분석하였다. 본 연구에서는 사과 EST database를 기반으로 HRM 분석 방법을 이용하여 사과 품종의 적육계와 백육계를 구분할 수 있는 효율적인 SNP 분자표지를 개발하였다. 이러한 SNP 분자표지는 사과육종에 유용하게 사용할 수 있으며 사과 품종의 다양한 색 변화에 관한 분자 기작 연구에 좋은 참고자료가 될 수 있을 것이다.