• 제목/요약/키워드: 유전체정보

검색결과 508건 처리시간 0.028초

베이지안 회귀를 이용한 국내 홀스타인 젖소의 유량형질 관련 DGAT1유전자 효과 검증 (Validation of diacylglycerol O-acyltransferase1 gene effect on milk yield using Bayesian regression)

  • 조광현;조충일;박경도;이준호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1249-1258
    • /
    • 2015
  • 젖소의 유생산 형질에 가장 큰 영향을 미치는 유전자들 중 하나로 알려진 DGAT1 유전자의 효과를 국내 젖소 종축의 고밀도 유전체 정보를 이용하여 검증하기 위하여 본 연구를 수행하였다. 국내 젖소 씨수소로 구성된 353두의 고밀도 유전체 정보, 혈통, 추정 육종가 및 신뢰도 정보를 수집하였으며, 단일염기다형성 효과를 추정하기 위한 종속변량으로 가장 정확한 유전체 육종가를 예측할 수 있는 DeRegressed EBV를 산출하여 분석에 이용하였다. BovineSNP50 v2 패널을 이용하여 구명한 고밀도 유전자형 정보 중 유효성검증 과정을 통하여 41,051개 SNP을 선정하였으며, 각 단일 염기다형성의 실제적 유전체 육종가 기여도를 확인하기 위하여 유전체 선발방법 중 하나인 베이즈B (pi=0.99) 방법을 이용하여 SNP 효과를 추정하였다. 1메가 베이스페어의 구간으로 구성된 유전체 전장의 2,516개 윈도우 별 유전분산 설명력을 계산한 결과 상위 1, 3 윈도우가 DGAT1유전자 주변에서 발견되었으며, 이 두 윈도우의 유전분산 설명력은 각각 0.51% 및 0.48%인 것으로 나타났다. DGAT1유전자는 유전체 선발에 상업적으로 이용되는 50k SNP chip에 포함되어있지 않기 때문에 직접적인 유전자의 효과가 명확하게 드러나지는 않지만 DGAT1 유전자에 인접한 단일염기다형성들간의 연관불평형에 의하여 주변 윈도우에서 가장 높은 유전분산 설명력을 보이는 것으로 사료된다.

유전체 관계행렬 구성에 따른 Landrace 순종돈의 육종가 비교 (Comparison of Breeding Value by Establishment of Genomic Relationship Matrix in Pure Landrace Population)

  • 이준호;조광현;조충일;박경도;이득환
    • Journal of Animal Science and Technology
    • /
    • 제55권3호
    • /
    • pp.165-171
    • /
    • 2013
  • 돼지 유전체 전장의 고밀도 단일염기다형 유전자형을 이용하여 혈연관계행렬을 구성하고 이를 이용하여 유전체 육종가를 추정하였다. 이상치를 제거한 랜드레이스 순종돈 448두의 40,706개 단일염기다형 유전자형 정보를 이용하였으며, G05, GMF, GOF, $GOF^*$ 및 GN의 5가지 방법을 이용하여 유전체 관계행렬을 구성하고 이를 이용하여 유전체 육종가를 추정하였다. GOF 방법에 의하여 계산된 혈연계수가 기존의 혈통정보를 이용한 혈연계수와 가장 작은 편차를 나타내고 평균소수대립유전자빈도를 이용하는 GMF 방법에서는 큰 차이가 나타나 대립유전자빈도 기준이 혈연계수의 평균이동을 유발함을 확인하였으며, $GOF^*$를 제외한 모든 방법에서 정규 분포형태의 멘델리안샘플링이 나타나는 것을 확인하였다. 등지방두께 평균과 90 kg 도달일령에 대한 육종가 추정 모형을 설정하고 유전체 관계행렬을 이용하여 유전모수와 육종가를 추정한 결과 혈통정보를 이용한 육종가와의 상관은 GOF 방법에서 가장 높게 나타났으며, 유전체 관계행렬의 척도(scale)에 베타함수를 이용한 $GOF^*$의 경우 모든 형질에서 유전분산이 크게 추정되어 분모부분을 구성하는 척도는 유전모수 추정치 영향하는 것을 확인하였다. 동일한 표현형 정보량을 이용할 경우 유전체관계행렬을 이용한 육종가 추정의 정확도가 혈통정보를 이용한 육종가보다 높게 나타났으며, 90 kg 도달일령보다는 등지방두께 평균에서 그 차이가 더 크게 나타났다. 집단 내 누적 표현형자료가 부족한 경우, 외래 유전자원이 도입되어 집단 내 혈연관계가 부족할 경우 또는 멘델리안 분포가 전혀 고려되지 않는 어린 동복자손의 육종가를 예측해야 하는 경우에 유전체 정보를 활용하면 유전능력 평가의 정확성을 크게 향상시킬 수 있을 것으로 사료된다.

시퀀스 유사도에 기반한 유전체 데이터베이스 압축 및 영향 분석 (The Analysis of Genome Database Compaction based on Sequence Similarity)

  • 권선영;이병한;박승현;조정희;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.250-255
    • /
    • 2017
  • 유전체 데이터의 급증 및 정밀의료 등 응용 분야 확대에 따라 유전체 데이터베이스의 효율적 관리에 대한 중요성이 커지고 있다. 전통적인 압축 기법을 통해 유전체 데이터를 압축할 경우, 압축효과는 크지만, 압축된 상태에서 데이터베이스를 비교하거나 검색하는 등의 작업이 용이하지 않게 된다. 유전체 데이터 분석에 소요되는 시간은 데이터베이스에 존재하는 시퀀스 수에 비례하며, 중복되거나 유사한 시퀀스가 다수 존재한다는 점에 착안하여, 본 논문에서는 유전체 데이터베이스 상에 존재하는 유사 시퀀스를 제거함으로써 전체 데이터베이스 크기를 줄이는 기법을 제안한다. 실험을 통해 시퀀스 유사도 1% 기준으로도 전체의 약 84% 시퀀스가 제거되며, 약 10배 빠른 분류분석이 가능함을 보인다. 또한 큰 폭의 압축효과에도 불구하고, 범주 다양성 및 분류 분석 등에 미치는 변화가 미미함을 확인함으로써, 시퀀스 유사도 기반의 제안 압축 기법이 유전체 데이터베이스 압축에 효과적인 방법임을 제시한다.

한국산 꿀풀과 15 분류군에 대한 유전체양 조사 (Genome size of 15 Lamiaceae taxa in Korea)

  • 이윤경;김상태
    • 식물분류학회지
    • /
    • 제47권2호
    • /
    • pp.161-169
    • /
    • 2017
  • 한 생물체의 전체 유전체 크기는 계통학, 육종학, 집단유전학, 진화학과 같은 많은 분야에 활용될 수 있는 기본적인 정보이다. 최근에는 전체 유전체 결정 연구에서 특히 강조되고 있는데, 이는 최소 유전체 크기를 갖는 분류군의 선택은 유전체 결정사업의 효율성과 직접적으로 연관되어 있기 때문이다. 그러므로 유전체 연구의 선행 단계로서 연구 대상 종 및 연관된 분류군들의 유전체 양의 파악은 필수적이다. 본 연구에서는 쉽고 빠르면서도 신뢰성 있는 방법으로 알려져 있는 flow cytometry를 이용하여 한반도에 자생하는 꿀풀과의 9속 15 분류군에 대한 유전체 크기를 측정하였다. 본 연구에서 유전체 양이 측정된 15 분류군들은 모두 최초로 그 유전체 양이 조사된 분류군들로서 Plant DNA C-value Database (http://data.kew.org/cvalues/)에 수록된 바 없는데, 특히 Agastache, Clinopodium, Elsholtzia, Isodon에 속하는 분류군들은 속 수준에서의 최초의 보고이다. 골무꽃(Scutellaria indica L.)은 0.37 pg (1C)의 유전체 크기를 갖는 것으로 측정되었는데, 이는 현재까지 보고된 꿀풀과 98 분류군의 유전체 양들 중 네 번째로 유전체의 크기가 작은 분류군이다. 이에 골무꽃은 향후 유전체 연구를 위해 꿀풀과를 대표할 한국 자생종으로서 우선적으로 선택하여 분석할 수 있는 종일 것이다. 조사된 분류군들 중 가장 유전체 크기가 큰 분류군은 속단(Phlomis umbrosa Turcz.; 1C=2.6 pg)으로서 이는 다배체 형성에 의한 본 종의 기원 가능성을 제시하고 있다.

전 유전체 단계적 가시화를 위한 새로운 컴포넌트 소프트웨어 (A New Component Software for Hierarchical Visualization for Whole Genomes)

  • 정우근;조치영;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.988-991
    • /
    • 2009
  • 게놈 데이터의 지속적인 증가로 인해 생물정보학에서 유전체 정보를 체계적으로 저장하고 열람하는 효과적이고 효율적인 시스템을 확립하는 것은 중요한 일이다. 잘 알려진 게놈 정보의 계층적 구조처럼 우리는 게놈의 내부 구조를 연구하기 위한 우수한 툴도 필요하다. 게놈 연구에 있어서 한 가지 문제는 유전체 정보는 너무 거대해서 표준적인 정보 처리를 이용하는 간단한 툴로는 작업하기 어려운 점이다. 예를 들어 특정 게놈 데이터 크기는 100메가 바이트를 넘는다. 추가적으로 유전자, promoters, retro-elements(HERV), operons, exon-introns와 같은 많은 게놈 요소들이 있다. 전통적으로 생물학자 들은 게놈 연구를 위해 툴을 아무거나 사용하지 않고, 보통 그들의 연구에 좋은 툴을 채택하려 노력했다. 게놈 연구에서 기본적이고 주시할만한 단계는 다른 종과 유전체 요소를 비교하기 위해 위치를 인식할 수 있도록 하나의 화면에 모든 게놈 데이터를 시각화하는 것이다. 생물학자에게 툴의 개발은 많은 시간이 걸리고 시행착오를 겪기 쉬운 일이다. 이 논문에서 우리는 전체 게놈 중 어떤 게놈 요소를 시각화하는 컴포넌트 웨어의 셋을 제안한다. 그리하여 실험을 목적으로 생물학자를 만나서 우리의 셋을 이용하여 컴포넌트를 조합하여 소프트웨어를 만드는 것은 비교적 간단한 작업이다. 이 실험에서 우리는 HERV와 연동되는 게놈 요소를 보여주는 툴을 어떻게 우리의 컴포넌트 웨어를 간단히 조합하여 구축하는지를 보여주겠다.

한국인 유전체 역학 정보의 효율적 관리를 위한 정보 관리 시스템 (An System for Efficient Management of Genomic Epidemiological Cohort Study Information from Koreans)

  • 양은주;안윤진;이지은;김규찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.635-637
    • /
    • 2003
  • 본 논문에서는 경기도 안성과 안산 지역에 설치된 유전체역학센터에서 조사 지역에 거주하는 45세 이상 69세 이하의 성인을 대상으로 고혈압, 당뇨, 골다공증, 천식, 비만 등 총국민의료비용에서 큰 부분을 차지하는 4-5개의 중요 만성질환을 주요 분석 분야로 진행중에 있는 한국인 유전체 역학조사사업으로부터 산출되는 임상검사 및 역학정보를 입력.관리하는 시스템에 대해 소개하고 있다. 검진 대상자를 접수하는 접수자 및 정보 관리자는 본 시스템을 통해 검진 대상자의 개인식별 정보, 생활습관 정보 등과 같은 설문 정보와 임상 검사 정보를 입력 후 이에 대한 조회, 관리, 집계 현황 출력, 데이터 백업 등을 수행할 수 있다.

  • PDF

유전체 상호간의 BLAST 최대 히트(best-hit)를 사용하여 서열화가 완성된 다수의 유전체로부터 Orthologous 단백질그룹을 자동적으로 클러스터링하는 기법 (Automatic Orthologous-Protein-Clustering from Multiple Complete-Genomes by the Best Reciprocal BLAST Hits)

  • 김선신;이충세;류근호
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.207-214
    • /
    • 2006
  • 서열화가 완성된 유전체의 수가 최근에 빠르게 상승하고 있지만, 상동성에 의한 단백질 기능을 예측하는 방법은 충분히 연구되고 있지 않다. 서열화가 완성된 다수의 유전체로부터 유전체 상호간의 BLAST 최대 히트(best-hit)를 사용하여 OPCs(Orthologous Protein Clusters)를 만드는 일은 성공적으로 연구되어 왔다. 그러나 OPCs를 수작업으로 구축하는 것은 시간과 노력이 많이 드는 일이다. 이 논문에서 우리는 서열화가 완성된 다수의 유전체로부터 OPs(Orthologous Proteins)를 클러스터링하는 자동화 방법을 제시하고, 해당 클러스터링의 타당성을 수학적으로 증명 한다.

미생물 유전체 프로젝트 수행을 위한 Base-Calling 오류 감지 프로그램 및 알고리즘 개발 (A Base-Calling Error Detection Program for Use in Microbial Genome Projects)

  • 이대상;박기정
    • 미생물학회지
    • /
    • 제43권4호
    • /
    • pp.317-320
    • /
    • 2007
  • 미생물 유전체 프로젝트를 수행하는 과정에서 발생하는 base-calling 오류를 포함하는 것으로 의심되는 유전자나 염기서열의 리스트를 보여 주는 프로그램을 개발하였다. 이 프로그램의 모듈들은 base-calling 오류로 의심되는 염기들의 후보군을 유전체 프로젝트를 수행하는 주요 단계에서 감지할 수 있도록 하였다. 이들 프로그램들은 초기 단계에서는 Phrap 파일에 존재하는 contig assembly 정보를 이용하여 base-calling 오류를 감지하는 모듈, 중간 단계에서는 상동성 검색 결과물로부터 frame skift 돌연변이의 진위 유무를 분석할 수 있는 모듈, 마지막 단계에서는, 이미 발표된 미생물 유전체와 같은 종으로부터 유래된 균주에 대한 유전체 프로젝트를 수행할 경우, 비교유전체 분석 기법을 활용하여 base-calling 오류 가능성이 높은 서열의 후보군을 추출하여 해당서열의 크로마토그램파일을 유전체 연구자가 볼 수 있는 모듈로 구성되어 있다.

단백질 상호작용 네트워크를 통한 유전체 단위반복변이와 트랜스유전자 발현과의 연관성 분석 (Genome-Wide Association Study between Copy Number Variation and Trans-Gene Expression by Protein-Protein Interaction-Network)

  • 박치현;안재균;윤영미;박상현
    • 정보처리학회논문지D
    • /
    • 제18D권2호
    • /
    • pp.89-100
    • /
    • 2011
  • 인간 유전체에 존재하는 유전적 구조 변이(genetic structural variation) 중 하나인 유전체 단위반복변이(Copy Number Variation, CNV)은 유전자의 기능 발현과 밀접한 관련이 있다. 특히 특정 유전 질병이 있는 사람들을 대상으로 CNV와 유전자발현의 관계를 밝히는 연구가 계속 진행되고 있지만, 정상인 유전체에 대한 CNV의 기능적 분석은 아직 활발히 이루어지고 있지 않다. 본 논문에서는 다수의 정상인 샘플에서 찾아낸 공통된 CNV에 대하여 유전자들과의 기능적 관계를 유전자의 분자적 위치와 상관없이 밝힐 수 있는 분석 방법을 제시한다. 이를 위해 서로 다른 이질적인 생물학데이터를 통합하는 방법을 제시하고 공통된 CNV와 유전자와의 연관성을 분자적 위치와 상관없이 계산할 수 있는 새로운 방법을 제시한다. 제안된 방법의 유의성을 보이기 위해서 유전자 온톨로지 (Gene Ontology) 데이터베이스를 이용한 다양한 검증 실험들을 수행하였다. 실험결과 새롭게 제안된 연관성 측정방법은 유의성이 있으며 공통된 CNV와 강한 연관성을 갖는 유전적 기능의 후보들을 시스템적으로 제시할 수 있는 것으로 나타났다.

Duration HMM을 이용한 진핵생물 유전자 구조 예측 (Eukaryotic Gene Structure Prediction Using Duration HMM)

  • Tae, Hong-Seok;Park, Kie-Jung
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.200-209
    • /
    • 2003
  • 주어진 염기서열에서 유전자 영역을 예측하는 유전자 구조 예측은 유전체 프로젝트의 중요한 과정 중 하나이며 유전체 프로젝트 전체에 큰 영향을 준다. 진핵생물의 유전체가 원핵생물의 유전체에 비해 더 복잡한 구조를 가지기 때문에 진핵생물의 유전자 구조 예측 모델 역시원핵생물에 비해 다양한 모델이 제안되었다. 본 연구팀은 duration hidden markov model을 기본형태로 하여 EGSP(Eukaryotic Gene Structure Prediction)프로그램을 개발하였다. 현재 개발된 진핵생물의 유전자 구조 예측 알고리즘 중에서 GenScan이 가장 정교한 젓으로 보고 되고 있는데, EGSP의 결과분석을 위해 Genscan과 함께 GeneID, Morgan의 예측결과를 여러 가지 기준에서 비교하였다. EGSP는 정교한 예측모델을 가지고 있음에도 각 구성모듈에 대한 파라메터의 정교함에서 부족한 면이 나타나므로, 모델의 개선과 각 모듈의 조율을 통해 더욱 개선된 결과를 가지게 될 것이다.

  • PDF