• 제목/요약/키워드: haplotype assembly

검색결과 6건 처리시간 0.016초

신뢰도를 가진 SNP 단편들과 유전자형으로부터 일배체형 조합 (Haplotype Assembly from Weighted SNP Fragments and Related Genotype Information)

  • 강승호;정인선;최문호;임형석
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권11호
    • /
    • pp.509-516
    • /
    • 2008
  • Minimum Letter Flips(MLF) 모델과 Weighted Minimum Letter Flips(WMLF) 모델은 일배체형 조합문제(haplotype assembly problem)를 해결하기 위한 모델들이다. 그러나 MLF 모델이나 WMLF 모델은 SNP(Single Nucleotide Polymorphism) 단편들에 손실과 오류가 적은 경우에만 효과적이다. 본 논문은 WMLF 모델의 개선을 목적으로 유전자형 정보를 추가한 WMLF/GI 모델과 문제를 제시한다. 새로 제시한 문제가 NP-hard임을 증명하고, 정확성이 높고 효율적인 문제 해결을 위해 유전자 알고리즘을 설계한다. 실험 결과를 통해 새로운 모델이 기존의 모델들에 비해 SNP 단편들에 손실과 오류가 많은 경우에도 높은 정확성을 가짐과 유전자형 정보가 유전자 알고리즘의 수렴속도를 크게 개선함을 보인다.

개선된 분기한정 알고리즘을 이용한 인간 유전체의 일배체형 조합문제 해결 (Solving the Haplotype Assembly Problem for Human Using the Improved Branch and Bound Algorithm)

  • 최문호;강승호;임형석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.697-704
    • /
    • 2013
  • 인간의 한쪽 염색체상에 나타나는 SNP의 서열인 일배체형을 식별해내면 효과적인 유전질병 연관검사를 할 수 있다. 주어진 SNP 단편들로부터 계산적인 방법으로 한 쌍의 일배체형을 조합하기 위해 제시된 모델 중 하나인 최소오류수정 모델은 단편에 손실이 없는 경우조차 NP-hard임이 증명되었다. 기존의 분기한정 알고리즘은 많은 계산시간을 요구함에 따라 실제 응용에 사용하기 어려웠다. 그러나 최근에 개선된 분기한정 알고리즘이 제시되었고, 꿀벌(Apis mellifera)의 유전자형 데이터를 대상으로 성능을 분석해봄으로써 개선된 알고리즘이 기존 분기한정 알고리즘보다 효율적임을 보였다. 본 논문에서는 인간의 유전자형 데이터를 대상으로 개선된 분기한정 알고리즘을 적용해 일배체형 조합문제를 수행한다. 실험을 통한 성능분석 결과, 개선된 분기한정 알고리즘이 인간 유전체에 대해서도 성공적으로 적용됨을 확인함으로써 다양한 생명체의 일배체형 조합문제에 적용 가능함을 보인다.

일배체형 재조합을 위한 MCIH 모델과 WMLF/GI 모델의 정확도 비교 (The Correctness Comparison of MCIH Model and WMLF/GI Model for the Individual Haplotyping Reconstruction)

  • 정인선;강승호;임형석
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.157-161
    • /
    • 2009
  • 일배체형 조합 문제를 해결하기 위해 제시된 MLF(Minimum Letter Flips) 모델이나 WMLF(Weighted Minimum Letter Flips) 모델은 유전자형 정보를 도입함으로써 오류와 손실이 많을 때에도 높은 정확도를 얻을 수 있다. 그리고 MLF 모델에 비해 가중치 버전인 WMLF모델의 정확도가 높다는 사실도 밝혀졌다. 본 논문에서는 유전자형 정보상의 동형(homozygous)의 분포 비율과 유전자 서열판독기계의 성능에 따른 신뢰도의 차이를 매개변수로 하여 두 모델을 구체적으로 비교, 분석한다. 두 모델의 성능 비교를 위해 신경망과 유전자 알고리즘을 사용한다. 실험결과 동형의 비율이 크고 판독기계의 성능이 좋으면 특히 손실율과 오류율이 높은 경우에 WMLF/GI 모델의 정확도가 더 우수함을 보인다.

Birth of an 'Asian cool' reference genome: AK1

  • Kim, Changhoon
    • BMB Reports
    • /
    • 제49권12호
    • /
    • pp.653-654
    • /
    • 2016
  • The human reference genome, maintained by the Genome Reference Consortium, is conceivably the most complete genome assembly ever, since its first construction. It has continually been improved by incorporating corrections made to the previous assemblies, thanks to various technological advances. Many currently-ongoing population sequencing projects have been based on this reference genome, heightening hopes of the development of useful medical applications of genomic information, thanks to the recent maturation of high-throughput sequencing technologies. However, just one reference genome does not fit all the populations across the globe, because of the large diversity in genomic structures and technical limitations inherent to short read sequencing methods. The recent success in de novo construction of the highly contiguous Asian diploid genome AK1, by combining single molecule technologies with routine sequencing data without resorting to traditional clone-by-clone sequencing and physical mapping, reveals the nature of genomic structure variation by detecting thousands of novel structural variations and by finally filling in some of the prior gaps which had persistently remained in the current human reference genome. Now it is expected that the AK1 genome, soon to be paired with more upcoming de novo assembled genomes, will provide a chance to explore what it is really like to use ancestry-specific reference genomes instead of hg19/hg38 for population genomics. This is a major step towards the furthering of genetically-based precision medicine.

Polymorphism of NLRP3 Gene and Association with Susceptibility to Digestive Disorders in Rabbit

  • Yang, Yu;Zhang, Gong-Wei;Chen, Shi-Yi;Peng, Jin;Lai, Song-Jia
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제26권4호
    • /
    • pp.455-462
    • /
    • 2013
  • NLR family pyrin domain containing 3 (NLRP3) is a key component of the inflammasome, whose assembly is a crucial part of the innate immune response. The aim of the present study was to evaluate the association between exon 3 polymorphisms of NLRP3 and the susceptibility to digestive disorders in rabbits. In total, five coding single-nucleotide polymorphisms (cSNPs) were identified; all of which are synonymous. Among them, c.456 C> and c.594 G> were further genotyped for association analysis based on case-control design (n =162 vs n =102). Meanwhile, growing rabbits were experimentally induced to digestive disorders by feeding a fiber-deficient diet, subsequently they were subjected to mRNA expression analysis. Association analysis revealed that haplotype H1 (the two cSNPs: GT) played a potential protective role against digestive disorders (p<0.001). The expression of NLRP3 in the group $H1HX_1$ ($H1HX_1$ is composed of H1H1, H1H3 and H1H4) was the lowest among four groups which were classified by different types of diplotypes. Those results suggested that the NLRP3 gene was significantly associated with susceptibility to digestive disorders in rabbit.

상염색체 열성 지대형 근이영양증 환자로부터 TTN 유전자의 복합 이형접합성 대립유전자의 분리 (Identification of Compound Heterozygous Alleles in a Patient with Autosomal Recessive Limb-Girdle Muscular Dystrophy)

  • 최희지;이수빈;권혜미;최병옥;정기화
    • 생명과학회지
    • /
    • 제31권10호
    • /
    • pp.913-921
    • /
    • 2021
  • 고관절과 어깨의 점진적인 근육 약화를 특징으로 하는 지대형 근이영양증(limb-girdle muscular dystrophy: LGMD)은 우성 및 열성 유전을 모두 보여주며, TTN을 비롯한 많은 유전자가 발병과 관련된 것으로 알려져 있다. 본 연구는 40대 중반의 늦은 발병을 나타낸 상염색체 열성 LGMD 및 심방 조동의 증상을 가진 한 남성 환자의 유전적 원인을 규명하기 위해 수행되었다. 전장 엑솜 서열분석을 수행하여 환자로부터 TTN 유전자의 복합 이형 접합성 변이의 대립유전자를 동정하였다. 한 대립유전자는 [c.24124G>T (p.V8042F)]의 단일 변이를 보였지만, 다른 대립유전자는 [c.29222G>C (p.R9741P) + c.67490A>G (p.H22497R) + c.75376C>T (p.R25126C)]의 세 변이로 구성된 단상형이었다. 대립유전자 중 p.V8042F는 어머니로부터 유전된 반면, 다른 단상형 대립유전자는 아버지로부터 유전된 것으로 추정되었다. 본 연구에서 분리된 TTN 변이들은 공공 인간 유전체 데이터베이스(1,000 Genomes, gnomAD 및 KRGDB)에서 보고되지 않았거나 매우 낮은 빈도로 보고되었다. 대부분의 변이들은 고도로 보존된 면역글로불린 또는 피브로넥틴 도메인에 위치했으며, 일부 in silico 분석에 의해 병원성인 것으로 예측되었다. TTN 거대 단백질은 근육 조립, Z-라인에서 힘 전달, I-밴드에서 안정 장력 유지에 중요한 역할을 한다. 결론적으로, 우리는 이러한 이형접합성 복합 돌연변이의 이중 대립유전자가 LGMD 표현형의 유전적 원인으로서 작용할 수 있을 것으로 제시한다.