• 제목/요약/키워드: Haplotype Reconstruction

검색결과 10건 처리시간 0.02초

Haplotype Reconstruction 소프트웨어의 성능 평가 및 비교 (The Performance Evaluation and Comparison of Softwares for Haplotype Reconstruction)

  • 김상준;나경락;여상수;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.313-315
    • /
    • 2004
  • SNP(Single Nucleotide Polymorphism)은 생물학적 다양성에 관한 연관성 연구(Association Study)에서 이용되어지고 있다. haplotype을 구하기 위해 genotype data를 Haplotype Reconstruction을 하여 한 가닥씩 분리를 한다. Haplotype Reconstruction의 방법은 생물학적 접근법(molecular method)과, 계산적 접근방법(in-silico method)으로 연구되고 있다 계산적 접근법은 생물학적 접근법에 비해 적은 비용과 시간이 소요되는 장점을 지니지만, phase problem으로 인하여 생물학적 접근법에 비해 정확도가 낮다는 단점을 갖는다. 이런 문제를 해결하기 위한 설러 알고리즘들과 프로그램들이 연구 및 개발되고 있다. 본 논문에서는 현재 개발된 프로그램들에 대해서 다양한 테스트를 통한 각 프로그램의 성능 비교를 하였고, 특성과 문제점을 파악하였다.

  • PDF

공개용 리소스를 활용한 Haplotype 재조합 시스템 개발 (Development of Haplotype Reconstruction System Using Public Resources)

  • 김기봉
    • 한국산학기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.720-726
    • /
    • 2010
  • Haplotype은 연관성을 띠면서 함께 유전하는 SNP (Single Nucleotide Polymorphism) 집단을 반영하고 있기 때문에 맞춤의학 분야에서 haplotype기반의 연구 중요성이 지속적으로 급증하고 있다. in silico 방법을 바탕으로 Haplotype 재조합을 위해 현재 가장 널리 사용되는 공개용 리소스 응용소프트웨어로는 PL-EM, Haplotyper, PHASE 및 HAP 등이 있다. PL-EM, Haplotyper 및 PHASE 등은 리눅스와 유닉스 시스템에서 구동되는 명령라인 응용 소프트웨어이고, HAP는 클라이언트-서버 환경에서 웹기반으로 구동되는 소프트웨어이다. 본 논문에서는 실험적으로 검증된 데이터들을 이용하여 공개용 리소스 소프트웨어들의 정확성을 검증하고, 그러한 검증결과를 토대로 선별된 Haplotyper와 PL-EM 등으로 개발한 통합 haplotye 재조합 시스템에 대해 소개하고자 한다. 개발된 통합 시스템은 사용자 친화적 웹 인터페이스를 갖는 클라이언트-서버 시스템으로 최종 사용자들에게 양질의 haplotype 분석 결과를 제공할 수 있다. Haplotyper의 경우 5명의 개체로부터 얻은 길이가 5인 SNP 유전자형 데이터를 가지고 결과를 분석하였고, PL-EM의 경우 15명의 개체로부터 얻은 길이가 13인 SNP 유전자형 데이터를 가지고 결과를 분석하였다. 그 결과 본 시스템은 두 부분으로 나누어 개개인의 haplotype 정보와 haplotype 집단 정보를 이해하기 쉽게 체계적으로 제공하는 것을 확인하였다. 이러한 측면에서 본 시스템은 haplotype 지도 작성을 통한 질병 유전자 발굴 및 맞춤의약 개발 연구에 매우 유용한 도구로 사용될 수 있으리라 여겨진다.

일배체형 재조합을 위한 MCIH 모델과 WMLF/GI 모델의 정확도 비교 (The Correctness Comparison of MCIH Model and WMLF/GI Model for the Individual Haplotyping Reconstruction)

  • 정인선;강승호;임형석
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.157-161
    • /
    • 2009
  • 일배체형 조합 문제를 해결하기 위해 제시된 MLF(Minimum Letter Flips) 모델이나 WMLF(Weighted Minimum Letter Flips) 모델은 유전자형 정보를 도입함으로써 오류와 손실이 많을 때에도 높은 정확도를 얻을 수 있다. 그리고 MLF 모델에 비해 가중치 버전인 WMLF모델의 정확도가 높다는 사실도 밝혀졌다. 본 논문에서는 유전자형 정보상의 동형(homozygous)의 분포 비율과 유전자 서열판독기계의 성능에 따른 신뢰도의 차이를 매개변수로 하여 두 모델을 구체적으로 비교, 분석한다. 두 모델의 성능 비교를 위해 신경망과 유전자 알고리즘을 사용한다. 실험결과 동형의 비율이 크고 판독기계의 성능이 좋으면 특히 손실율과 오류율이 높은 경우에 WMLF/GI 모델의 정확도가 더 우수함을 보인다.

HapAnalyzer: Minimum Haplotype Analysis System for Association Studies

  • Jung, Ho-Youl;Park, Jung-Sun;Park, Yun-Ju;Kim, Young-Jin;Kimm, Kuchan;Koh, InSong
    • Genomics & Informatics
    • /
    • 제2권2호
    • /
    • pp.107-109
    • /
    • 2004
  • HapAnalyzer is an analysis system that provides minimum analysis methods for the SNP-based association studies. It consists of Hardy-Weinberg equilibrium (HWE) test, linkage disequilibrium (LD) computation, haplotype reconstruction, and SNP (or haplotype)-phenotype association assessment. It is well suited to a case-control association study for the unrelated population.

대용량의 Haplotype과 Genotype데이터에 대한 LD기반의 tagSNP 선택 시스템 (LD-based tagSNP Selection System for Large-scale Haplotype and Genotype Datasets)

  • Kim, Sang-Jun;Yeo, Sang-Soo;Kim, Sung-Kwon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.279-285
    • /
    • 2004
  • In the disease association study, the tagSNP selection problem is important at the view of time and cost. We developed the new tagSNP selection system that has also facilities for the haplotype reconstruction and missing data processing. In our system, we improved biological meanings using LD coefficients as well as dynamic programming method. And our system has capability of processing large -scale dataset, such as the total SNPs on a chromosome. We have tested our system with various dataset from daly et al., patil et al., HapMap Project, artificial dataset, and so on.

  • PDF

신뢰도를 가진 SNP 단편들과 유전자형으로부터 일배체형 조합 (Haplotype Assembly from Weighted SNP Fragments and Related Genotype Information)

  • 강승호;정인선;최문호;임형석
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권11호
    • /
    • pp.509-516
    • /
    • 2008
  • Minimum Letter Flips(MLF) 모델과 Weighted Minimum Letter Flips(WMLF) 모델은 일배체형 조합문제(haplotype assembly problem)를 해결하기 위한 모델들이다. 그러나 MLF 모델이나 WMLF 모델은 SNP(Single Nucleotide Polymorphism) 단편들에 손실과 오류가 적은 경우에만 효과적이다. 본 논문은 WMLF 모델의 개선을 목적으로 유전자형 정보를 추가한 WMLF/GI 모델과 문제를 제시한다. 새로 제시한 문제가 NP-hard임을 증명하고, 정확성이 높고 효율적인 문제 해결을 위해 유전자 알고리즘을 설계한다. 실험 결과를 통해 새로운 모델이 기존의 모델들에 비해 SNP 단편들에 손실과 오류가 많은 경우에도 높은 정확성을 가짐과 유전자형 정보가 유전자 알고리즘의 수렴속도를 크게 개선함을 보인다.

대용량 유전자형 데이터에 대한 LD기반의 일배체형 재구성 시스템 (The LD based Haplotype Reconstruction System for Large scale Genotype dataset)

  • 김상준;여상수;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.271-273
    • /
    • 2005
  • 유전자 분석기술의 발전은 지놈 프로젝트(genome project)와 햅맵 프로젝트(hapmap project)를 가능하게 하였으며 이제는 맞춤형 진단 및 신약 개발 등 실제 사업의 구체화를 가져오게 하였다. 실제 사업에 적용시키기 위해서는 비용 절감의 문제를 해결해야 한다. 그래서 대용량의 유전자형(genotype)데이터를 정확하고 빠르게 일배체형(haplotype)으로 재구성해 줄 수 있는 시스템이 생물 산업 및 제약 산업에서 제기되어 지고 있다. 기존의 연구에서 비록 정확성이 높은 알고리즘들이 개발되어 있지만 기존의 방법들은 계산에 필요한 양이 크기 때문에 대용량 데이터에 대한 처리가 불가능하였다. 우리가 제안하는 시스템은 대용량 데이터를 유동적인 크기로 블록을 분할하여 대용량 데이터 처리 문제를 해결하였다. 또한 나누어진 블록에서 나타나는 모호한 이형접합체(heterozygote)의 위상(phase)의 결정 과정에 LD기반의 블록 분할 방법을 이용함으로써, 추론된 결과의 정확률을 높였다. 구현된 시스템의 성능평가는 ms로 구성한 인공데이터를 사용하여 수행하였다.

  • PDF

Interleukin-4 유전자의 Promoter 일배체형에 따른 전사능의 차이 (Difference in the Transcriptional Activity of the Interleukin-4 Promoter Haplotypes)

  • 최은화;김희섭;;이환종
    • Clinical and Experimental Pediatrics
    • /
    • 제48권5호
    • /
    • pp.495-499
    • /
    • 2005
  • 목 적 : IL-4는 Th2 면역 반응의 중요한 매개체로 IL4 유전자의 promoter 일배체형(haplotype)은 한국인 소아에서 RSV에 의한 심한 모세기관지염과 연관된다고 알려져 있다. 본 연구는 IL4 유전자의 promoter 다형성에 따른 IL-4 단백의 기능적인 변화를 분석하여 심한 RSV 하기도 감염증에 기여하는 IL4 유전자의 발병 기전의 연관성을 연구하고자 시행하였다. 방 법 : 면역 기능이 정상인 소아 20명을 대상으로 전혈을 채취한 후 genomic DNA를 추출하여 IL4 유전자 promoter 약 1.2 kb 부위를 증폭시켰다. 염기서열 분석을 통하여 IL4 유전자 promoter의 유전형을 결정하고, PHASE 분석으로 일배체형을 결정하였다. 각 일배체형별로 $5{\mu}g$의 DNA를 Jurkat T 세포에 핵형질변환 시켜서 정상 Jurkat T 세포와 PMA(50 ng/mL)로 자극한 세포에서의 luciferase 활성도를 분석하여 IL4 유전자 promoter의 전사능을 결정하였다. 결 과 : 한국인 소아의 일배체형은 3가지 유형 GCC(7%), TCC(17%), 및 TTT(76%)로 분포하였다. Jurkat T 세포의 절대 luciferase 활성도는 GCC형이 가장 낮았고 TTT형이 가장 높았다. GCC 일배체형을 기준으로 하여 나타낸 Jurkat T 세포의 상대 luciferase 활성도는 TCC형이 4.2배, TTT형이 5.3배로 증가되었다. PMA로 자극한 후에 측정한 각 일배체형의 luciferase 활성도 역시 GCC형에 비하여 TCC형이 3.0배, TTT형이 4.1배로 증가되어 자극하지 않은 세포에서와 유사한 활성도의 차이를 보였다. 결 론 : 소아의 심한 RSV 하기도 감염증과 연관된 IL4 유전자의 promoter 일배체형 TTT는 IL4 유전자의 promoter의 전사능을 증가시킴으로써 영아 및 소아의 RSV 하기도 감염증의 병인에 중요한 역할을 할 것으로 생각된다.

iHaplor: A Hybrid Method for Haplotype Reconstruction

  • Jung, Ho-Youl;Heo, Jee-Yeon;Cho, Hye-Yeung;Ryu, Gil-Mi;Lee, Ju-Young;Koh, In-Song;Kimm, Ku-Chan;Oh, Berm-Seok
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.221-228
    • /
    • 2003
  • This paper presents a novel method that can identify the individual's haplotype from the given genotypes. Because of the limitation of the conventional single-locus analysis, haplotypes have gained increasing attention in the mapping of complex-disease genes. Conventionally there are two approaches which resolve the individual's haplotypes. One is the molecular haplotypings which have many potential limitations in cost and convenience. The other is the in-silico haplotypings which phase the haplotypes from the diploid genotyped populations, and are cost effective and high-throughput method. In-silico haplotyping is divided into two sub-categories - statistical and computational method. The former computes the frequencies of the common haplotypes, and then resolves the individual's haplotypes. The latter directly resolves the individual's haplotypes using the perfect phylogeny model first proposed by Dan Gusfield [7]. Our method combines two approaches in order to increase the accuracy and the running time. The individuals' haplotypes are resolved by considering the MLE (Maximum Likelihood Estimation) in the process of computing the frequencies of the common haplotypes.

  • PDF

Genetic Diversity of Amylomyces rouxii from Ragi tapai in Java Island Based on Ribosomal Regions ITS1/ITS2 and D1/D2

  • Delva, Ega;Arisuryanti, Tuty;Ilmi, Miftahul
    • Mycobiology
    • /
    • 제50권2호
    • /
    • pp.132-141
    • /
    • 2022
  • Amylomyces rouxii is commonly found as amylolytic fungi in tapai fermentation. However, its diversity is rarely reported despite being often used for food production in Southeast Asia. This research aims to analyze the genetic diversity and the distribution pattern of A. rouxii from Ragi tapai in Java Island, Indonesia. We isolated the fungus from samples obtained from Ragi tapai producing centers in Bandung, Sumedang, Muntilan, Blora, Yogyakarta, and Bondowoso. The obtained isolates were molecularly identified based on the ribosomal regions ITS1/ITS2 and D1/D2, then analyzed for phylogenetic tree reconstruction, genetic distance, genetic variation, and haplotype networking. Six isolates showed specific morphological traits of A. rouxii. However, phylogenetic tree reconstruction on the ribosomal genes showed that the isolates were grouped into two different clades related to two species. Clade A included BDG, SMD, and MTL isolates related to A. rouxii, whereas clade B included YOG, BLR, and BDS isolates related to Mucor indicus. The genetic distances between clades for ITS1/ITS2 and D1/D2 were 0.6145 and 0.1556, respectively. In conclusion, we confirmed the genetic diversity of molds from Ragi tapai in Java Island and showed that the isolates are not only related to A. rouxii as reported before.