• 제목/요약/키워드: SNP Haplotype

검색결과 127건 처리시간 0.026초

유전자 단위 haplotype을 대변하는 토마토 Tag-SNP 선발 및 웹 데이터베이스 구축 (Tag-SNP selection and online database construction for haplotype-based marker development in tomato)

  • 정혜리;이보미;이봉우;오재은;이정희;김지은;조성환
    • Journal of Plant Biotechnology
    • /
    • 제47권3호
    • /
    • pp.218-226
    • /
    • 2020
  • 유전체 정보가 공공 데이터베이스 내에 빠르게 축적이 되면서 유전체 데이터의 활용도를 높이기 위한 재가공 기술과 공유 기술이 지속적으로 중요해지고 있다. 특히 분자육종을 가속화하기 위해서 다양한 목적에 맞는 분자 마커 개발이 중요하다. 본 연구는 이러한 요구를 해소하기 위해 유전자 단위에서 haplotype을 기본단위로 구분하고 해당 유전자의 haplotype을 대변하는 tag-SNP를 선발하여 분자 마커 등을 개발하는데 사용할 수 있도록 관련 정보를 웹 사이트를 통해서 제공하고자 웹 데이터베이스를 구축하였다. 본 연구를 통해 선발된 각 tag-SNP는 하나의 유전자를 대변할 수 있고, 각 유전자의 haplotype을 구분할 수 있으며, 해당 유전자의 염색체 내 위치 정보, non-synonymous SNP의 정보를 담고 있다. 따라서 기존 무작위 방식으로 선발되어 사용되던 SNP에 비하여 정보력이 높은 tag-SNP를 활용해서 haplotype block을 확장할 수 있을 것이다. Haplotype의 기본 단위를 유전자로 설정함으로써 집단이 바뀜에 따라 발생하는 SNP의 유무, LD block의 크기 등이 변하는 문제점을 극복하고, 표준화된 haplotype library 작성이 가능할 것이며 이는 또한 분자육종을 위한 분자 마커를 선발하는데 활용될 수 있을 것으로 기대된다.

EM 알고리듬을 이용한 단일염기변이 (SNP;SINGLE NUCLEOTIDE POLYMORPHISM)군의 일배체형 (HAPLOTYPE) 비율 추정 (Estimation of Haplotype Proportions in Single Necleotide Polymorphism Group Using EM Algorithm)

  • 김선우;김종원;이경아
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.195-202
    • /
    • 2003
  • 복합성유전질환 연구에 있어서 단일염기변이를 이용한 일배체형 분석은 개별적인 단일염기변이 분석에 비하여 비용 및 효율 면에서 훨씬 유용하며, 생물학적으로도 기능적 중요성을 갖는 것으로 평가되고 있다. 그러나 일반적인 유전형분석방법을 이용한 단일염기변이군 자료는 이배체형(diploid)으로서 위상(phase)을 확인할 수 없으므로 일배체형 비율을 예측하기 어렵다. 본 연구에서는 고형종양 환자군과 정상군의 단일염기변이군 이배체형 자료가 주어졌을 때 단일염기변이군 일배체형 비율의 우도함수에 EM알고리듬을 적용하여 각 일배체형의 비율을 추정하였다. 이로부터 단일염기변이간의 연관불균형(linkage disequilibrium)을 분석하여 고형 종양과 연관 가능성이 있는 단일염기변이를 살펴보았다.

Effects of Single Nucleotide Polymorphism Marker Density on Haplotype Block Partition

  • Kim, Sun Ah;Yoo, Yun Joo
    • Genomics & Informatics
    • /
    • 제14권4호
    • /
    • pp.196-204
    • /
    • 2016
  • Many researchers have found that one of the most important characteristics of the structure of linkage disequilibrium is that the human genome can be divided into non-overlapping block partitions in which only a small number of haplotypes are observed. The location and distribution of haplotype blocks can be seen as a population property influenced by population genetic events such as selection, mutation, recombination and population structure. In this study, we investigate the effects of the density of markers relative to the full set of all polymorphisms in the region on the results of haplotype partitioning for five popular haplotype block partition methods: three methods in Haploview (confidence interval, four gamete test, and solid spine), MIG++ implemented in PLINK 1.9 and S-MIG++. We used several experimental datasets obtained by sampling subsets of single nucleotide polymorphism (SNP) markers of chromosome 22 region in the 1000 Genomes Project data and also the HapMap phase 3 data to compare the results of haplotype block partitions by five methods. With decreasing sampling ratio down to 20% of the original SNP markers, the total number of haplotype blocks decreases and the length of haplotype blocks increases for all algorithms. When we examined the marker-independence of the haplotype block locations constructed from the datasets of different density, the results using below 50% of the entire SNP markers were very different from the results using the entire SNP markers. We conclude that the haplotype block construction results should be used and interpreted carefully depending on the selection of markers and the purpose of the study.

HapAnalyzer: Minimum Haplotype Analysis System for Association Studies

  • Jung, Ho-Youl;Park, Jung-Sun;Park, Yun-Ju;Kim, Young-Jin;Kimm, Kuchan;Koh, InSong
    • Genomics & Informatics
    • /
    • 제2권2호
    • /
    • pp.107-109
    • /
    • 2004
  • HapAnalyzer is an analysis system that provides minimum analysis methods for the SNP-based association studies. It consists of Hardy-Weinberg equilibrium (HWE) test, linkage disequilibrium (LD) computation, haplotype reconstruction, and SNP (or haplotype)-phenotype association assessment. It is well suited to a case-control association study for the unrelated population.

신뢰도를 가진 SNP 단편들과 유전자형으로부터 일배체형 조합 (Haplotype Assembly from Weighted SNP Fragments and Related Genotype Information)

  • 강승호;정인선;최문호;임형석
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권11호
    • /
    • pp.509-516
    • /
    • 2008
  • Minimum Letter Flips(MLF) 모델과 Weighted Minimum Letter Flips(WMLF) 모델은 일배체형 조합문제(haplotype assembly problem)를 해결하기 위한 모델들이다. 그러나 MLF 모델이나 WMLF 모델은 SNP(Single Nucleotide Polymorphism) 단편들에 손실과 오류가 적은 경우에만 효과적이다. 본 논문은 WMLF 모델의 개선을 목적으로 유전자형 정보를 추가한 WMLF/GI 모델과 문제를 제시한다. 새로 제시한 문제가 NP-hard임을 증명하고, 정확성이 높고 효율적인 문제 해결을 위해 유전자 알고리즘을 설계한다. 실험 결과를 통해 새로운 모델이 기존의 모델들에 비해 SNP 단편들에 손실과 오류가 많은 경우에도 높은 정확성을 가짐과 유전자형 정보가 유전자 알고리즘의 수렴속도를 크게 개선함을 보인다.

공개용 리소스를 활용한 Haplotype 재조합 시스템 개발 (Development of Haplotype Reconstruction System Using Public Resources)

  • 김기봉
    • 한국산학기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.720-726
    • /
    • 2010
  • Haplotype은 연관성을 띠면서 함께 유전하는 SNP (Single Nucleotide Polymorphism) 집단을 반영하고 있기 때문에 맞춤의학 분야에서 haplotype기반의 연구 중요성이 지속적으로 급증하고 있다. in silico 방법을 바탕으로 Haplotype 재조합을 위해 현재 가장 널리 사용되는 공개용 리소스 응용소프트웨어로는 PL-EM, Haplotyper, PHASE 및 HAP 등이 있다. PL-EM, Haplotyper 및 PHASE 등은 리눅스와 유닉스 시스템에서 구동되는 명령라인 응용 소프트웨어이고, HAP는 클라이언트-서버 환경에서 웹기반으로 구동되는 소프트웨어이다. 본 논문에서는 실험적으로 검증된 데이터들을 이용하여 공개용 리소스 소프트웨어들의 정확성을 검증하고, 그러한 검증결과를 토대로 선별된 Haplotyper와 PL-EM 등으로 개발한 통합 haplotye 재조합 시스템에 대해 소개하고자 한다. 개발된 통합 시스템은 사용자 친화적 웹 인터페이스를 갖는 클라이언트-서버 시스템으로 최종 사용자들에게 양질의 haplotype 분석 결과를 제공할 수 있다. Haplotyper의 경우 5명의 개체로부터 얻은 길이가 5인 SNP 유전자형 데이터를 가지고 결과를 분석하였고, PL-EM의 경우 15명의 개체로부터 얻은 길이가 13인 SNP 유전자형 데이터를 가지고 결과를 분석하였다. 그 결과 본 시스템은 두 부분으로 나누어 개개인의 haplotype 정보와 haplotype 집단 정보를 이해하기 쉽게 체계적으로 제공하는 것을 확인하였다. 이러한 측면에서 본 시스템은 haplotype 지도 작성을 통한 질병 유전자 발굴 및 맞춤의약 개발 연구에 매우 유용한 도구로 사용될 수 있으리라 여겨진다.

Effect of Single Nucleotide Polymorphisms of Acetyl-CoA Carboxylase α(ACACA) Gene on Carcass Traits in Hanwoo (Korean Cattle)

  • Shin, Sung-Chul;Heo, Jae-Pil;Chung, Eui-Ryong
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제24권6호
    • /
    • pp.744-751
    • /
    • 2011
  • Meat production and quality traits in beef cattle are largely affected by genetic factors. Acetyl-Coenzyme A carboxylase-${\alpha}$ (ACACA) plays a key role in the regulation and metabolism of fatty acid biosynthesis in mammalian animals. The gene encoding ACACA enzyme was chosen as a candidate gene for carcass and meat traits. In this study, we investigated effects of single nucleotide polymorphisms (SNPs) in the ACACA gene on beef carcass and meat traits in Hanwoo (Korean cattle) populations. We have sequenced a fragment of intron I region of the Hanwoo ACACA gene and identified two SNPs. Genotyping of the two SNP markers (g.2344T>C and g.2447C>A) was carried out using PCR-SSCP analysis in 309 Hanwoo steers to evaluate their association with carcass and meat production traits. The g.2344C SNP marker showed a significant increasing effect on LW (p = 0.009) and CW (p = 0.017). Animals with the CC genotype had higher CW and LW compared with TT and TC genotypes (p<0.05). The g.2447A SNP marker was associated with higher MC (p = 0.019). Animals with the AA genotype had higher MC than animals with CC and CA genotypes (p<0.05). Although the degree of linkage disequilibrium (LD) was not strong between g.2344T>C and g.2447C>A in the LD analysis, four major haplotype classes were formed with two SNP information within the ACACA gene. We constructed haplotypes using the HaploView software package program and analyzed association between haplotypes and carcass traits. The haplotype of ACACA gene significantly affected the LW (p = 0.027), CW (p = 0.041) and MC (p = 0.036). The effect of h1 haplotype on LW and CW was larger than that of h3 haplotype. Animals with the h1 haplotype also had greater MC than did animals with h2 haplotype. Consequently, the ACACA gene could be useful as a DNA marker for meat production traits such as carcass yield and meat contents in Hanwoo.

SNP과 Haplotype 분석의 통계적 문제점들

  • 김호;조성일;서유신;현순주;노재정;이복주
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.203-207
    • /
    • 2002
  • Post-genome 시대를 맞이하여 인류는 전 유전체에서의 염기서열에 대한 정보를 가질 수 있게 되었다. 이러한 정보를 이용하여서 인간에게 나타나는 다양성을 설명하기 위해서 SNP(Single Nucleotide Polymorphism)의 연구가 활발히 되고 있다. 하지만 인간 체세포의 염색체는 2쌍으로 되어있기 때문에 이러한 정보가 어떠한 쌍의 조합(haplotype)으로 나타나는가를 고려하여야한다. 현재 실험적 방법으로 이를 고려하기에는 여러 가지 제약이 따르므로 통계적인 방법으로 이를 모형화하려는 노력(in silico haplotyping)이 시도되고 있다. 이 논문에서는 통계적으로 haplotype을 정하는 대표적인 알고리즘인 Clark's algorithm, E-M algorithm 등에 대한 고찰을 통하여 유전체통계학에 대한 소개를 하고자 한다.

  • PDF

대용량의 Haplotype과 Genotype데이터에 대한 LD기반의 tagSNP 선택 시스템 (LD-based tagSNP Selection System for Large-scale Haplotype and Genotype Datasets)

  • Kim, Sang-Jun;Yeo, Sang-Soo;Kim, Sung-Kwon
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.279-285
    • /
    • 2004
  • In the disease association study, the tagSNP selection problem is important at the view of time and cost. We developed the new tagSNP selection system that has also facilities for the haplotype reconstruction and missing data processing. In our system, we improved biological meanings using LD coefficients as well as dynamic programming method. And our system has capability of processing large -scale dataset, such as the total SNPs on a chromosome. We have tested our system with various dataset from daly et al., patil et al., HapMap Project, artificial dataset, and so on.

  • PDF

Linkage Disequilibrium (LD) Mapping and Tagging SNP Selection of C-Fos Induced Growth Factor (Figf) Gene in Korean Population

  • Kim, Sook;Yoo, Yeon-Kyung;Jang, Hye-Yoon;Shin, Eun-Soon;Cho, Eun-Young;Kim, Eu-Gene;NamKung, Jung-Hyun;Yang, Jun-Mo;Lee, Jong-Eun
    • Molecular & Cellular Toxicology
    • /
    • 제2권1호
    • /
    • pp.7-10
    • /
    • 2006
  • We performed comprehensive SNP validation and linkage disequilibrium (LD) analysis of the c-fos induced growth factor (Figf) gene in Korean population. Out of 32 SNPs, only 9 SNPs were polymorphic in Korean population. Validated SNPs formed a single extended haplotype block with strong LD through the entire length of the gene. Tagging SNP analysis picked only 2 SNPs to represent most of the genetic variation information of the Figf gene. Our results demonstrate the utility of LD block and tagging SNP analysis for an efficient way of performing a candidate gene based association study.