• 제목/요약/키워드: EM, Expectation Maximization

검색결과 138건 처리시간 0.023초

일배체형에 기초한 연쇄분석의 통계학적 알고리즘 연구 (Statistical Algorithm in Genetic Linkage Based on Haplotypes)

  • 김진흠;강대룡;이윤경;신선미;서일;남정모
    • Journal of Preventive Medicine and Public Health
    • /
    • 제37권4호
    • /
    • pp.366-372
    • /
    • 2004
  • Objectives : This study was conducted to propose a new transmission/disequilibrium test(TDT) to test the linkage between genetic markers and disease-susceptibility genes based on haplotypes. Simulation studies were performed to compare the proposed method with that of Zhao et al. in terms of type I error probability and powers. Methods : We estimated the haplotype frequencies using the expectation-maximization(EM) algorithm with parents genotypes taken from a trio dataset, and then constructed a two-way contingency table containing estimated frequencies to all possible pairs of parents haplotypes. We proposed a score test based on differences between column marginals and their corresponding row marginals. The test also involved a covariance structure of marginal differences and their variances. In simulation, we considered a coalescent model with three genetic markers of biallele to investigate the performance of the proposed test under six different configurations. Results : The haplotype-based TDT statistics, our test and Zhao et al.'s test satisfied a type I error probability, but the TDT test based on single locus showed a conservative trend. As expected, the tests based on haplotypes also had better powers than those based on single locus. Our test and that of Zhao et al. were comparable in powers. Conclusion : We proposed a TDT statistic based on haplotypes and showed through simulations that our test was more powerful than the single locus-based test. We will extend our method to multiplex data with affected and/or unaffected sibling(s) or simplex data having only one parent s genotype.

Haplotype Analysis and Single Nucleotide Polymorphism Frequency of Organic Cation Transporter Gene (OCT1 and 2) in Korean Subjects

  • Kim, Se-Mi;Lee, Sang-No;Yoon, Hwa;Kang, Hyun-Ah;Cho, Hea-Young;Lee, Il-Kwon;Lee, Yong-Bok
    • Journal of Pharmaceutical Investigation
    • /
    • 제39권5호
    • /
    • pp.345-351
    • /
    • 2009
  • Organic cation transporters (OCTs) are important for absorption, elimination of many endogenous small organic cations as well as a wide array of drugs and environmental toxins. This gene is located in a cluster on chromosome 6 and OCTs are in major organs such as intestine, liver, kidney, brain and placenta. Therefore, expression levels and function of OCTs directly affect plasma levels and intracellular concentrations of drugs and thereby determine therapeutic response. The aim of this study was to investigate the frequency of the SNPs on OCT1 (C181T and C1022T) and OCT2 (G808T) to analyze haplotype frequency in healthy Korean population. Human subjects have been genotyped for OCT1 (C181T for 195 subjects and C1022T for 825 subjects), using polymerase chain reaction-based diagnostic tests (RFLP). And for OCT2 (G808T), a total of 861 subjects have been genotyped, using pyrosequencing method. Haplotype was statistically inferred using an algorithm based on the expectation-maximization (EM). OCT1 C181T genotyping showed 100% homozygous wild-type (C/C). OCT1 C1022T genotyping showed wild-type (C/C), heterozygous (C/T) and homozygous mutant-type (T/T) and each accounted for 72.1, 24.5 and 3.4%, respectively. OCT2 G808T genotyping results also showed homozygous wild-type (G/G), heterozygous (G/T) and homozygous mutant-type (T/T) and each took 81.8, 17.9 and 0.3%, respectively. Based on these genotype data, haplotype analysis between OCT1 C181T and OCT1 C1022T has proceeded. The result has revealed that linkage disequilibrium between alleles is not obvious (P=0.0122).

은닉 물체 검출을 위한 실시간 수동형 밀리미터파 영상 분할 (Real-time passive millimeter wave image segmentation for concealed object detection)

  • 이동수;염석원;이문교;정상원;장유신
    • 한국통신학회논문지
    • /
    • 제37권2C호
    • /
    • pp.181-187
    • /
    • 2012
  • 밀리미터파 영상시스템은 의복을 투과하는 성질이 뛰어나서 의복 속에 숨겨둔 은닉 물체를 탐지하는 분야에 활용된다. 더불어 수동형 밀리미터파 영상 시스템은 능동형 시스템과 달리 실내외의 개방된 공간에서 움직이는 대상자들의 탐지가 가능하다. 그러나 수동형 밀리미터파 영상은 일반적으로 회절의 제한과 낮은 신호 레벨로 해상도가 낮으며 잡음의 영향이 크다. 그러므로 영상을 효과적으로 처리하기 위한 신호의 모델링과 통계적 분석이 요구된다. 본 논문에서 은닉 물체 검출을 수행하는 밀리미터파 영상 분할 알고리즘을 C++로 구현하여 실시간으로 처리한다. 영상의 분석을 위하여 밀리미터파 영상의 히스토그램을 혼합 가우시안 모델로 추정하고 은닉 물체를 다단계 영상 분할 방법으로 추출한다. 다단계 분할은 배경에서 몸체를 분리하는 전역분할과 은닉물체를 몸체에서 분리하는 국소분할로 이루어진다. 각 분할단계는 $k$-means, EM 추정, 판정단계로 구성되어 있다. 실험에서 실외에서 획득한 수동형 밀리미터파 영상을 분석하여 은닉 물체를 실시간으로 검출할 수 있음을 확인한다.

한국인에 있어서 MDRI 유전자(exon 12, 21 및 26)의 일배체형 분석 (Haplotype Analysis of MDRI Gene (Exon 12, 21 and 26) in Korean)

  • 김세미;박선애;조혜영;이용복
    • Journal of Pharmaceutical Investigation
    • /
    • 제38권6호
    • /
    • pp.365-372
    • /
    • 2008
  • The aim of this study was to investigate the frequency of the SNPs on MDR1 exon 12, 21 and 26 in Korean population and to analyze haplotype frequency on MDR1 exon 12, 21 and 26 in Korean population. A total of 426 healthy subjects was genotyped for MDR1, using polymerase chain reaction-based diagnostic tests. Haplotype was statistically inferred using an algorithm based on the expectation-maximization (EM). MDR1 C1236T genotyping revealed that the frequency for homozygous wild-type (C/C), heterozygous (C/T) and for homozygous mutant-type (T/T) was 20.19%, 46.48% and 33.33%, respectively. MDR1 G2677T/A genotyping revealed that the frequency for homozygous G/G, heterozygous G/T, homozygous T/T, heterozygous G/A, heterozygous T/A and for homozygous A/A type was 30.75%, 42.26%, 9.86%, 7.51 %, 7.04% and 2.58%, respectively. MDR1 C3435T genotyping revealed that the frequency for homozygous wild-type (C/C), heterozygous (C/T) and for homozygous mutant-type (T/T) was 38.73%, 50.24% and 11.03%, respectively. Twelve haplotypes were observed. Of the three major haplotypes identified (CGC, TTT and TGC), the CGC haplotype were mainly predominant in the Korean populations and accounted for 29.96% of total haplotype in Korean.

군집 특정 변량효과를 포함한 유한 혼합 모형의 베이지안 분석 (Bayesian analysis of finite mixture model with cluster-specific random effects)

  • 이혜진;경민정
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.57-68
    • /
    • 2017
  • 대량의 데이터에 있어 전반적인 특성 및 구조를 파악하는데 유용하기 때문에 다양한 분야에서 군집분석을 사용하고 있다. Dempster 등 (1977)에서 정의된 expectation-maximization(EM) 알고리즘은 가장 보편적으로 사용되는 군집분석 방법이다. 선형모형의 유한혼합물(finite mixture of linear model) 기법 또한 군집분석 방법 중 많이 사용되는 방법이며 베이지안 군집방법은 Bernardo와 Giron (1988)이 군집에 대한 가중치 확률만 모를 경우 처음 적용하였다. 우리는 이 연구에서 일반적인 선형모형의 유한혼합물이 아닌 군집특정(cluster-specific) 변량효과를 모형에 포함하여 베이지안 분석방법인 깁스표집법(Gibbs sampling)을 사용한다. 제안한 모형의 특성 및 표집법에 대하여 설명하였고 모의실험 및 실제 데이터 분석을 통하여 모형의 유용성을 파악하였다. Hurn 등 (2003)의 CO2 데이터에 모형을 적용하여 변량효과가 없는 모형, 개체특정(subject-specific) 변량효과 모형과 비교하였다.

Precise System Models using Crystal Penetration Error Compensation for Iterative Image Reconstruction of Preclinical Quad-Head PET

  • Lee, Sooyoung;Bae, Seungbin;Lee, Hakjae;Kim, Kwangdon;Lee, Kisung;Kim, Kyeong-Min;Bae, Jaekeon
    • Journal of the Korean Physical Society
    • /
    • 제73권11호
    • /
    • pp.1764-1773
    • /
    • 2018
  • A-PET is a quad-head PET scanner developed for use in small-animal imaging. The dimensions of its volumetric field of view (FOV) are $46.1{\times}46.1{\times}46.1mm^3$ and the gap between the detector modules has been minimized in order to provide a highly sensitive system. However, such a small FOV together with the quad-head geometry causes image quality degradation. The main factor related to image degradation for the quad-head PET is the mispositioning of events caused by the penetration effect in the detector. In this paper, we propose a precise method for modelling the system at the high spatial resolution of the A-PET using a LOR (line of response) based ML-EM (maximum likelihood expectation maximization) that allows for penetration effects. The proposed system model provides the detection probability of every possible ray-path via crystal sampling methods. For the ray-path sampling, the sub-LORs are defined by connecting the sampling points of the crystal pair. We incorporate the detection probability of each sub-LOR into the model by calculating the penetration effect. For comparison, we used a standard LOR-based model and a Monte Carlo-based modeling approach, and evaluated the reconstructed images using both the National Electrical Manufacturers Association NU 4-2008 standards and the Geant4 Application for Tomographic Emission simulation toolkit (GATE). An average full width at half maximum (FWHM) at different locations of 1.77 mm and 1.79 mm are obtained using the proposed system model and standard LOR system model, which does not include penetration effects, respectively. The standard deviation of the uniform region in the NEMA image quality phantom is 2.14% for the proposed method and 14.3% for the LOR system model, indicating that the proposed model out-performs the standard LOR-based model.

IFITM2 및 IFITM5 유전자다형성의 발굴과 궤양성대장염의 감수성과의 연관성 (Identification of the Polymorphisms in IFITM2 and IFITM5 Genes and their Association with Ulcerative Colitis)

  • 김헌수;모지수;알롬 콘도칼자항길;박원철;김권영;채수천
    • 생명과학회지
    • /
    • 제25권1호
    • /
    • pp.84-92
    • /
    • 2015
  • Interferon inducible transmembrane protein (IFITM) family 유전자는 인터페론(IFNs)의 동형 세포부착 기능 및 세포의 항-증식 활성과 같은 몇 가지 세포증식 과정에 연관되어 있다. 본 연구에서는 IFITM2 및 IFITM5 SNPs이 궤양성대장염의 감수성과 연관되어 있는지 알아 보고자 했다. 본 연구에서 직접 염기서열 분석법을 사용하여 IFITM2 유전자에서 총 13개, IFITM5 유전자에서는 12개의 유전적 변이를 발굴하였다. 이들의 SNPs의 유전자형 분석은 PCR-RFLP 법과 Taq-Man probe 분석법을 사용하였고, 일배체형 빈도 분석은 EM algorithm을 사용하여 분석하였다. 궤양성대장염 환자에서 IFITM2 및 IFITM5 SNPs의 유전자형과 대립유전자 빈도는 건강인 대조군과 비교했을 때 유의성이 없었다. 궤양성대장염 환자와 정상인 대조군에서 IFITM1의 rs77537847, IFITM2의 rs909097, IFITM5의 rs56069858을 지표로 하는 유전자형 조합 빈도를 분석한 결과 주된 유전자형 조합빈도에서는 유의성이 없는 것으로 나타났으나, 궤양성대장염 환자와 건강인 대조군의 GGT 유전자형조합 빈도 분석에서는 유의하게 다른 차이를 보였다(p=0.002). 이러한 결과에 의거하여 IFITMs의 SNPs 유전자형 조합이 궤양성대장염의 감수성과 연관성이 있고, 궤양성대장염의 유용한 유전자 마커로 사용 할 수 있다고 생각된다.

GMM과 클러스터링 기법에 의한 뉴로-퍼지 시스템 모델링 (A Neuro-Fuzzy System Modeling using Gaussian Mixture Model and Clustering Method)

  • 김승석;곽근창;유정웅;전명근
    • 한국지능시스템학회논문지
    • /
    • 제12권6호
    • /
    • pp.571-576
    • /
    • 2002
  • 본 논문에서는 여러 분야에서 널리 응용되고 있는 적응 뉴로-퍼지 시스템(ANFIS)의 성능 개선에 있어서 전제부 파라미터를 효과적으로 초기화 시키는 방법을 제안한다. 기존의 그리드 분할을 이용한 입력공간 선택 방법은 ANFIS의 규칙 생성에 있어서 얻어진 규칙의 수가 지수적으로 증가하는 단점이 있다. 이에, 본 연구에서는 GMM에서의 최대우도추정을 이용한 EM 알고리즘을 통하여 초기치에 의하여 성능의 영향이 좌우되는 ANFIS의 입력으로 주어 제안된 클러스터링 기법에 의하여 모델의 성능을 개선하고자 한다. 제안된 방법의 클러스터링 방법은 통계적 방법에 근거하여 좋은 성능의 파라미터를 획득할 수 있어 주어진 모델에 대한 ANFIS의 성능을 개선할 수 있다. 이들 방법의 유용함을 전형적인 다변수 비선형 데이터인 자동차 연료 예측 문제와 정수장 응집제 주입 문제에 적용하여 제안된 방법이 이전의 연구보다 성능이 개선되는 것을 통하여 보였다.