• 제목/요약/키워드: Permutation test

검색결과 88건 처리시간 0.025초

Estimation of Gini-Simpson index for SNP data

  • Kang, Joonsung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1557-1564
    • /
    • 2017
  • We take genomic sequences of high-dimensional low sample size (HDLSS) without ordering of response categories into account. When constructing an appropriate test statistics in this model, the classical multivariate analysis of variance (MANOVA) approach might not be useful owing to very large number of parameters and very small sample size. For these reasons, we present a pseudo marginal model based upon the Gini-Simpson index estimated via Bayesian approach. In view of small sample size, we consider the permutation distribution by every possible n! (equally likely) permutation of the joined sample observations across G groups of (sizes $n_1,{\ldots}n_G$). We simulate data and apply false discovery rate (FDR) and positive false discovery rate (pFDR) with associated proposed test statistics to the data. And we also analyze real SARS data and compute FDR and pFDR. FDR and pFDR procedure along with the associated test statistics for each gene control the FDR and pFDR respectively at any level ${\alpha}$ for the set of p-values by using the exact conditional permutation theory.

Tests of equality of several variances with the likelihood ratio principle

  • Park, Hyo-Il
    • Communications for Statistical Applications and Methods
    • /
    • 제25권4호
    • /
    • pp.329-339
    • /
    • 2018
  • In this study, we propose tests for equality of several variances with the normality assumption. First of all, we propose the likelihood ratio test by applying the permutation principle. Then by using the p-values for the pairwise tests between variances and combination functions, we propose combination tests. We apply the permutation principle to obtain the overall p-values. Also we review the well- known test statistics for the completion of our discussion and modify a statistic with the p-values. Then we illustrate proposed tests by numerical and simulated data and compare their efficiency with the reviewed ones through a simulation study by obtaining empirical p-values. Finally, we discuss some interesting features related to the resampling methods and tests for equality among several variances.

Combining Independent Permutation p-Values Associated with Multi-Sample Location Test Data

  • Um, Yonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.175-182
    • /
    • 2020
  • 연속형 분포로부터 얻은 독립적인 p값들을 통합하는 Fisher의 고전적인 방법은 널리 사용되고 있지만 이산형 확률분포로부터 얻은 p값들을 통합하기에는 적절하지 않다. 대신에 유사 Fisher의 통합방법이 이산형 확률분포의 p값들을 통합하는 대안으로 사용된다. 본 논문에서는 첫째, 여러 표본들의 위치검정(Fisher-Pitman 검정과 Kruskal-Wallis 검정) 데이터와 관련된 이산형 확률분포로 부터 퍼뮤테이션 방법에 의해 p값들을 구하고, 둘째로 이 p값들을 유사 Fisher의 통합방법을 이용하여 통합한다. 그리고 Fisher의 고전적인 방법과 유사 Fisher의 통합방법의 결과를 비교한다.

다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법 (Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance)

  • 남승찬;최용석
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.567-578
    • /
    • 2017
  • 일반적으로 그룹화된 다변량자료는 다변량 분산분석(multivariate analysis of variance; MANOVA)을 사용하여 그룹 간 차이를 검정할 수 있다. 그러나 만약 다변량 분산분석의 기본적인 가정이 위배되면 이 방법은 적절하지 못하다. 이 경우 다양한 거리로부터 그룹화된 비유사성을 계산한 후 다차원척도법(multidimensional scaling; MDS), 거리분석(analysis of distance; AOD) 그리고 비모수적 기법인 순열검정(permutation test)을 적용하여 문제를 해결할 수 있다. 다차원척도법은 비유사성으로부터 개체들의 좌표를 계산해주며 거리분석은 이 좌표를 활용하여 그룹구조를 파악하는데 유용하다. 특히 비유사성의 측도로 유클리드 거리를 사용하면 거리분석은 다변량 분산분석과 수리적으로 매우 밀접한 연관관계를 맺는다. 따라서 본 연구에서는 그룹화된 비유사성에 다차원척도법과 거리분석을 적용하여 그룹 내와 그룹 간의 구조를 파악하고 순열검정을 위한 새로운 검정통계량을 제안하려 한다. 덧붙여 유클리드 거리를 활용한 비유사성을 통해 거리분석과 다변량 분산분석과의 수리적 연관성을 고찰하고자 한다.

Major DNA Marker Mining of Hanwoo Chromosome 6 by Bootstrap Method

  • Lee, Jea-Young;Lee, Yong-Won
    • Communications for Statistical Applications and Methods
    • /
    • 제11권3호
    • /
    • pp.657-668
    • /
    • 2004
  • Permutation test has been applied for the QTL(quantitative trait loci) analysis and we selected a major locus. K -means clustering analysis, for the major DNA Marker mining of ILSTS035 microsatellite loci in Hanwoo chromosome 6, has been described. Finally, bootstrap testing method has been adapted to calculate confidence intervals and for finding major DNA Markers.

Test procedures for the mean and variance simultaneously under normality

  • Park, Hyo-Il
    • Communications for Statistical Applications and Methods
    • /
    • 제23권6호
    • /
    • pp.563-574
    • /
    • 2016
  • In this study, we propose several simultaneous tests to detect the difference between means and variances for the two-sample problem when the underlying distribution is normal. For this, we apply the likelihood ratio principle and propose a likelihood ratio test. We then consider a union-intersection test after identifying the likelihood statistic, a product of two individual likelihood statistics, to test the individual sub-null hypotheses. By noting that the union-intersection test can be considered a simultaneous test with combination function, also we propose simultaneous tests with combination functions to combine individual tests for each sub-null hypothesis. We apply the permutation principle to obtain the null distributions. We then provide an example to illustrate our proposed procedure and compare the efficiency among the proposed tests through a simulation study. We discuss some interesting features related to the simultaneous test as concluding remarks. Finally we show the expression of the likelihood ratio statistic with a product of two individual likelihood ratio statistics.

순열검정을 이용한 FLSA의 사후추론 (Permutation test for a post selection inference of the FLSA)

  • 최지은;손원
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.863-874
    • /
    • 2021
  • FLSA는 총변동벌점을 이용해 구간별상수인 평균 구조를 구현하는 벌점모형으로 다중변화점 탐색을 위해 활용되고 있다. 한편, FLSA는 변화점 탐색에 있어서 점근적 일치성이 만족되지 않으므로 잡음의 크기가 0에 가깝게 수렴하는 경우에도 다수의 거짓 변화점이 식별될 수 있다는 단점이 있다. 이 연구에서는 이러한 FLSA의 문제점을 해결하기 위한 사후추론 방법으로 순열검정 방법을 제안한다. 단일변화점 모형과 관련된 순열검정 방법은 Antoch와 Hušková (2001)에 의해 제안된 바 있다. 이 연구에서는 Antoch와 Hušková (2001)의 검정절차를 확장하여 다중변화점 식별에 사용되는 FLSA와 결합함으로써 다중변화점 모형에 적용할 수 있는 순열검정절차를 제안한다. 모의실험 결과, 제안된 방법은 z-검정과 CUSUM 통계량의 극한분포에 기반을 둔 검정방법에 비해 전반적으로 우수하였으며 거짓 변화점의 식별에 유용함을 확인할 수 있었다.

돼지의 QTL 검색을 위한 유의적 임계수준(Threshold) 결정 (Determination of Significance Threshold for Detecting QTL in Pigs)

  • 이학교;전광주
    • Journal of Animal Science and Technology
    • /
    • 제44권1호
    • /
    • pp.31-38
    • /
    • 2002
  • 양적형질 유전자좌위(Quantitative trait loci; QTL) 연관지도 작성을 위해 regression interval mapping method에 의해 Berkshire종과 Yorkshire종간 교배를 통해 생산된 $F_2$ 집단에서 실시하였다. 염색체내 QTL 위치를 결정하기 위해 regression 모델을 통해 계산된 검정통계량(F-statistic)에 대한 유의적인 threshold 수준의 설정은 permutation test 및 Lander와 kruglyak (1995)에 의해 제시된 방법으로 산출하였다. 525두 $F_2$ 개체에 대해 조사된 기록 중 5형질(도체중, 등심 단면적, 근내지방 교잡도, 콜레스테롤 함량, 척추 늑골 등지방 두께) 기록을 분석에 이용하였고 genome 전체에 걸친 125개의 microsatellite marker에 대해 3세대 집단 모두 개체에 대해 유전자형을 조사하였다. 회귀분석 모형에 따라 additive 및 dominance 효과를 추정하였으며 이때 모든 회귀계수 값과 F-검정 통계량은 각각 1cM 단위로 추정하였다. 각 형질별, 염색체별로 10,000회의 permutation에 의해 genome-wise 및 chromosome-wise threshold를 추정하였다. Lander와 Kruglyak(1995)에 의해 제시된 방법으로 산출된 threshold 값은 매우 높게 추정되어 이러한 threshold의 적용시 실제로 QTL 존재 여부를 인정할 수 있는 경우의 수가 permutation에 의해 유도된 threshold를 적용했을 때보다 상대적으로 적은 결과를 보였다. 5% genome-wise threshold의 경우 형질별로 다소 상이한 경향을 나타냈으며 분석에 활용된 5개 형질에 대해 총 4개의 QTL이 5% genome-wise 수준에서 검색되었다.

coin 패키지를 이용한 독립성 검정 (Independence tests using coin package in R)

  • 김진흠;이정동
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1039-1055
    • /
    • 2014
  • 검정통계량의 영가설 분포는 모집단 분포에 의존하는데 모집단의 분포를 모를 때 영가설 분포를 검정통계량의 조건부 분포로 대체하여 검정하는 방법을 순열 검정이라고 한다. Strasser와 Weber (1999)는 순열 검정을 통합하는 이론을 마련하였고, Hothorn 등 (2006, 2008)은 그 이론을 R에 내장된 coin 패키지에 구현하였다. coin 패키지에서 조건부 독립성 검정은 총괄적인 형태의 함수인 independence test를 통해서 할 수 있지만 대표적인 독립성 검정은 사용자가 편리하도록 간편한 함수를 별도로 제공하고 있다. 본 논문에서는 Strasser와 Weber (1999)의 순열 검정 방법에 대해 소개하고, coin 패키지에 내장된 15개의 간편 함수에 대해 independence test 함수로 변환하는 절차를 설명하고자 한다. 또한, 정의한 independence test 함수를 써서 실제 자료의 점근 분포와 순열 검정, 정확 검정에 기초한 p-값을 서로 비교하고자 한다.

전수데이터를 생성하는 빠른 콤비나토리얼 프로그램 (Fast Combinatorial Programs Generating Total Data)

  • 장재수;신재원;전홍식;서창진
    • 한국산학기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.1451-1458
    • /
    • 2013
  • 이 논문은 콤비나토리얼 문제인 조합(combination)과 순열(permutation), r-순열(r-permutation) 규칙에 의거하여 전수데이터를 생성하는 빠른 프로그램과 알고리즘을 다룬다. 이들 프로그램은 전수데이터 검사나 시뮬레이션의 입력값 선정과 같은 응용에서 사용된다. 본 연구에서는 조합, 순열, r-순열 문제의 규칙을 만족하는 프로그램들을 수집하여 부문별로 가장 빠른 프로그램을 선정하고 추가연구를 통하여 수집된 프로그램보다 수행시간을 단축한 프로그램을 완성하였다. 본 연구를 위해서 다음과 같은 선행조사가 이루어졌다. 첫째 인터넷에 공지된 백 개 이상의 프로그램을 수집하고 완성하였다. 둘째, 확보된 프로그램을 구동하여 수행시간을 측정하였고, 그 결과 가장 빠르게 수행하는 프로그램을 부분별로 발췌하였다. 셋째, 선별된 가장 빠른 프로그램에 대해서 알고리즘을 설명하고 의사코드로 정리하였다. 본 논문에서는 이러한 기초작업을 토대로 수행시간이 단축된 프로그램을 완성할 수 있었다. 첫째로 조합 문제에서는 재귀형식에서 비재귀형식으로 변형시켰고, 둘째로 r-순열 문제에서는 조합 프로그램과 순열 프로그램을 결합하는 방법으로 수행시간을 단축하였다. 분석결과에 따르면 전자와 후자는 수집한 가장 빠른 프로그램에 비해서 수행속도를 각각 22%에서 34%, 및 62%에서 226%의 범위로 개선하였다. 본 논문에서 제공한 의사코드를 바탕으로 응용에 쉽게 적용시킬 수 있으며, 전수조사 방법에 소요되는 수행시간을 예측하여 전수조사의 타당성 여부를 결정할 수 있다. 또한, 제공한 코드를 바탕으로 최소의 시간으로 전수데이터를 생성할 수 있다.