• 제목/요약/키워드: statistic

검색결과 2,204건 처리시간 0.021초

A Jarque-Bera type test for multivariate normality based on second-power skewness and kurtosis

  • Kim, Namhyun
    • Communications for Statistical Applications and Methods
    • /
    • 제28권5호
    • /
    • pp.463-475
    • /
    • 2021
  • Desgagné and de Micheaux (2018) proposed an alternative univariate normality test to the Jarque-Bera test. The proposed statistic is based on the sample second power skewness and kurtosis while the Jarque-Bera statistic uses sample Pearson's skewness and kurtosis that are the third and fourth standardized sample moments, respectively. In this paper, we generalize their statistic to a multivariate version based on orthogonalization or an empirical standardization of data. The proposed multivariate statistic follows chi-squared distribution approximately. A simulation study shows that the proposed statistic has good control of type I error even for a very small sample size when critical values from the approximate distribution are used. It has comparable power to the multivariate version of the Jarque-Bera test with exactly the same idea of the orthogonalization. It also shows much better power for some mixed normal alternatives.

Goodness-of-fit tests for a proportional odds model

  • Lee, Hyun Yung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1465-1475
    • /
    • 2013
  • The chi-square type test statistic is the most commonly used test in terms of measuring testing goodness-of-fit for multinomial logistic regression model, which has its grouped data (binomial data) and ungrouped (binary) data classified by a covariate pattern. Chi-square type statistic is not a satisfactory gauge, however, because the ungrouped Pearson chi-square statistic does not adhere well to the chi-square statistic and the ungrouped Pearson chi-square statistic is also not a satisfactory form of measurement in itself. Currently, goodness-of-fit in the ordinal setting is often assessed using the Pearson chi-square statistic and deviance tests. These tests involve creating a contingency table in which rows consist of all possible cross-classifications of the model covariates, and columns consist of the levels of the ordinal response. I examined goodness-of-fit tests for a proportional odds logistic regression model-the most commonly used regression model for an ordinal response variable. Using a simulation study, I investigated the distribution and power properties of this test and compared these with those of three other goodness-of-fit tests. The new test had lower power than the existing tests; however, it was able to detect a greater number of the different types of lack of fit considered in this study. I illustrated the ability of the tests to detect lack of fit using a study of aftercare decisions for psychiatrically hospitalized adolescents.

랜덤포레스트의 크기 결정을 위한 간편 진단통계량 (A simple diagnostic statistic for determining the size of random forest)

  • 박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.855-863
    • /
    • 2016
  • 이 연구에서는 RF (random forest)의 크기 결정을 위한 간편 진단통계량을 제안한다. 이 방법은 현재까지 생성된 의사결정나무의 1등과 2등인 집단이 무한히 생성된 의사결정나무에서 차지하는 승리표차인 MV (margin of victory)에 근거한다. 따라서 MV가 음수이면 현재의 RF와 무한 RF 사이에 괴리가 생기는 것을 의미한다. 이 연구에서 제안하는 방법은 -MV가 고정된 작은 양수 (예를 들면 0.03)보다 큰 개체의 비율에 근거한다. 이 방법에 의한 적절한 통계량 도출과 함께 이 통계량의 이론적인 분포를 유도한다. 또한 최근에 제안된 진단통계량과 성능을 비교하는 모의실험을 수행한다.

3 ${\times}$ 3 라틴방격모형의 검정력 분석 (Power analysis for 3 ${\times}$ 3 Latin square design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.401-410
    • /
    • 2009
  • 두 블럭인자와 하나의 주인자로 구성된 3 ${\times}$ 3 라틴방격모형의 특성으로 인하여 주효과를 검정하기 위한 순위변환 통계량의 검정력은 모집단의 분포유형에 상관없이 모수적 통계량의 검정력보다 전반적으로 월등히 높은 수준이다. 특히 세인자가 모두 고정인 경우, 하나의 블럭인자만이 랜덤인 경우, 두 블럭인자가 모두 랜덤인 경우의 순서로 주효과를 검정하기 위한 순위변환 통계량의 검정력이 모수적 통계량의 검정력에 비하여 상대적으로 높다. 또한 검정하고자 하는 주효과의 크기가 크되 동시에 동일크기의 하나의 블럭효과 및 또다른 블럭효과 크기는 상대적으로 작을수록 주효과를 검정하기 위한 순위변환 통계량의 검정력은 모수적 통계량의 검정력보다 상대적 우위성을 갖는다.

  • PDF

스캔 통계량의 발전 과정과 응용에 대한 고찰 (A review on the development of a scan statistic and its applications)

  • 김병수;김기한
    • 응용통계연구
    • /
    • 제6권1호
    • /
    • pp.125-143
    • /
    • 1993
  • 관측치가 (0, T]의 구간에서 균일하게 분포한다는 가설에 대하여, 관측치의 집락화를 검정하는 과정에서 스캔 통계량을 사용할 수 있다. 본 논문에서는 스캔 통계량의 확률분포의 근사분포가 어떠한 이론적 배경으로 개선되어 왔는 지를 고찰하고, 실제로 응용된 예를 살펴보기로 한다. 광물 매장을 조사하기 위한 항공탐사, 두 개의 아미노산 염기서열(amino-acid sequence)을 비교하는 과정에서 스캔 통계량은 사용되어 왔다. 지놈(genome)의 連鎖(sequence)에서 돌연변이가 발생한 위치에 대하여 집락의 가능성을 검색하는 방법으로 스캔 통계량을 이용할 수 있음을 보이고, 이에 대한 구체적인 문제 구성은 추후 연구과제로 제시한다.

  • PDF

블럭이 존재하는 $2{\times}2$ 요인모형의 검정력 분석 (Power analysis for $2{\times}2$ factorial in randomized complete block design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.245-253
    • /
    • 2011
  • 블럭이 존재하는 $2{\times}2$ 요인모형의 주 효과 및 상호작용효과를 검정하기 위한 순위변환 통계량의 검정력은 블럭크기, 효과들의 구성방법 및 지수분포, 이중지수분포, 정규분포, 균일 분포를 포함한 모든 모집단 분포하에서 모수적 통계량의 검정력보다 월등한 우위를 보인다. 이는 블럭이 추가된 요인 모형은 블럭과 요인의 상호작용들이 오차항을 증가시켜 모수적 통계량의 검정력을 감소시키는 보수적 성향을 보이나, 순위변환 통계량의 검정력은 상대적 우위를 유지함에 기인한다고 유추할 수 있다. 일반적으로 블럭크기가 작고, 효과크기가 클수록 순위변환 통계량의 검정력은 모수적 통계량의 검정력보다 상당히 큰 격차의 상대적 우위를 보임을 알 수 있다.

4 $\times$ 4 균형불완전블럭모형의 순위변환분석 (Rank transformation analysis for 4 $\times$ 4 balanced incomplete block design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.231-240
    • /
    • 2010
  • 4 $\times$ 4 균형불완전블럭모형에서 고정효과만이 존재하는 경우 주효과를 검정하기 위한 순위변환 통계량의 검정력은 적은 반복수에도 가장 높은 수준을 유지하며, 지수분포와 이중지수분포하에서는 모수적 통계량의 검정력보다 큰 격차의 상대적 우위를 보인다. 특히 전형적인 균형불완전블럭모형하에서 주인자는 고정이며 블럭인자는 랜덤인 경우의 순위변환 통계량의 검정력은 주효과의 효과크기 및 블럭효과의 모집단 분포와 모수크기에 상관없이 모든 상황에 걸쳐 현저하게 높은 우위성를 보인다. 또한 반복수가 증가함에따라 순위변환 통계량의 검정력은 빠른 속도로 증가한다. 전체적인 주효과의 순위변환 통계량의 검정력 우위는 하나의 주효과 및 블럭효과와 결측값이 존재하는 균형불완전블럭모형의 고유특성으로 말미암아 고정효과 및 표본의 작은 크기변화에 민감하게 반응하며 상대적 검정력 우위를 갖는다고 볼 수 있다.

4 × 4 그레코라틴방격모형의 검정력 연구 (Power study for 4 × 4 graeco-latin square design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.683-691
    • /
    • 2012
  • $4{\times}4$ 그레코라틴방격모형은 모집단의 분포에 상관없이 주효과 검정을 위한 순위변환 통계량의 검정력이 모수적 통계량의 검정력보다 전체적으로 높은 우위성을 갖는다. 효과크기가 균등간격이 아닌 경우에 주효과 검정을 위한 순위변환 통계량의 검정력은 효과크기가 균등간격인 경우보다 다소 낮지만 모수적 통계량의 검정력에 비하여 월등한 비교우위를 갖는다. 순위변환 통계량의 검정력은 블럭효과의 수가 줄어들거나 효과크기가 작아질수록 모수적 통계량의 검정력보다 월등히 우세함을 보인다. 블럭효과들이 존재할 때는 주효과에 비하여 블럭효과들이 모두 작거나 하나의 블럭효과에 편중된 경우에 순위변화 통계량의 검정력이 모수적 통계량의 검정력보다 더욱 우수하다. 이는 상호작용없이 다인자인 네 개의 주인자 및 블럭인자만으로 구성된 그레코라틴방격모형의 특성에 의한 결과로, 앞으로 구체화하지 못한 다인자로 구성된 요인실험계획모형 등에 확대 적용할 순위변환기법의 가능성을 제시한다.

4 × 4 라틴방격모형 내 2 × 2 요인모형의 검정력 연구 (Power study for 2 × 2 factorial design in 4 × 4 latin square design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1195-1205
    • /
    • 2014
  • 반복이 존재하는 $4{\times}4$ 라틴방격모형 내 $2{\times}2$ 요인모형의 주효과 및 상호작용효과를 검정하기 위한 순위변환 통계량의 검정력은 단일모형에 비하여 효과크기 및 반복크기가 커질수록 빠르게 증가한다. 일반적으로 다양한 효과구성 및 모든 오차항 분포와 상관없이 검정하고자 하는 요인 이외의 효과가 존재하는 요인 수가 적고 효과크기가 작을수록 순위변환 통계량의 검정력은 뛰어나다. 특히 오차항이 지수분포 및 이중지수분포일 때 순위변환 통계량의 검정력은 모수적 통계량의 검정력보다 상대적으로 높은 비교우위를 보이며, 정규분포 및 균일분포에서는 전반적으로 별다른 차이가 없다. 이는 두개의 주효과, 한개의 상호작용효과 및 두개의 블럭효과 등의 다섯 가지 효과가 동시에 존재하는 다인자로 구성된 라틴방격과 요인모형의 결합형태의 특이성으로 인한 결과이다.

3×3 분할요인모형의 검정력 비교연구 (Power comparison for 3×3 split plot factorial design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.143-152
    • /
    • 2017
  • 블럭내의 완전랜덤화 제약은 하나의 블럭이 여러 실험구로 분할되는 분할요인모형으로 해결할 수 있다. 본 연구는 $3{\times}3$ 분할요인모형에서 두 주요인 및 하나의 블럭이 모두 고정일 경우에는, 실제로 존재하는 효과크기가 작을수록 혹은 검정대상의 요인효과 크기보다 검정대상 이외의 효과들의 크기가 상대적으로 작을수록 주구요인효과 및 세구요인효과 검정을 위한 순위변환 통계량의 검정력은 기존의 모수적 통계량의 검정력보다 뛰어남을 알 수 있다. 또한 모집단 모형의 오차항이 지수분포 및 이중지수분포일 때 효과크기 및 효과구성유형에 상관없이 거의 모든 상황하에서 순위변환 통계량의 검정력이 모수적 통계량의 검정력보다 상대적으로 높은 우위를 보이며, 정규분포 및 균일분포하에서는 상당히 유사한 수준을 나타낸다. 한편 두 주요인은 고정이나 하나의 블럭이 랜덤일 경우에는, 두 주요인 및 블럭이 모두 고정일 경우보다 모수적 통계량 및 순위변환 통계량의 검정력은 각각 낮은 수준을 보인다. 특히 주구요인효과 검정보다 세구요인효과 검정을 위한 모수적 통계량 및 순위변환 통계량의 검정력이 다소 낮은 수준임을 보이지만, 순위변환 통계량의 검정력은 모수적 통계량의 검정력에 비하여 높은 상대적 검정력 우위를 나타낸다.