• 제목/요약/키워드: Pearson chi-squared statistics

검색결과 14건 처리시간 0.023초

Effect of Bias on the Pearson Chi-squared Test for Two Population Homogeneity Test

  • Heo, Sunyeong
    • 통합자연과학논문집
    • /
    • 제5권4호
    • /
    • pp.241-245
    • /
    • 2012
  • Categorical data collected based on complex sample design is not proper for the standard Pearson multinomial-based chi-squared test because the observations are not independent and identically distributed. This study investigates effects of bias of point estimator of population proportion and its variance estimator to the standard Pearson chi-squared test statistics when the sample is collected based on complex sampling scheme. This study examines the effect under two population homogeneity test. The standard Pearson test statistic can be partitioned into two parts; the first part is the weighted sum of ${\chi}^2_1$ with eigenvalues of design matrix as their weights, and the additional second part which is added due to the biases of the point estimator and its variance estimator. Our empirical analysis shows that even though the bias of point estimator is small, Pearson test statistic is very much inflated due to underestimate the variance of point estimator. In the connection of design-based variance estimator and its design matrix, the bigger the average of eigenvalues of design matrix is, the larger relative size of which the first component part to Pearson test statistic is taking.

Goodness-of-Fit Tests for the Ordinal Response Models with Misspecified Links

  • Jeong, Kwang-Mo;Lee, Hyun-Yung
    • Communications for Statistical Applications and Methods
    • /
    • 제16권4호
    • /
    • pp.697-705
    • /
    • 2009
  • The Pearson chi-squared statistic or the deviance statistic is widely used in assessing the goodness-of-fit of the generalized linear models. But these statistics are not proper in the situation of continuous explanatory variables which results in the sparseness of cell frequencies. We propose a goodness-of-fit test statistic for the cumulative logit models with ordinal responses. We consider the grouping of a dataset based on the ordinal scores obtained by fitting the assumed model. We propose the Pearson chi-squared type test statistic, which is obtained from the cross-classified table formed by the subgroups of ordinal scores and the response categories. Because the limiting distribution of the chi-squared type statistic is intractable we suggest the parametric bootstrap testing procedure to approximate the distribution of the proposed test statistic.

다차원 임의 분할표 생성 (Generating Multidimensional Random Tables)

  • 최현집
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.545-554
    • /
    • 2006
  • 로그선형모형에 기반을 둔 다차원 임의 분할표를 생성하는 방법을 제안하였다. 이를 위해 Lee(1997)가 제안한 선형 결합에 의한 결합분포 생성 방법을 적용하였으며, Pearson 통계량을 연관성 측도로 사용하는 것을 제안하였다. 세 변수가 서로 완전한 연관을 갖는 삼차원 결합분포를 생성할 수 있으므로 본 연구에서 제안한 방법은 사차원 이상 다차원 임의 분할표를 생성하는 문제로 확장될 수 있다.

The Chi-squared Test of Independence for a Multi-way Contingency Table wish All Margins Fixed

  • Park, Cheolyong
    • Journal of the Korean Statistical Society
    • /
    • 제27권2호
    • /
    • pp.197-203
    • /
    • 1998
  • To test the hypothesis of complete or total independence for a multi-way contingency table, the Pearson chi-squared test statistic is usually employed under Poisson or multinomial models. It is well known that, under the hypothesis, this statistic follows an asymptotic chi-squared distribution. We consider the case where all marginal sums of the contingency table are fixed. Using conditional limit theorems, we show that the chi-squared test statistic has the same limiting distribution for this case.

  • PDF

Tests for homogeneity of proportions in clustered binomial data

  • Jeong, Kwang Mo
    • Communications for Statistical Applications and Methods
    • /
    • 제23권5호
    • /
    • pp.433-444
    • /
    • 2016
  • When we observe binary responses in a cluster (such as rat lab-subjects), they are usually correlated to each other. In clustered binomial counts, the independence assumption is violated and we encounter an extra-variation. In the presence of extra-variation, the ordinary statistical analyses of binomial data are inappropriate to apply. In testing the homogeneity of proportions between several treatment groups, the classical Pearson chi-squared test has a severe flaw in the control of Type I error rates. We focus on modifying the chi-squared statistic by incorporating variance inflation factors. We suggest a method to adjust data in terms of dispersion estimate based on a quasi-likelihood model. We explain the testing procedure via an illustrative example as well as compare the performance of a modified chi-squared test with competitive statistics through a Monte Carlo study.

k-모집단 동질성검정에서 피어슨검정의 오차성분 분석에 관한 연구 (Error cause analysis of Pearson test statistics for k-population homogeneity test)

  • 허순영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.815-824
    • /
    • 2013
  • 국가단위의 조사와 같은 대규모 표본조사에서는 표본의 대표성을 확보하기 위해 층화, 집락, 계통, 불균등확률추출 등을 종합적으로 사용하는 복합표본설계가 일반화되어 있다. 이러한 복합표본설계에 기초한 범주형 자료분석에서는 자료의 독립성과 다항분포를 가정하는 전통적인 피어슨검정이 왜곡된 검정결과를 가져올 수 있다. 본 연구는 복합표본설계에 의한 범주형조사자료의 k-모집단 동질성검정에서 설계기반 일치통계량인 Wald 검정통계량을 유도하고, 전통적인 피어슨검정통계량을 사용할 경우 발생할 수 있는 오차요인을 항목별로 분해하여, 분산의 편의에 의한 영향, 추정량의 편의에 의한 영향, 기타 분산의 편의와 추정량의 편의가 교락되어 미치는 영향으로 각각 분해하는 식을 도출하였다. 또한, 도출된 식의 각 항목이 피어슨 카이제곱검정통계량에 미치는 상대적 크기를 경험적으로 확인하기 위해 국민건강영양조사 제4기 2차년도 자료를 이용해 경험분석 하였다. 분석결과, 변수에 따른 차이는 있지만 대체로 분산의 편의가 미치는 영향이 추정량의 편의가 미치는 영향보다 크다는 것을 명확히 확인할 수 있었다.

Notes on the Goodness-of-Fit Tests for the Ordinal Response Model

  • Jeong, Kwang-Mo;Lee, Hyun-Yung
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1057-1065
    • /
    • 2010
  • In this paper we discuss some cautionary notes in using the Pearson chi-squared test statistic for the goodness-of-fit of the ordinal response model. If a model includes continuous type explanatory variables, the resulting table from the t of a model is not a regular one in the sense that the cell boundaries are not fixed but randomly determined by some other criteria. The chi-squared statistic from this kind of table does not have a limiting chi-square distribution in general and we need to be very cautious of the use of a chi-squared type goodness-of-t test. We also study the limiting distribution of the chi-squared type statistic for testing the goodness-of-t of cumulative logit models with ordinal responses. The regularity conditions necessary to the limiting distribution will be reformulated in the framework of the cumulative logit model by modifying those of Moore and Spruill (1975). Due to the complex limiting distribution, a parametric bootstrap testing procedure is a good alternative and we explained the suggested method through a practical example of an ordinal response dataset.

복합표본자료에서 동질성검정을 위한 피어슨 검정통계량의 효과 (Effect of complex sample design on Pearson test statistic for homogeneity)

  • 허순영;정영애
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.757-764
    • /
    • 2012
  • 복합표본설계에 기초한 범주형 조사자료는 통상적인 피어슨 카이제곱검정에 필요한 조건을 만족하지 못한다. 그러나 많은 조사연구에서 복잡한 표본설계 방법을 적용하고 있지만, 종래의 피어슨 검정결과를 제시하고 있다. 본 연구는 복합표본설계에 의한 범주형자료의 동질성검정에 대한 실증분석을 통해, 종래의 피어슨 검정과 불편검정인 왈드검정, 표본설계를 반영한 비율추정치를 사용하는 피어슨 검정을 비교하였다. 분석결과, 종래의 피어슨검정은 표본설계를 반영하는 검정들에 비해 통계량 값이 매우 크고, 유의확률이 심각하게 작게 나타나는 것을 확인하였다. 복합표본설계를 반영하되 추정량의 분산을 아는 경우와 모르는 경우의 비교에서는 범주수, 설계효과행렬의 고유치들의 평균과 표준편차에 영향을 받는 것을 확인하였다.

Empirical Comparisons of Disparity Measures for Three Dimensional Log-Linear Models

  • Park, Y.S.;Hong, C.S.;Jeong, D.B.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.543-557
    • /
    • 2006
  • This paper is concerned with the applicability of the chi-square approximation to the six disparity statistics: the Pearson chi-square, the generalized likelihood ratio, the power divergence, the blended weight chi-square, the blended weight Hellinger distance, and the negative exponential disparity statistic. Three dimensional contingency tables of small and moderate sample sizes are generated to be fitted to all possible hierarchical log-linear models: the completely independent model, the conditionally independent model, the partial association models, and the model with one variable independent of the other two. For models with direct solutions of expected cell counts, point estimates and confidence intervals of the 90 and 95 percentage points of six statistics are explored. For model without direct solutions, the empirical significant levels and the empirical powers of six statistics to test the significance of the three factor interaction are computed and compared.

  • PDF

소표본에서 차이측도 통계량의 비교연구 (A Monte Carlo Comparison of the Small Sample Behavior of Disparity Measures)

  • 홍종선;정동빈;박용석
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.455-467
    • /
    • 2003
  • 소표본 분할표 자료에서 적합도 검정통계량들의 카이제곱 근사 적용 가능에 대하여 많은 연구가 진행되었다. 소표본에서 세 가지 검정 통계량(피어슨 카이제곱 Χ$^2$, 일반화 가능도비 G$^2$, 그리고 역발산 Ι(2/3) 검정통계량)에 관하여 비교한 Rudas(1986)의 연구를 확장하여, 최근에 제안된 차이측도(BWHD(1/9), BWCS(1/3), NED(4/3) 검정통계량)를 포함시켜 비교 분석하였다. 독립모형의 이차원 분할표, 조건부 독립모형과 한 변수 독립 모형을 따르는 삼차원 분할표에 대한 모의실험을 통하여 생성된 90과 95 백분위수와 이에 대응하는 95% 신뢰구간을 살펴보고 실제 백분위수와 비교하였다. 그 결과 Χ$^2$, Ι(2/3), 그리고 BWHD(1/9) 검정통계량이 유사한 결과를 나타내었고 이 통계량들이 기존에 제안된 검정통계량들보다 적은 표본크기에서도 카이제곱 근사방법에 적용 가능함을 발견하였다.