• 제목/요약/키워드: Two-way contingency table

검색결과 16건 처리시간 0.019초

A Bayesian uncertainty analysis for nonignorable nonresponse in two-way contingency table

  • Woo, Namkyo;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1547-1555
    • /
    • 2015
  • We study the problem of nonignorable nonresponse in a two-way contingency table and there may be one or two missing categories. We describe a nonignorable nonresponse model for the analysis of two-way categorical table. One approach to analyze these data is to construct several tables (one complete and the others incomplete). There are nonidentifiable parameters in incomplete tables. We describe a hierarchical Bayesian model to analyze two-way categorical data. We use a nonignorable nonresponse model with Bayesian uncertainty analysis by placing priors in nonidentifiable parameters instead of a sensitivity analysis for nonidentifiable parameters. To reduce the effects of nonidentifiable parameters, we project the parameters to a lower dimensional space and we allow the reduced set of parameters to share a common distribution. We use the griddy Gibbs sampler to fit our models and compute DIC and BPP for model diagnostics. We illustrate our method using data from NHANES III data to obtain the finite population proportions.

The Changes in x2 Statistic when a Row is Deleted from a Contingency Table

  • Lee, Heesook;Kim, Honggie
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.305-317
    • /
    • 2003
  • We suggest methods to measure the changes in $x^2$ statistic when a row is deleted from a two-way contingency table. The influence function is extended and the deletion method is applied. Two examples are presented and we compare the results obtained from the influence function method and the deletion method.

Bayesian Test of Quasi-Independence in a Sparse Two-Way Contingency Table

  • Kwak, Sang-Gyu;Kim, Dal-Ho
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.495-500
    • /
    • 2012
  • We consider a Bayesian test of independence in a two-way contingency table that has some zero cells. To do this, we take a three-stage hierarchical Bayesian model under each hypothesis. For prior, we use Dirichlet density to model the marginal cell and each cell probabilities. Our method does not require complicated computation such as a Metropolis-Hastings algorithm to draw samples from each posterior density of parameters. We draw samples using a Gibbs sampler with a grid method. For complicated posterior formulas, we apply the Monte-Carlo integration and the sampling important resampling algorithm. We compare the values of the Bayes factor with the results of a chi-square test and the likelihood ratio test.

A Bayesian model for two-way contingency tables with nonignorable nonresponse from small areas

  • Woo, Namkyo;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.245-254
    • /
    • 2016
  • Many surveys provide categorical data and there may be one or more missing categories. We describe a nonignorable nonresponse model for the analysis of two-way contingency tables from small areas. There are both item and unit nonresponse. One approach to analyze these data is to construct several tables corresponding to missing categories. We describe a hierarchical Bayesian model to analyze two-way categorical data from different areas. This allows a "borrowing of strength" of the data from larger areas to improve the reliability in the estimates of the model parameters corresponding to the small areas. Also we use a nonignorable nonresponse model with Bayesian uncertainty analysis by placing priors in nonidentifiable parameters instead of a sensitivity analysis for nonidentifiable parameters. We use the griddy Gibbs sampler to fit our models and compute DIC and BPP for model diagnostics. We illustrate our method using data from NHANES III data on thirteen states to obtain the finite population proportions.

2원 분할표의 소표본 검증법 (Small sample tests for two-way contingency tables)

  • 허명회
    • 응용통계연구
    • /
    • 제10권2호
    • /
    • pp.339-352
    • /
    • 1997
  • 소표본으로부터 형성되는 2원 분할표에는 빈도가 작은 칸들이 적지 않기 때문에 대표본이론에 근거한 카이제곱 검증 등 기존 통계적 방법의 적용이 적절하지 않응 수가 있다. 이런 경우에 한 대안으로서 정확검증법(exact tests)이 개발되어 있으나 이것이 너무 많은 계산을 요구하므로 사용하기가 쉽지 않다. 본 연구는 소표본 2원 분할표에서, 단순한 몬테칼로 알로리즘에 의한 행 균일성 가설의 카이제곱 임의화 검증법(randomization test)을 제안하고 튜키(Tukey) 형의 행간 다중비교법을 제안한다. 아울러 열 범주가 순서형인 2원 분할표에 대하여도 유사한 방법론을 적용할 수 있음을 밝힌다.

  • PDF

집락자료의 분할표에서 독립성검정 (Testing Independence in Contingency Tables with Clustered Data)

  • 정광모;이현영
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.337-346
    • /
    • 2004
  • 랜덤표본에 관한 이원분할표의 독립성검정에는 통상 피어슨의 카이제곱적합도검정과 우도비검정을 사용한다. 그러나 랜덤표본이 아닌 집락자료에 관한 분할표의 경우에는 이들 검정법은 잘못된 결과를 나타낸다. 이러한 경우에는 공변량의 고정효과 외에 집락에 따른 변량효과를 함께 포함하는 일반화선형혼합모형을 고려함으로써 집락간의 이질성과 집락내의 종속성을 반영할 수 있다. 본 연구에서는 집락자료의 분할표에 대한 일반화선형혼합모형을 소개하고 실례를 통하여 이들 모형의 적합에 대해 논의한다.

Influence Functions on $ {\chi}^2$ Statistic in Contingency Tables

  • Honggie Kim;Hee-Sook Lee
    • Communications for Statistical Applications and Methods
    • /
    • 제3권2호
    • /
    • pp.69-76
    • /
    • 1996
  • In a two-way contingency table, the analyst is most interested in the hypotheses of either homogeneity or independence. For testing this as a null hypothesis, Pearson's ${\chi}^2$ statistic is most commonly used in practice. Once the null Hypothesis is rejected, he will further search forcells which caused the rejection of the null hypothesis. For this purpose, so called cell${\chi}^2$ components are used. In this paper, we derive the influence function of an obsevation to the ${\chi}^2$ statistic, with which cells with high influence can be identified.

  • PDF

주변값이 주어진 이원분할표에 대한 카이제곱 검정통계량의 소표본 분포 및 대표본 분포와의 일치성 연구 (On the Small Sample Distribution and its Consistency with the Large Sample Distribution of the Chi-Squared Test Statistic for a Two-Way Contigency Table with Fixed Margins)

  • 박철용;최재성;김용곤
    • Journal of the Korean Data and Information Science Society
    • /
    • 제11권1호
    • /
    • pp.83-90
    • /
    • 2000
  • 이원분할표의 두 범주형 변수에 대한 독립성을 검정할 때 흔히 카이제곱 검정통계량이 사용된다. 표본추출 모형이 다항이나 곱다항인 경우 이 검정통계량이 독립성 가정하에서 근사적으로 카이제곱 분포를 따르게 되는 것은 잘 알려진 사실이다. 두 주변값이 모두 주어진 경우 독립성 가정하에서 표본추출 모형은 다중 초기하분포가 되며 앞의 모형과 마찬가지로 카이제곱 통계량에 근거한 검정을 사용할 수 있다. 이 연구에서는 주변값이 주어진 경우에 카이제곱 통계량의 소표본 분포를 대표본 분포인 카이제곱 분포와 비교하고자 한다. 표본크기가 작은 몇 개의 경우에 대해 카이제곱 통계량의 소표본 분포를 직접 계산해보았다. 표본크기가 큰 몇 개의 경우는 간단한 몬테칼로 알고리듬을 통해 소표본 분포를 생성하고 카이제곱 확률도와 콜모고로브-스미노브 단일표본 검정을 이용하여 대표본 분포와의 일치성을 알아보았다.

  • PDF

상관관계에 대한 교사 지식 분석 - 2×2 분할표를 중심으로 - (An Analysis of Teachers' Knowledge about Correlation - Focused on Two-Way Tables -)

  • 신보미
    • 대한수학교육학회지:학교수학
    • /
    • 제19권3호
    • /
    • pp.461-480
    • /
    • 2017
  • 이 연구는 상관관계에 대한 교사 지식의 특징을 $2{\times}2$ 분할표를 활용하여 분석함으로써 상관관계 및 관련 개념 지도에 대한 교수학적 함의를 모색하고자 하였다. 이를 위해 $2{\times}2$ 분할표를 활용하여 상관관계에 대한 교사 지식의 특징을 알아보기 위한 지필검사 문항을 개발하였다. 지필검사 문항 개발에는 $2{\times}2$ 분할표와 관련된 선행 연구 검토를 통해 추출한 교수학적 이슈를 문항 개발의 주요 관점으로 구체화하여 반영하였다. 개발한 검사 문항을 활용하여 현직 중 고등학교 교사 53명을 대상으로 지필검사를 실시하고, 지필검사에 대한 교사들의 답변은 검사 문항 개발의 주요 관점에 비추어 분석하였다. 이러한 분석 과정을 통해 $2{\times}2$ 분할표로 주어진 변량 사이의 상관관계에 대한 교사 지식의 특징을 '내용 지식', '학생들의 이해에 대한 지식', '수업 활용 지식'의 3가지 측면에서 분석함으로써 학교 교육과정에서 상관관계 및 관련 개념을 다루는 것과 관련된 시사점을 설명하였다.

19대 대선 여론조사에서 무응답 메카니즘의 민감도 분석 (Sensitivity analysis of missing mechanisms for the 19th Korean presidential election poll survey)

  • 김성용;곽동호
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.29-40
    • /
    • 2019
  • 선거여론조사 자료의 경우 무응답이 흔히 관측되며, 이와 같이 무응답이 존재하는 범주형 자료는 불완전 분할표로 표현된다. 불완전 분할표로 표현된 선거여론조사 자료에서 후보자 지지율을 추정하는 경우, 지지율은 무응답이 어떤 메카니즘을 따르는가에 따라 다르게 추정되며, 따라서 자료가 어떠한 무응답 메카니즘을 따르는지에 대한 판별이 분석에 선행되어야 한다. 그러나 최근 연구에 따르면, 관측된 자료를 이용해서는 무응답 메카니즘을 판별할 수 없음이 밝혀졌다. 이러한 문제를 해결하기 위해 다양한 무응답 메카니즘을 반영할 수 있는 민감도 분석이 제안되었다. 그러나 기존에 제안된 민감도 분석의 경우, 이원 분할표에서 각 변수의 범주 수가 두 개인 경우만을 대상으로 한다. 우리나라 선거여론조사에서 고려되는 요인이 지역, 성, 연령 등임을 감안할 때, 기존 방법론으로 민감도 분석을 시행하기에는 한계점이 존재한다. 이에 따라 본 논문에서는 기존의 민감도 분석을 다차원 불완전 분할표에 적용할 수 있도록 확장하고, 이를 우리나라 19대 대선 여론조사 자료에 적용하였다. 분석 결과, 민감도 분석의 구간이 실제 지지율을 포함하고 있을 뿐 아니라, 다양한 무응답 메카니즘의 결과를 포괄하고 있으며, 실제 지지율과 가장 가까운 예측치의 경우 후보자에 대한 지지가 무응답의 발생에 영향을 미침을 알 수 있었다.