• 제목/요약/키워드: Contingency tables

검색결과 85건 처리시간 0.023초

우리나라 고등학생들의 상관관계 이해도 조사 (Korean High School Students' Understanding of the Concept of Correlation)

  • 노아라;유연주
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제23권4호
    • /
    • pp.467-490
    • /
    • 2013
  • 상관관계는 두 통계적 변량 사이의 관계를 이해하는 데 필요한 핵심적인 통계의 개념이다. 우리나라의 중등교육과정에서는 제7차 교육과정까지 산점도와 분할표를 이용하여 상관관계를 비형식적으로 다루도록 하였고, 2007 교육과정 이후 상관관계에 대한 내용을 삭제하였다. 이 연구에서는 비형식적인 상관관계의 교육을 받은 고등학생들의 상관관계와 관련된 이해도 및 오개념을 조사하였다. 학생들은 상관관계가 선형적 관계성에 근접한 정도를 의미하는 것을 잘 알지 못하였고 자료의 밀집된 모양이 유발하는 시각적 오개념에 취약하였다. 또한 글로 표현된 상관관계의 강도 비교에 대한 서술문의 진위성을 잘 판단하지 못하였다. 많은 학생들이 $2{\times}2$ 분할표에 제시된 범주형 자료를 보고 상대빈도수의 개념을 이용하여 연관성을 판단하지 못하였다. 우리나라 고등학생들의 상관관계 개념의 이해도가 부족하고 오개념이 빈번한 것으로 볼 때, 통계의 기본적 소양인 두 변량 사이의 상관관계에 대한 지도가 강화되어야 할 것이다.

  • PDF

다중 대응 분석에서의 영향 함수 (INFLUENCE FUNCTIONS IN MULTIPLE CORRESPONDENCE ANALYSIS)

  • Hong Gie Kim
    • 응용통계연구
    • /
    • 제7권1호
    • /
    • pp.69-74
    • /
    • 1994
  • Kim (1992)은 이차원 분할표의 단순 대응 분석에서의 영향 함수를 유도하였다. 주성분 분석에서와 마찬가지로 특정 행렬의 고유치가 대응 분석에서도 중요한 역할을 한다. 이차원 대응 분석 그림의 정확도는 가장 큰 두개의 고유치 합의 전체 고유치 합에 대한 비율로 주어지게 된다. 고유치에 미치는 영향이 큰 행이나 열을 조사함으로써 대응 분석이 개선될 수 있다. 본 논문에서는 단순 대응 분석에서의 영향 함수를 다중 대응 분석으로 확장하였다.

  • PDF

Estimation of Log-Odds Ratios for Incomplete $2{\times}2$ Tables with Covariates using FEFI

  • Kang, Shin-Soo;Bae, Je-Min
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권1호
    • /
    • pp.185-194
    • /
    • 2007
  • The information of covariates are available to do fully efficient fractional imputation(FEFI). The new method, FEFI with logistic regression is proposed to construct complete contingency tables. Jackknife method is used to get a standard errors of log-odds ratio from the completed table by the new method. Simulation results, when covariates have more information about categorical variables, reveal that the new method provides more efficient estimates of log-odds ratio than either multiple imputation(MI) based on data augmentation or complete case analysis.

  • PDF

On the Development of Statistical Software using Microsoft COM Technology on the Internet Environment

  • Han, Kyung-Soo;Kim, Seok-Ki;Choi, Sook-Hee
    • Communications for Statistical Applications and Methods
    • /
    • 제6권2호
    • /
    • pp.533-542
    • /
    • 1999
  • Widespread of internet causes rapid changes in many areas of statistics such as statistical computation and education. In this paper the efficient methods for statistical software development on the internet environment are introduced. Also the developed examples about monte-carlo permutation tests for two-way contingency tables using Microsoft COM (Component Obejct Model) technology are presented.

  • PDF

Sensitivity Analysis for Ordered Categorical Data

  • Cho, Il-Hyun;Park, Taesung
    • Communications for Statistical Applications and Methods
    • /
    • 제6권2호
    • /
    • pp.375-382
    • /
    • 1999
  • Linear-by-linear association models are commonly used to analyze ordered categorical data. To fit these models appropriate scores need to be chosen. In this paper we perform sensitivity analyses in two-way contingency tables to investigate the effect of scores on goodness-of-fits and on tests of significance. In addition we show that the best score which yields the best fit of data can be selected based on the sensitivity analysis results.

  • PDF

Suppression and Collapsibility for Log-linear Models

  • Sun, Hong-Chong
    • Communications for Statistical Applications and Methods
    • /
    • 제11권3호
    • /
    • pp.519-527
    • /
    • 2004
  • Relationship between the partial likelihood ratio statistics for logisitic models and the partial goodness-of-fit statistics for corresponding log-linear models is discussed. This paper shows how definitions of suppression in logistic model can be adapted for log-linear model and how they are related to confounding in terms of collapsibility for categorical data. Several $2{times}2{times}2$ contingency tables are illustrated.

19대 대선 여론조사에서 무응답 메카니즘의 민감도 분석 (Sensitivity analysis of missing mechanisms for the 19th Korean presidential election poll survey)

  • 김성용;곽동호
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.29-40
    • /
    • 2019
  • 선거여론조사 자료의 경우 무응답이 흔히 관측되며, 이와 같이 무응답이 존재하는 범주형 자료는 불완전 분할표로 표현된다. 불완전 분할표로 표현된 선거여론조사 자료에서 후보자 지지율을 추정하는 경우, 지지율은 무응답이 어떤 메카니즘을 따르는가에 따라 다르게 추정되며, 따라서 자료가 어떠한 무응답 메카니즘을 따르는지에 대한 판별이 분석에 선행되어야 한다. 그러나 최근 연구에 따르면, 관측된 자료를 이용해서는 무응답 메카니즘을 판별할 수 없음이 밝혀졌다. 이러한 문제를 해결하기 위해 다양한 무응답 메카니즘을 반영할 수 있는 민감도 분석이 제안되었다. 그러나 기존에 제안된 민감도 분석의 경우, 이원 분할표에서 각 변수의 범주 수가 두 개인 경우만을 대상으로 한다. 우리나라 선거여론조사에서 고려되는 요인이 지역, 성, 연령 등임을 감안할 때, 기존 방법론으로 민감도 분석을 시행하기에는 한계점이 존재한다. 이에 따라 본 논문에서는 기존의 민감도 분석을 다차원 불완전 분할표에 적용할 수 있도록 확장하고, 이를 우리나라 19대 대선 여론조사 자료에 적용하였다. 분석 결과, 민감도 분석의 구간이 실제 지지율을 포함하고 있을 뿐 아니라, 다양한 무응답 메카니즘의 결과를 포괄하고 있으며, 실제 지지율과 가장 가까운 예측치의 경우 후보자에 대한 지지가 무응답의 발생에 영향을 미침을 알 수 있었다.

Evaluation of a Solar Flare Forecast Model with Cost/Loss Ratio

  • Park, Jongyeob;Moon, Yong-Jae;Lee, Kangjin;Lee, Jaejin
    • 천문학회보
    • /
    • 제40권1호
    • /
    • pp.84.2-84.2
    • /
    • 2015
  • There are probabilistic forecast models for solar flare occurrence, which can be evaluated by various skill scores (e.g. accuracy, critical success index, heidek skill score, true skill score). Since these skill scores assume that two types of forecast errors (i.e. false alarm and miss) are equal or constant, which does not take into account different situations of users, they may be unrealistic. In this study, we make an evaluation of a probabilistic flare forecast model (Lee et al. 2012) which use sunspot groups and its area changes as a proxy of flux emergence. We calculate daily solar flare probabilities from 1996 to 2014 using this model. Overall frequencies are 61.08% (C), 22.83% (M), and 5.44% (X). The maximum probabilities computed by the model are 99.9% (C), 89.39% (M), and 25.45% (X), respectively. The skill scores are computed through contingency tables as a function of forecast probability, which corresponds to the maximum skill score depending on flare class and type of a skill score. For the critical success index widely used, the probability threshold values for contingency tables are 25% (C), 20% (M), and 4% (X). We use a value score with cost/loss ratio, relative importance between the two types of forecast errors. We find that the forecast model has an effective range of cost/loss ratio for each class flare: 0.15-0.83(C), 0.11-0.51(M), and 0.04-0.17(X), also depending on a lifetime of satellite. We expect that this study would provide a guideline to determine the probability threshold for space weather forecast.

  • PDF

상관관계에 대한 교사 지식 분석 - 2×2 분할표를 중심으로 - (An Analysis of Teachers' Knowledge about Correlation - Focused on Two-Way Tables -)

  • 신보미
    • 대한수학교육학회지:학교수학
    • /
    • 제19권3호
    • /
    • pp.461-480
    • /
    • 2017
  • 이 연구는 상관관계에 대한 교사 지식의 특징을 $2{\times}2$ 분할표를 활용하여 분석함으로써 상관관계 및 관련 개념 지도에 대한 교수학적 함의를 모색하고자 하였다. 이를 위해 $2{\times}2$ 분할표를 활용하여 상관관계에 대한 교사 지식의 특징을 알아보기 위한 지필검사 문항을 개발하였다. 지필검사 문항 개발에는 $2{\times}2$ 분할표와 관련된 선행 연구 검토를 통해 추출한 교수학적 이슈를 문항 개발의 주요 관점으로 구체화하여 반영하였다. 개발한 검사 문항을 활용하여 현직 중 고등학교 교사 53명을 대상으로 지필검사를 실시하고, 지필검사에 대한 교사들의 답변은 검사 문항 개발의 주요 관점에 비추어 분석하였다. 이러한 분석 과정을 통해 $2{\times}2$ 분할표로 주어진 변량 사이의 상관관계에 대한 교사 지식의 특징을 '내용 지식', '학생들의 이해에 대한 지식', '수업 활용 지식'의 3가지 측면에서 분석함으로써 학교 교육과정에서 상관관계 및 관련 개념을 다루는 것과 관련된 시사점을 설명하였다.

A pooled Bayes test of independence using restricted pooling model for contingency tables from small areas

  • Jo, Aejeong;Kim, Dal Ho
    • Communications for Statistical Applications and Methods
    • /
    • 제29권5호
    • /
    • pp.547-559
    • /
    • 2022
  • For a chi-squared test, which is a statistical method used to test the independence of a contingency table of two factors, the expected frequency of each cell must be greater than 5. The percentage of cells with an expected frequency below 5 must be less than 20% of all cells. However, there are many cases in which the regional expected frequency is below 5 in general small area studies. Even in large-scale surveys, it is difficult to forecast the expected frequency to be greater than 5 when there is small area estimation with subgroup analysis. Another statistical method to test independence is to use the Bayes factor, but since there is a high ratio of data dependency due to the nature of the Bayesian approach, the low expected frequency tends to decrease the precision of the test results. To overcome these limitations, we will borrow information from areas with similar characteristics and pool the data statistically to propose a pooled Bayes test of independence in target areas. Jo et al. (2021) suggested hierarchical Bayesian pooling models for small area estimation of categorical data, and we will introduce the pooled Bayes factors calculated by expanding their restricted pooling model. We applied the pooled Bayes factors using bone mineral density and body mass index data from the Third National Health and Nutrition Examination Survey conducted in the United States and compared them with chi-squared tests often used in tests of independence.