• 제목/요약/키워드: Multi-dimensional Contingency Tables

검색결과 5건 처리시간 0.016초

범주형 자료 분석을 위한 LAD 추정량 (LAD Estimators for Categorical Data Analysis)

  • 최현집
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.55-69
    • /
    • 2003
  • 일반적인 다차원 분할표 분석을 위해 고려 할 수 있는 로그 선형 모형 (log-linear model)과 순위 변수(ordered variables)가 고려된 여러 연관성 모형(association models)을 위한 가중값이 부여된 LAD(least absolute deviations) 추정량을 제안하고 추정을 위한 반복 추정법을 제안하였다. 모의실험을 통하여 제안된 LAD추정량이 최우추정량에 비해 로버스트한 성질을 갖는 다는 것을 밝히고, 이상칸 식별을 위해 많은 선행 연구들에서 인용된 자료들의 경험적 분석을 통해 제안된 추정량과 추정방법이 가질 수 있는 문제점과 특징에 관하여 토론하였다

분할표 분석을 위한 절사 LAD 추정량과 최적 절사율 결정 (Trimmed LAD Estimators for Multidimensional Contingency Tables)

  • 최현집
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1235-1243
    • /
    • 2010
  • 다차원 분할표를 구성하는 범주형 변수들의 연관관계를 식별하기 위하여 널리 이용되는 로그선형모형을 위한 절사 LAD(least absolute deviations) 추정방법을 제안하였다. 제안된 방법은 가중 LAD 추정을 반복하여 계산이 수행되므로 분할표 분석을 위해 적용할 수 있는 여러 연관성 모형(association models)에 직접 적용할 수 있다. 또한 붓스트랩을 이용한 최적절사율을 결정하는 방법이 갖는 공분산행렬을 과소추정하는 문제를 해결하기위한 절사율 결정 방법을 제안하였다. 모의실험을 통해 제안된 방법이 붓스트랩 방법에 비하여 항상 우수한 절사율을 보인다는 것을 설명하였으며, 제안된 방법들의 실제 자료분석 결과를 제시하였다.

다중 대응 분석에서의 영향 함수 (INFLUENCE FUNCTIONS IN MULTIPLE CORRESPONDENCE ANALYSIS)

  • Hong Gie Kim
    • 응용통계연구
    • /
    • 제7권1호
    • /
    • pp.69-74
    • /
    • 1994
  • Kim (1992)은 이차원 분할표의 단순 대응 분석에서의 영향 함수를 유도하였다. 주성분 분석에서와 마찬가지로 특정 행렬의 고유치가 대응 분석에서도 중요한 역할을 한다. 이차원 대응 분석 그림의 정확도는 가장 큰 두개의 고유치 합의 전체 고유치 합에 대한 비율로 주어지게 된다. 고유치에 미치는 영향이 큰 행이나 열을 조사함으로써 대응 분석이 개선될 수 있다. 본 논문에서는 단순 대응 분석에서의 영향 함수를 다중 대응 분석으로 확장하였다.

  • PDF

Mutual Information and Redundancy for Categorical Data

  • Hong, Chong-Sun;Kim, Beom-Jun
    • Communications for Statistical Applications and Methods
    • /
    • 제13권2호
    • /
    • pp.297-307
    • /
    • 2006
  • Most methods for describing the relationship among random variables require specific probability distributions and some assumptions of random variables. The mutual information based on the entropy to measure the dependency among random variables does not need any specific assumptions. And the redundancy which is a analogous version of the mutual information was also proposed. In this paper, the redundancy and mutual information are explored to multi-dimensional categorical data. It is found that the redundancy for categorical data could be expressed as the function of the generalized likelihood ratio statistic under several kinds of independent log-linear models, so that the redundancy could also be used to analyze contingency tables. Whereas the generalized likelihood ratio statistic to test the goodness-of-fit of the log-linear models is sensitive to the sample size, the redundancy for categorical data does not depend on sample size but its cell probabilities itself.

19대 대선 여론조사에서 무응답 메카니즘의 민감도 분석 (Sensitivity analysis of missing mechanisms for the 19th Korean presidential election poll survey)

  • 김성용;곽동호
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.29-40
    • /
    • 2019
  • 선거여론조사 자료의 경우 무응답이 흔히 관측되며, 이와 같이 무응답이 존재하는 범주형 자료는 불완전 분할표로 표현된다. 불완전 분할표로 표현된 선거여론조사 자료에서 후보자 지지율을 추정하는 경우, 지지율은 무응답이 어떤 메카니즘을 따르는가에 따라 다르게 추정되며, 따라서 자료가 어떠한 무응답 메카니즘을 따르는지에 대한 판별이 분석에 선행되어야 한다. 그러나 최근 연구에 따르면, 관측된 자료를 이용해서는 무응답 메카니즘을 판별할 수 없음이 밝혀졌다. 이러한 문제를 해결하기 위해 다양한 무응답 메카니즘을 반영할 수 있는 민감도 분석이 제안되었다. 그러나 기존에 제안된 민감도 분석의 경우, 이원 분할표에서 각 변수의 범주 수가 두 개인 경우만을 대상으로 한다. 우리나라 선거여론조사에서 고려되는 요인이 지역, 성, 연령 등임을 감안할 때, 기존 방법론으로 민감도 분석을 시행하기에는 한계점이 존재한다. 이에 따라 본 논문에서는 기존의 민감도 분석을 다차원 불완전 분할표에 적용할 수 있도록 확장하고, 이를 우리나라 19대 대선 여론조사 자료에 적용하였다. 분석 결과, 민감도 분석의 구간이 실제 지지율을 포함하고 있을 뿐 아니라, 다양한 무응답 메카니즘의 결과를 포괄하고 있으며, 실제 지지율과 가장 가까운 예측치의 경우 후보자에 대한 지지가 무응답의 발생에 영향을 미침을 알 수 있었다.