• Title/Summary/Keyword: 분할표

Search Result 150, Processing Time 0.042 seconds

Sensitivity analysis of missing mechanisms for the 19th Korean presidential election poll survey (19대 대선 여론조사에서 무응답 메카니즘의 민감도 분석)

  • Kim, Seongyong;Kwak, Dongho
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.1
    • /
    • pp.29-40
    • /
    • 2019
  • Categorical data with non-responses are frequently observed in election poll surveys, and can be represented by incomplete contingency tables. To estimate supporting rates of candidates, the identification of the missing mechanism should be pre-determined because the estimates of non-responses can be changed depending on the assumed missing mechanism. However, it has been shown that it is not possible to identify the missing mechanism when using observed data. To overcome this problem, sensitivity analysis has been suggested. The previously proposed sensitivity analysis can be applicable only to two-way incomplete contingency tables with binary variables. The previous sensitivity analysis is inappropriate to use since more than two of the factors such as region, gender, and age are usually considered in election poll surveys. In this paper, sensitivity analysis suitable to an multi-dimensional incomplete contingency table is devised, and also applied to the 19th Korean presidential election poll survey data. As a result, the intervals of estimates from the sensitivity analysis include actual results as well as estimates from various missing mechanisms. In addition, the properties of the missing mechanism that produce estimates nearest to actual election results are investigated.

An Analysis on Demarcating Software Industry and Its Economic Effects (소프트웨어산업 구조변화에 따른 산업획정과 경제적 효과 분석)

  • Cho, B.S.;Lee, J.Y.;Cho, S.S.
    • Electronics and Telecommunications Trends
    • /
    • v.30 no.2
    • /
    • pp.59-67
    • /
    • 2015
  • 소프트웨어(이하 SW)산업은 빠른 기술개발을 바탕으로 새로운 분야가 등장하는 산업이다. 특히 최근에 SW산업이 시스템 SW, 지능형 SW 그리고 인터넷 SW 부문으로 크게 획정되면서 세 부문별로 서로 다른 성장형태를 보여주고 있다. 그러나 SW산업 환경에서 산업분석 및 경제성분석에 사용되는 산업연관분석표는 세부적 경제와 산업을 분석하는 데 한계점이 존재한다. 본 연구에서는 특정한 산업(즉 SW산업)을 몇 개의 새로운 부문(3개 부문)으로 분할하는 기존 산업연관표의 분할방법을 소개하고, 분할된 투입산출표를 이용하여 SW산업 구조분석에 적용하였다.

  • PDF

Prediction in run-off triangle using Bayesian linear model (삼각분할표 자료에서 베이지안 모형을 이용한 예측)

  • Lee, Ju-Mi;Lim, Jo-Han;Hahn, Kyu-S.;Lee, Kyeong-Eun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.2
    • /
    • pp.411-423
    • /
    • 2009
  • In the current paper, by extending Verall (1990)'s work, we propose a new Bayesian model for analyzing run-off triangle data. While Verall's (1990) work only account for the calendar year and evolvement time effects, our model further accounts for the "absolute time" effects. We also suggest a Markov Chain Monte Carlo method that can be used for estimating the proposed model. We apply our proposed method to analyzing three empirical examples. The results demonstrate that our method significantly reduces prediction error when compared with the existing methods.

  • PDF

Design of a Fast Algorithm for Computing Contingency Tables that are Used to Construct Epistasis Networks of SNPs (단일염기다형성 상위성 네트워크를 구성하기 위한 분할표를 생성하는 빠른 알고리즘의 설계)

  • Wang, Sehee;Wee, Kyubum
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.21-24
    • /
    • 2016
  • 전장유전체 연관성 연구에서 상위성 탐색은 많은 단일염기다형성 수로 인해 계산이 어렵기 때문에 네트워크에서의 탐색을 이용한 방법이 사용되고 있다. 그러나 전장유전체 연관성 연구에서 단일염기다형성들의 상위성 네트워크의 구성 역시 큰 계산 비용을 필요로 한다. 본 논문에서는 단일염기다형성과 표현형의 상호정보량을 이용한 네트워크를 구성하는데 드는 시간을 줄이는 알고리즘을 제안한다. 또한 표본 크기별로 계산 시간을 실험해 보았으며, 기존의 방법과 비교해 실행 속도가 향상됨을 보였다.

  • PDF

LAD Estimators for Categorical Data Analysis (범주형 자료 분석을 위한 LAD 추정량)

  • 최현집
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.1
    • /
    • pp.55-69
    • /
    • 2003
  • In this article, we propose the weighted LAD (least absolute deviations) estimators for multi-dimensional contingency tables and drive an estimation method to estimate the proposed estimators. To illustrate the robustness of the estimators, simulation results are presented for several models Including log-linear models and models for ordinal variables in multidimensional contingency tables. Examples were also introduced.

확률화응답에 대한 대수선형모형

  • 최경호
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.3
    • /
    • pp.725-734
    • /
    • 1997
  • 많은 사회과학 조사에서 분할표 형태로 얻어진 범주형 자료에는 오분류(misclassification)로 인한 오차가 내재되는 경우가 종종 있다. 질적속성 추정을 위한 확률화응답은 이러한 오분류 문제의 한 특수한 경우로 여겨지기도 한다. 그래서 확률화응답을 통한 범주형자료는 혼합된 분할표(mixed-up contingency table)로 여길 수 있는 바, 본 논문에서는 이에 대해 대수선형모형(log-linear model)을 설정하고 Chen과 Fienberg(1976)의 Iterative scaling procedure(ISP)에 의하여 얻어진 최우추정량의 극한을 이용하였다. 이 결과 Warner(1965) 형태의 대칭기법에 대해서는 Singh(1976)에 의하여 제안된 최우추정량과 같아지게 됨을 보임으로써 Warner에 의해서 제시된 추정량이 최우추정량으로 적절하지 않음을 확인해 보고, 무관질문기법에 대해서는 Greenberg, et al.(1969)에 의해서 제안된 추정량이 추정의 관점에서 최우추정량으로 적절하지 않음을 알아 보았다.

  • PDF

The Transform of Multidimensional Categorical Data and its Applications (다차원 범주형 자료의 변환과 그의 응용)

  • Ahn, Ju-Sun
    • The Korean Journal of Applied Statistics
    • /
    • v.20 no.3
    • /
    • pp.585-595
    • /
    • 2007
  • The squared Euclid distance of the values which is transformed by P-matrix of Ahn et al. (2003) is in proportion to the squared Euclid distance of cell's relative frequencies in two Contingency Tables. We propose the method of using the PP-values for the analysis of modern poems and questionnaire data.

15대 국회의원 소속별 의석예측에 대한 대수선형모형

  • 이재창;전명식;정형철
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.1
    • /
    • pp.65-74
    • /
    • 1997
  • 1996년 15대 국회의원 선거의 소속별 예측의석수와 실제의석수에 대한 정방형 분할표를 구하여 적절한 대수선형모형을 적합시키고 모형의 해석을 시도하였다.

  • PDF

반복조사를 통한 범주형 자료의 오분류 탐색

  • 고봉성
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.1
    • /
    • pp.75-90
    • /
    • 1997
  • 본 연구는 범주형자료의 오분류에 관한 연구로, 2$\times$2분할표의 자료에 오분류가 있다고 생각되는 조사와 반복조사를 통해 정확하게 분류한 새로운 범주형자료를 시간이라는 새변수의 결합을 통해 오분류 여부를 탐색하는 방법에 대한 연구이다.

  • PDF

A Monte Carlo Comparison of the Small Sample Behavior of Disparity Measures (소표본에서 차이측도 통계량의 비교연구)

  • 홍종선;정동빈;박용석
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.2
    • /
    • pp.455-467
    • /
    • 2003
  • There has been a long debate on the applicability of the chi-square approximation to statistics based on small sample size. Extending comparison results among Pearson chi-square Χ$^2$, generalized likelihood .ratio G$^2$, and the power divergence Ι(2/3) statistics suggested by Rudas(1986), recently developed disparity statistics (BWHD(1/9), BWCS(1/3), NED(4/3)) we compared and analyzed in this paper. By Monte Carlo studies about the independence model of two dimension contingency tables, the conditional model and one variable independence model of three dimensional tables, simulated 90 and 95 percentage points and approximate 95% confidence intervals for the true percentage points are obtained. It is found that the Χ$^2$, Ι(2/3), BWHD(1/9) test statistics have very similar behavior and there seem to be applcable for small sample sizes than others.