• 제목/요약/키워드: 무시할 수 있는 무응답

검색결과 6건 처리시간 0.022초

무시할 수 없는 무응답을 가지고 있는 교체표본조사에서의 무응답 대체와 교체그룹 편향 추정 (Nonignorable Nonresponse Imputation and Rotation Group Bias Estimation on the Rotation Sample Survey)

  • 최보승;김대영;김기환;박유성
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.361-375
    • /
    • 2008
  • 본 논문에서는 패널의 일부를 규칙적으로 교체하는 4-8-4 교체표본설계에서 발생할 수 있는 항목 무응답을 대체하는 방법에 대하여 연구하였다. 특히 소득이나 취업과 같이 민감한 질문에 대하여 발생할 수 있는 무응답에 대하여 무시할 수 없는 무응답(nonignorable nonresponse) 체계하에서 발생하는 무응답을 가정하였다. 무응답들의 대체방법으로 모형에 기반한 대체방법을 고려하였으며 베이지안 방법을 이용하여 사후확률밀도함수를 최대화하는 최대사후우도추정량(maximum posterior likelihood estimator)을 구하였다. 그리고 대체된 자료를 이용하여 면접시점이 달라질 때 발생하는 편향을 추정하였으며 추정된 편향을 제거한 후 연속적인 두 조사기간에서의 각 칸의 확률과 고정된 시점에서의 주변확률을 계산하였다. 모의실험을 통해 최종적으로 도출된 결과를 평균제곱오차와 편향의 관점에서 비교하였다.

이중 추출 방법을 이용한 단위 무응답의 가중치 조정방법에 관한 연구

  • 염준근;손창균;정영미
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.13-18
    • /
    • 2002
  • 이중추출(two-phase)접근방법 이용의 주목적은 관심변수와 보조변수사이의 관계를 이용해서 더 좋은 추정을 하고자 하는 것이다. 특히 이 방법은 층화, 무응답 문제에 적용하는 경우 상당히 효과적이다. 본 논문에서는 무시할 수 있는 무응답이 발생했을 때 이중추출기법을 이용해서 g-가중치와 응답확률을 각 단계별로 조정해줌으로써 무응답 보정추정량과 분산추정량을 구했다.

  • PDF

무응답을 가지고 있는 범주형 자료에 대한 모형 선택 방법 (Model selection method for categorical data with non-response)

  • 윤용화;최보승
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.627-641
    • /
    • 2012
  • 본 연구는 다차원 분할표 형태로 정리된 범주형 자료가 결측치나 무응답을 가지고 있을 때 주어진 자료를 가장 잘 설명하고 예측의 정확도를 높일 수 있는 모형의 추정과 모형의 선택 문제를 다루었다. 무시할 수 없는 무응답 (non-ignorable non-response)체계하에서 최대우도 추정에서 발생할 수 있는 변방값 문제를 해결하기 위하여 계층적 베이지안 모형을 고려하였다. 또한 모형 적도를 높이기 위한 변수 조합을 찾는 모형 선택의 문제를 함께 다루었다. 베이지안 접근하에서 모형 선택의 문제를 다루기 위하여 베이즈 인자 (Bayes factor)를 모형 선택의 기준으로 이용하였다. 제시된 방법은 2004년 실시된 우리나라 국회의원 선거를 앞두고 수행된 여론조사 데이터를 이용하여 실증분석을 수행하였다. 분석결과 무시할 수 없는 무응답 체계하에서 설명변수로 투표참여여부를 이용하는 것이 가장 적합한 모형으로 판명되었다.

대체방법별 GEE추정량 비교 (Comparison of GEE Estimators Using Imputation Methods)

  • 김동욱;노영화
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.407-426
    • /
    • 2003
  • 본 연구에서는 범주형 반복측정자료의 일반화추정방정식(GEE)모형에서 결측이 발생할 경우 결측값 대체(imputation)방법들에 대한 성능을 비교하고자 한다. 설명변수 X가 부분적으로 결측을 갖는 경우 GEE추정량을 계산할 수 없다. 본 논문에서는 시점에 따라 값이 변하는 설명변수에 결측이 있는 경우 GEE모형에서 결측값을 추정하는 7가지의 대체방법을 다루며, 실제자료와 모의실험을 통하여 대체방법별 GEE추정량의 성질을 연구한다. 대체방법별 GEE추정량의 성능을 비교하기 위해 우리는 반응변수가 범주형인 반복측정모형에서 완전자료의 GEE추정량과 완전자료에서 결측을 생성하여 결측값에 각 대체방법을 적용하여 대체한 후 구한 GEE추정량을 비교한다. 대체방법으로는 (1) 단순삭제 (2) 표본 평균대체 (3) 행 평균대체 (4) 횡 시점 회귀대체 (5) 이월대체 (6) 베이지안 붓스트랩 (7) 근사적 베이지안 붓스트랩에 대해서 살펴본다. 결측과정(missing mechanism)은 무시할 수 있는 무응답(ignorable nonresponse)을 가정하며, 결측 발생에 대해서는 원자료의 시점 무응답 패턴(wave nonresponse pattern)을 고려하여 발생시키거나 또는 시점 무응답 패턴을 고려하지 않고 단순임의추출로 결측을 발생시키는 방법을 각각 고려한다.

Monte-Carlo expectation-maximaization 방법을 이용한 무응답 모형 추정방법 (An estimation method for non-response model using Monte-Carlo expectation-maximization algorithm)

  • 최보승;유현상;윤용화
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.587-598
    • /
    • 2016
  • 각종 선거를 앞두고 여러 여론조사 기관들은 다양한 방법으로 선거 결과를 예측한다. 조사를 통한 선거 예측을 수행하는 데 있어서 발생할 수 있는 문제점 중 하나는 무응답이며 무응답 대체 방법에 따라 예측 결과는 완전히 다른 결과를 생산해 낼 수 있다. 본 연구에서는 무응답 대체의 방법으로 모형을 기반으로 한 대체 방법에 대하여 연구하였다. 특히, 최대 우도 추정 방법을 적용했을 때 무시할 수 없는 무응답 (non-ignorable non-response) 체계 하에서 발생할 수 있는 변방 값 문제를 해결하기 위해 Wei와 Tanner (1990)가 제안한 Monte Carlo EM 알고리즘을 적용하였다. 모의 실험을 통하여 MCEM 방법과 기존의 최대 우도 추정 방법, 베이지안 추정 방법 사이의 비교 연구를 진행하였고 그 결과 MCEM 방법이 기존 방법들에 대한 대안 방법으로 이용될 수 있음을 보였다. 또한 2012년에 시행된 제18대 대통령 선거 당일의 출구조사 자료를 적용하여 실증 분석을 수행하였다. 예측 결과를 비교하기 위해 Bautista 등 (2007)이 제안한 MWPE (modified within precinct error)를 이용하였다.

한국아동·청소년패널조사자료에서 단위무응답의 실태 및 가중치 적용 (The unit-nonresponse status and use of weight in the KCYPS)

  • 이화정;강석복
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1397-1405
    • /
    • 2014
  • 설문조사에서는 대부분 단위무응답 또는 항목무응답이 발생한다. 무응답 발생비율이 높은 경우 무응답을 무시한 분석은 잘못된 결과를 초래할 수도 있으므로 무응답에 대한 특성 파악도 필요하다. 횡단자료에서는 항목무응답 특성에 대한 연구는 가능하나 단위무응답의 특성을 파악하기가 어렵다. 단위무응답의 특성을 파악하기 위하여 본 논문에서는 종단자료인 한국아동 청소년패널조사 중 중1패널자료를 이용하였다. 최근까지 공개된 한국아동 청소년패널조사자료를 이용한 논문들의 무응답 처리 실태를 파악하고, 그 중 단위무응답의 특성에 대하여 분석하였다. 이 자료를 이용한 논문에서는 대부분 단위무응답의 처리를 제거하는 방식을 취하고 있으며, 이 자료에서 제공하고 있는 가중치를 이용한 논문은 거의 없었다. 이에 단위무응답의 처리방법 중 가중치를 이용한 방법과 그 대상을 제외하는 두 가지 방법에 대해 여러 가지 특성들의 분석을 비교하였다. 많은 항목에서 두 가지 방법의 결과가 상이하게 나타났으며, 가중치를 이용한 경우가 제거법에 의한 결과에 비해 통계적으로 유의한 결과가 더 많이 나타나 무응답에 대해 많은 논의가 필요할 것으로 생각된다.