• 제목/요약/키워드: nonresponses

검색결과 10건 처리시간 0.013초

농촌생활지표조사에서 무응답 대체 : 사례 (An Imputation for Nonresponses in the Survey on the Rural Living Indicators)

  • 조영숙;천영민;황대용
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.95-107
    • /
    • 2008
  • 농촌생활지표조사는 2000년부터 농촌자원개발연구소에서 매년 실시하는 조사로서 통계청 승인통계이다. 본 연구에서는 2005년 농촌생활지표조사에 사용된 원자료를 이용하였다. 원자료에 대한 에디팅 과정을 거친 후 무응답이 포함된 개체를 제거하여 얻어진 1,582 가구를 대 상으로 하였으며 총 146문항 중에서 최종 선택되어진 15문항을 증심으로 무응답 대체를 실시하였다. 실험에 사용된 대체법과 각 대체법의 효율성은 자료의 종류에 따라 다르게 적용되었다. 먼저 연속형 자료에 대해서는 평균대체, 회귀대체, 수정된 그레이 기반 k-NN 대체(DU, DW, WU, WW) 방법을 사용하여 무응답을 대체하고 RMSB를 이용하여 실험결과를 비교하였으며, 범주형 자료에 대해서는 최빈값 이용, 확률 대체, 조건부 최빈간 이용, 조건부 학률 대체, 단순 임의 핫덱 대체 방법을 사용하여 무응답을 대체하고 정확도(Accuracy)를 이용하여 실험 결과를 비교하였다. 실험 결과에 의하면 연속형 자료에 대해서는 회귀대체 또는 그레이 기반 k-NN 대체가 적절하고, 범주형 자료에 대해서는 핫덱 대체가 가장 적절한 것으로 나타났다.

무응답을 포함하는 범주형 자료의 분석 (Analysis of categorical data with nonresponses)

  • 박태성;이승연
    • 응용통계연구
    • /
    • 제11권1호
    • /
    • pp.83-95
    • /
    • 1998
  • 본 논문에서는 여론조사를 비롯한 표본조사에서 얻어지는 범주형 자료에서 결측치(missing observation)나 무응답(nonresponse)이 발생했을 때 이러한 자료를 적절하게 처리하여 분석할 수 있는 통계모형을 소개하고 실제 사례로서 1948년도에 미국에서 실시한 대통령 선거에 대한 여론조사 자료를 분석하였다. 당시 미국 여론조사 기관에서는 Dewey 후보가 압승을 거둘 것으로 예상을 했지만 실제 선거에서는 Truman 후보가 승리했었다.

  • PDF

전화 선거여론조사에서 무응답률 증가로 인한 편의와 응답률 제고 방안 (Bias caused by nonresponses and suggestion for increasing response rate in the telephone survey on election)

  • 허순영;이수철
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.315-325
    • /
    • 2016
  • 조사결과의 신속성이 요구되는 선거여론조사의 특성상 짧은 시간에 유권자들의 의견을 파악할 수 있고 저렴한 조사비용이라는 장점 때문에 낮은 응답률이라는 심각한 결함에도 불구하고 대부분 선거여론조사는 전화조사로 이루어진다. 현재 국내에서 실시되는 많은 선거여론조사는 연령별, 성별, 지역별 인구수 또는 유권자수에 비례하여 할당된 수만큼 조사하는 방식을 취하고 있다. 무응답이 발생하여 초기에 할당된 수만큼 조사가 이루어지지 않은 경우, 응답자들의 가중치를 조정하여 추정하는 방법을 사용한다. 본 연구에서는 무응답이 존재하는 경우, 현재 국내 여론조사에서 사용하는 추정량의 편의와 분산의 편의를 수리적으로 도출하였다. 이 편의는 응답집단과 무응답집단 간의 의사 차이와 무응답률의 크기에 비례한다. 또, 2012년 대선 선거여론 조사 자료를 기초로 전화 선거여론조사에서의 응답률을 산출하였는데, 평균 약 14.4%에 불과하였다. 한편, 자체적으로 실시한 '전화 선거여론조사에 대한 의식조사'에서, 응답자들이 전화 선거여론조사에 응답하지 않는 가장 큰 이유로 "귀찮아서"를 가장 많이 선택하였고, 여론조사 응답률이 가장 낮은 20대가 가장 많이 선택한 이유도 "귀찮아서"였다. 따라서 응답률을 높이기 위해서는 인센티브를 지급하는 등 조사대상자들의 응답 동기를 높이기 위한 보다 적극적인 노력이 필요하다.

THE CALIBRATION ESTIMATION USING TWO-STEP NEWTON'S ALGORITHM IN TWO-PHASE SAMPLING

  • Son, Chang-Kyoon;Yum, Joon-Keun
    • Journal of applied mathematics & informatics
    • /
    • 제7권1호
    • /
    • pp.237-245
    • /
    • 2000
  • In this paper, we consider to the adjustment weighting procedure in the two phase sampling scheme. In general, the unit nonresponses may be occured in the final survey operation. When the unit nonresponse be generated in survey, it is able to use the auxiliary variable for estimating of interest variable. In this viewpoint, we use the two kinds level of auxiliary variable, $X_{1k}$ and $X_{2k}$ for the calibration procedure. We proprose the two-step Newton's method in the calibration estimation procedure for the two phase sampling.

A Sampling Design for Health Index Survey

  • Ryu, Jea-Bok;Lee, Kay-O;Kim, Young-Won
    • Communications for Statistical Applications and Methods
    • /
    • 제9권2호
    • /
    • pp.565-576
    • /
    • 2002
  • We propose a new sampling design for the 2001 Health Index Survey at Seoul. In this stratified two-stage sampling design, the ED(enumeration district) of 2000 Population and Housing Census is used as primary sampling unit and the Gu is used as stratification variable in order to obtain the sub-domain estimate for 25 Gu's as well as population estimate for Seoul. The sample ED's are systematically selected after the Ed's are ordered by location and property to obtain a representative sample. And also, the imputation methods for item nonresponses are suggested.

무응답 상황하에서 최적추정량에 관한 연구 (The Study on the Optimal Estimators in the Presences of Nonresponse)

  • 손창균;정훈조
    • 품질경영학회지
    • /
    • 제28권2호
    • /
    • pp.123-134
    • /
    • 2000
  • In the survey, it is very hard to get the complete response. Because the respondents tend to refuse to the questionnaire with something like incomes of the individual or may not be at home in the survey time. These nonresponses are classified into two groups as the item nonresponse and the unit nonresponse. When the nonresponse happen to the special item of the questionnaire, it is caned item nonresponse. On the other hand the unit nonresponse occurs to the totally missing in questionnaire. In this paper, we only consider to the unit nonresponse situation. We propose that the optimal estimator which is minimized the variance of the estimator under a fixed cost function for the survey and response.

  • PDF

재조사에서 효율 향상을 위한 추정법 연구 (Estimation to improve survey efficiency in callback)

  • 박현아;나성룡
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.377-385
    • /
    • 2015
  • 표본조사에서 무응답이 발생한 개체에 대해 재조사 실시한 후 보조변수를 사용한 회귀추정의 형태를 가지는 추정량을 제시하고 복제치 기법을 이용한 분산추정량을 연구한다. 또한 응답여부에 따른 응답확률의 모수적 추론방법도 함께 제시한다. 재조사 후 모평균에 대하여 불편성을 만족하고 효율이 좋은 추정량과 일치성을 가지는 분산추정량을 이론적으로 연구하고 모의실험을 통하여 연구의 타당성을 입증한다.

AN ADROIT UNRELATED QUESTION RANDOMIZED RESPONSE MODEL WITH SUNDRY STRATEGIES

  • TANVEER AHMAD TARRAY;ZAHOOR AHMAD GANIE
    • Journal of applied mathematics & informatics
    • /
    • 제41권6호
    • /
    • pp.1377-1391
    • /
    • 2023
  • When sensitive topics such as gambling habits, drug addiction, alcoholism, tax evasion tendencies, induced abortions, drunk driving, past criminal involvement, and homosexuality are the focus of open or direct surveys, it becomes challenging to obtain accurate information due to nonresponse bias and response bias. People often hesitate to provide truthful answers. Warner introduced an ingenious method to address this issue. In this study, a new and unrelated randomized response model is proposed to eliminate misleading responses and nonresponses caused by the stigma associated with the attribute being investigated. The proposed randomized response model allows for the estimation of the population percentage with the sensitive characteristic in an unbiased manner. The characteristics and recommendations of the proposed randomized response model are examined, and numerical examples are provided to support the findings of this study.

패널자료에서의 항목무응답 대체 방법 비교 (Comparison of imputation methods for item nonresponses in a panel study)

  • 이혜정;송주원
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.377-390
    • /
    • 2017
  • 설문조사를 실시할 때 응답자가 설문조사의 일부 문항에 대하여 응답하지 않는 경우 항목무응답이 발생한다. 무응답이 발생한 자료를 제외하고 완전하게 응답된 자료 만에 근거한 분석은 분석 결과에 편의가 발생할 수 있으므로, 이를 채워 넣어 완전한 형태의 자료로 분석하기 위해서 무응답 대체가 흔히 사용되고 있으며 여러 가지 무응답 대체 기법들을 비교하는 연구들도 많이 존재한다. 패널조사 연구는 연구 대상 패널에 대하여 정해진 시간에 따라 반복적으로 동일한 설문 문항에 대하여 응답을 조사하여 시간에 따른 변화를 살펴보는 조사 방법을 나타낸다. 패널조사 자료의 항목 무응답을 대체할 때 이전 시점의 응답 자료가 존재한다면 이를 포함하여 대체를 실시하는 것이 바람직한 것으로 여겨져 왔으나 이에 관한 직접적인 연구는 찾기 힘들다. 따라서 본 연구에서는 패널자료에서 이전 시점의 정보를 고려하지 않고 대체를 실시하는 방법과 이전 시점의 정보를 활용하여 대체하는 방법들 중에서 어느 대체 방법이 보다 적절한 대체를 제공하는지 살펴보았다. 특히 이전 시점의 응답 정보를 이용하는 방법인 비대체, 선형혼합모형을 이용한 대체와 선형혼합모형에 근거한 베이지안 대체 방법을 고려하였고, 이를 이전 시점의 정보를 고려하지 않는 대체 방법들 중 흔히 사용되는 평균대체, 핫덱대체 방법과 비교하였다. 모의실험 결과 선형혼합모형에 근거한 베이지 안 대체 방법이 다른 대체 방법에 비해 무응답 비율이 높아지더라도 편의도 작으며 평균에 관한 95% 신뢰구간의 포함률도 높게 나타나서 가장 좋은 대체 방법으로 확인되었다.

응답 거부와 부재율이 무응답 오차에 미치는 영향: 경제활동인구조사를 중심으로 (The Effect of Survey Refusal and Noncontact on Nonresponse Error: For Economically Active Population Survey)

  • 김서영;권순필
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.667-676
    • /
    • 2009
  • 본 논문은 조사원이 기록한 가구의 현장방문내용을 분석함으로써 응답자의 부재(noncontact)와 거부(refusal)가 무응답 오차에 미치는 영향을 살피고자 한다. 통계 자료의 품질은 무응답률과 무응답 오차에 의해 결정되고, 응답률은 통계자료의 신뢰성 평가를 위한 척도로 사용되기도 한다. 가구를 대상으로 하는 조사에서 무응답 유형은 크게 부재와 거부의 형태로 나뉘고, 이들 무응답 유형이 무응답 오차에 미치는 영향은 다르다. 이에 본 논문은 무응답 유형에 따른 무응답 편향을 측정하고, 무응답 오차에 영향을 미치는 가구의 무응답 유형을 찾는데 그 목적이 있다.