• 제목/요약/키워드: statistical sample survey

검색결과 461건 처리시간 0.029초

층화확률화 응답기법에 대한 동적 최적배분 (An Dynamic Optimal Allocation for the Stratified Randomized Response Technique)

  • 손창균;홍기학;이기성
    • Communications for Statistical Applications and Methods
    • /
    • 제16권4호
    • /
    • pp.595-603
    • /
    • 2009
  • 통상적으로 표준적인 최적배분은 층별 조사비용을 고려하여 표본을 배분한다. 만일 조사단위당 비용이 서로 다를 경우 보다 현실적인 배분방법을 고려할 필요가 있다. 즉, 개별 조사단위의 특성에 따라 이익비용비를 최대로 하는 단위를 먼저 표본으로 고려하는 동적배분을 고려하였다. 이러한 관점에서 층별 표본수를 배분하고, 배분된 표본규모에 따라 임의로 표본을 선정하는 방식인 표준적인 최적배분과는 차이가 있다. 이 논문은 약물오용, 낙태, 알콜중독 등과 같은 민감한 특성을 조사하는 층화확률화 응답기법에 대해 각 층별로 표본을 배분할 경우 최적 동적배분을 고려하여 보다 현실적인 문제를 해결하고자 하였으며, 수치적 예제를 통해 동적배분 방법의 효과성을 증명하였다.

계속조사에서 응답률을 반영한 표본크기 (Sample size using response rate on repeated surveys)

  • 박현아;나성룡
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.587-597
    • /
    • 2018
  • 조사목적에 부합하는 표본 자료를 얻기 위해서는 추출방법 및 조사방법 결정, 설문지 작성 등의 절차가 필요하며 중요한 결정 중 하나가 표본크기 공식의 적용이다. 표본크기 공식은 추출방법에 따른 목표오차와 총비용 등을 설정함으로써 결정되는데 본 논문에서는 단순임의추출에서 목표오차와 예상 응답률이 주어져 있을 때 과거 및 현재 시점의 모집단의 변동과 과거 자료의 추정오차 및 응답률을 사용한 표본크기 공식을 제안한다. 실제조사에서는 설계가중치 외에도 여러 가중치가 복합적으로 적용되는 추정량을 사용하고 있는데 본 논문에서는 설계가중치와 무응답 보정계수를 사용한 추정량에서의 표본크기 공식을 유도하며 이것은 시점별 조사방법이 달라질 경우 응답률에 차이가 발생하는 현상을 반영한 공식이 될 수 있다. 또한 모의 실험을 통하여 기존의 표본크기 공식과 비교함으로써 제안된 공식의 다양한 적용방안을 살펴본다.

Sample Size Determination Using the Stratification Algorithms with the Occurrence of Stratum Jumpers

  • Hong, Taekyong;Ahn, Jihun;Namkung, Pyong
    • Communications for Statistical Applications and Methods
    • /
    • 제11권2호
    • /
    • pp.297-311
    • /
    • 2004
  • In the sample survey for a highly skewed population, stratum jumpers often occur. Stratum jumpers are units having large discrepancies between a stratification variable and a study variable. We propose two models for stratum jumpers: a multiplicative model and a random replacement model. We also consider the modification of the L-H stratification algorithm such that we apply the previous models to L-H algorithm in determination of the sample sizes and the stratum boundaries. We evaluate the performances of the new stratification algorithms using real data. The result shows that L-H algorithm for the random replacement model outperforms other algorithms since the estimator has the least coefficient of variation.

A Naive Multiple Imputation Method for Ignorable Nonresponse

  • Lee, Seung-Chun
    • Communications for Statistical Applications and Methods
    • /
    • 제11권2호
    • /
    • pp.399-411
    • /
    • 2004
  • A common method of handling nonresponse in sample survey is to delete the cases, which may result in a substantial loss of cases. Thus in certain situation, it is of interest to create a complete set of sample values. In this case, a popular approach is to impute the missing values in the sample by the mean or the median of responders. The difficulty with this method which just replaces each missing value with a single imputed value is that inferences based on the completed dataset underestimate the precision of the inferential procedure. Various suggestions have been made to overcome the difficulty but they might not be appropriate for public-use files where the user has only limited information for about the reasons for nonresponse. In this note, a multiple imputation method is considered to create complete dataset which might be used for all possible inferential procedures without misleading or underestimating the precision.

Determining the Optimal Subsampling Rate for Refusal Conversion in RDD Surveys

  • Park, In-Ho
    • Communications for Statistical Applications and Methods
    • /
    • 제16권6호
    • /
    • pp.1031-1036
    • /
    • 2009
  • Under recent dramatic declines in response rates, various procedures have been considered among survey practitioners to reduce nonresponse in order to avoid its potential impairment to the inference. In the random digit dialing telephone surveys, substantial efforts are often required to obtain the initial contact for the screener interview. To reduce a burden with higher data collection costs, refusal conversion can be administered only to a random portion of the sample, reducing nonresponse (bias) with an expense of sample variability increment due to the associated weight adjustment. In this paper, we provide ways to determine the optimal subsampling rate using a linear cost model. Our approach for refusal subsampling is to predetermine a random portion from the full sample and to apply refusal conversion efforts if needed only to the subsample.

순환표본의 결합을 위한 가중치 산출에 대한 연구 (A Study on the Construction of Weights for Combined Rolling Samples)

  • 송종호;박진우;변종석;박민규
    • 한국조사연구학회지:조사연구
    • /
    • 제11권1호
    • /
    • pp.19-41
    • /
    • 2010
  • 순환표본조사를 시행할 경우 매 순환주기별로 적절한 통계적 신뢰도를 가진 전체 모집단 특성이 추정될 수 있는 반면에, 작은 표본크기로 인하여 통계적 신뢰도가 높은 소지역 추정량의 산출은 어렵다. 따라서 소지역 추정량은 일반적으로 일정 주기 후 혹은 전체조사가 마무리된 후 독립적인 순환표본들을 결합하여 얻어진 최종표본을 통해 산출된다. 본 연구에서 는 순환표본을 결합하여 추정량을 만들 때 필요한 가중치 산출의 문제를 고려하였다. 기존의 연구들이 각 조사에 따른 경험을 바탕으로 조사별로 가능한 순환표본 결합 가중치를 정의하였으나, 본 연구에서는 모든 가능한 관심변수에 적용 가능하도록 표본설계변수에만 의존하는 모형을 설정하고 주어진 모형하에서의 최량선형불편예측치(Best Linear Unbiased Predictor: BLUP)를 고려하였다. 모의실험을 통하여 각 모형 하에서 정의되는 여러 BLUP을 비교하여 모형변화에 강건한 추정량을 제안하고 그 결과를 제4기 국민건강영양조사에 적용하였다.

  • PDF

노동통계조사를 위한 표본설계 - 매월노동통계조사, 노동력수요동향조사를 중심으로 - (A Study on the Sample Design for the Labor Statistics - Monthly Labor Statistics Survey and Labor Demand Survey -)

  • 이기재;전종우
    • 응용통계연구
    • /
    • 제10권2호
    • /
    • pp.215-226
    • /
    • 1997
  • 노동통계조사(매월노동통계조사, 노동력수요동향조사)는 사업체를 조사대상으로 임금, 근로시간, 근로자수 등을 조사하여 이들의 현황과 변동추이의 파악을 목적으로 한다. 본 연구에서는 신뢰성 높은 전국의 노동통계 산출을 위하여 산업대분류와 사업체 규모를 층화변수로 사용하였으며, 각 산업대분류내의 각 사업체 규모에서 평균임금과 상용근로자수를 정도 높게 추정할 수 있는 표본설계를 제시하였다. 또한 지역 노동통계 작성을 위해 각 시,도를 부차모집단으로 간주하여 산업대분류별, 사업체규모별로 노동통계 작성이 가능하도록 하였다.

  • PDF

Statistical micro matching using a multinomial logistic regression model for categorical data

  • Kim, Kangmin;Park, Mingue
    • Communications for Statistical Applications and Methods
    • /
    • 제26권5호
    • /
    • pp.507-517
    • /
    • 2019
  • Statistical matching is a method of combining multiple sources of data that are extracted or surveyed from the same population. It can be used in situation when variables of interest are not jointly observed. It is a low-cost way to expect high-effects in terms of being able to create synthetic data using existing sources. In this paper, we propose the several statistical micro matching methods using a multinomial logistic regression model when all variables of interest are categorical or categorized ones, which is common in sample survey. Under conditional independence assumption (CIA), a mixed statistical matching method, which is useful when auxiliary information is not available, is proposed. We also propose a statistical matching method with auxiliary information that reduces the bias of the conventional matching methods suggested under CIA. Through a simulation study, proposed micro matching methods and conventional ones are compared. Simulation study shows that suggested matching methods outperform the existing ones especially when CIA does not hold.

통계청 가구부문 조사의 표본설계 (Redesigning KNSO s Household Survey Sample)

  • 윤연옥;김규영;이명호
    • 한국조사연구학회지:조사연구
    • /
    • 제5권1호
    • /
    • pp.103-130
    • /
    • 2004
  • 통계청에서 매월 실시하는 주요 가구부문 경상조사에는 경제활동인구조사와 가계조사가 있다. 이 두 조사의 표본은 인구주택총조사 자료를 표본틀로 하여 5년마다 개편되고 있다. 이 논문에서는 2000년 인구주택총조사를 바탕으로 2002년에 실행한 표본개편에 관한 내용을 수록하였다. 이번 표본개편의 주요 개선사항으로는 연동표본(Rotation Sampling)의 도입, 도시가계조사를 전국가계조사로의 확대, 고용통계의 소지역통계 생산을 위한 기반마련이다. 또한 조사구 내의 표본가구수를 24가구에서 20가구로 축소하고, 표본 조사구수를 증가시킴으로써 정도 높은 자료를 생산할 수 있는 기반을 마련하였다. 대표성 있는 표본조사구 추출을 위한 분류지표 선정 과정에서는 지역별로 대표성이 높은 분류지표를 선정하여 대표성 있는 표본을 추출하는 데 기여하였다.

  • PDF

DATA QUALITY AND COSTS IN MEASURING TIME-RELATED UNDEREMPLOYMENT IN KOREA

  • 김설희
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.97-104
    • /
    • 2000
  • Time-related underemployment exists when a person's employment is insufficient in terms of the volume of work. Two alternative definitions can be considered based on a longer-term view or a shorter-term view and these were designed into a single questionnaire. We conducted a pilot sample survey with about 6,000 respondents in Korea. The estimates of underemployment using the two definitions show some differences given the ages, genders, industrial areas and main activities of the respondents. A larger number of people could be identified as underemployed when the longer-term view is used than when the shorter-term view is used, but there is a greater cost associated with the former. The cost-benefit of the interviewers' time was investigated by multiple visits to households. Biases and costs are also analyzed using the results of the comparison of the decrease in non-responses with the increase in the costs for the interviews.

  • PDF