• 제목/요약/키워드: Stratified sampling

검색결과 602건 처리시간 0.022초

층화이중추출을 이용한 결합 확률화응답기법 (A Combined Randomized Response Technique Using Stratified Two-Phase Sampling)

  • 홍기학
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.303-310
    • /
    • 2004
  • 본 연구에서는 민감한 모집단에 대한 자료수집 방법으로 직접 질문 방법 인 Black-Box 방법과 간접 질문 방법인 확률화응답기법(RRT)의 결합적 방법을 제시하였고, 층화이중추출방법을 이용하여 모수를 추정하였다. 또한, 주어진 추정량의 효율성을 Mangat과 Singh 추정량과 비교 분석하였다.

지속가능한 산림경영에 적합한 표본조사 방법의 개발 (Development of a Forest Inventory System for the Sustainable Forest Management)

  • 신만용;한원성
    • 한국산림과학회지
    • /
    • 제95권3호
    • /
    • pp.370-377
    • /
    • 2006
  • 본 연구는 지속가능한 산림경영에 적합한 표본조사 방법을 제시하기 위해 계통적 추출법, 계통적 집락추출법, 그리고 층화집락추출법을 이용하여 경기도 양평군의 산림을 대상으로 자료를 수집한 후 통계검증을 실시하였다. 표본조사 방법은 계통적 집락추출법이 가장 효율적인 것으로 분석되었는데, 계통적 집락추출법을 적용할 경우 집락의 형태와 집락 내의 표본점 간의 거리를 결정하기 위해 5가지 집락의 형태와 표본점간의 거리 4가지에 대하여 통계검증을 실시하였다. 그 결과 집락의 형태는 삼각형 그리고 집락 내의 표본점 간의 거리는 50m가 가장 적합할 것으로 평가되었다.

우리나라 당뇨병의 역학적 규모와 당뇨병 관리현황 파악을 위한 표본설계의 평가 (An Evaluation of Sampling Design for Estimating an Epidemiologic Volume of Diabetes and for Assessing Present Status of Its Control in Korea)

  • 이지성;김재용;백세현;박이병;이준영
    • Journal of Preventive Medicine and Public Health
    • /
    • 제42권2호
    • /
    • pp.135-142
    • /
    • 2009
  • Objectives : An appropriate sampling strategy for estimating an epidemiologic volume of diabetes has been evaluated through a simulation. Methods : We analyzed about 250 million medical insurance claims data submitted to the Health Insurance Review & Assessment Service with diabetes as principal or subsequent diagnoses, more than or equal to once per year, in 2003. The database was re-constructed to a 'patient-hospital profile' that had 3,676,164 cases, and then to a 'patient profile' that consisted of 2,412,082 observations. The patient profile data was then used to test the validity of a proposed sampling frame and methods of sampling to develop diabetic-related epidemiologic indices. Results : Simulation study showed that a use of a stratified two-stage cluster sampling design with a total sample size of 4,000 will provide an estimate of 57.04%(95% prediction range, 49.83 - 64.24%) for a treatment prescription rate of diabetes. The proposed sampling design consists, at first, stratifying the area of the nation into "metropolitan/city/county" and the types of hospital into "tertiary/secondary/primary/clinic" with a proportion of 5:10:10:75. Hospitals were then randomly selected within the strata as a primary sampling unit, followed by a random selection of patients within the hospitals as a secondly sampling unit. The difference between the estimate and the parameter value was projected to be less than 0.3%. Conclusions : The sampling scheme proposed will be applied to a subsequent nationwide field survey not only for estimating the epidemiologic volume of diabetes but also for assessing the present status of nationwide diabetes control.

층화표본에서의 표본 배분에 대한 연구 (A Study on Sample Allocation for Stratified Sampling)

  • 이인규;박민규
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1047-1061
    • /
    • 2015
  • 층화표본추출(stratified sampling)은 모집단을 구성하는 층에 대한 정보를 표본설계에 반영함으로써 추정량의 분산을 낮추기 위한 표본추출 방법으로, 표본배분 방안의 선택이 층화표본의 효과를 결정하는데 매우 중요한 요소이다. 전통적인 표본배분 방법으로는 비례배분법(proportional allocation)과 네이만배분법(Neyman alloction)이 주로 사용되는데, 이는 층별 추정량의 분산에 영향을 미치는 요인들을 표본 배분에 반영함으로써 전체 추정량의 분산을 최적화하기 위한 것이다. 이론적으로는 층크기(size of strata)만을 반영하는 비례배분법보다 층별 표준편차(standard deviation)를 함께 고려하는 네이만배분법이 추정량의 분산을 낮추는데 더 효과적임이 알려져 있다. 그러나 층별 표준편차에 대한 사전 정보가 모집단을 잘 반영하지 못하면 네이만배분법의 효과를 기대할 수 없으며, 특히 복수의 관심변수를 조사하는 다목적조사(multi-purpose survey)에서는 각 관심변수들의 층별 표준편차가 서로 다른 양상을 나타내기 때문에 네이만배분법이 적합하지 않다는 주장이 제기되기도 한다. 한편 표본조사에서는 조사단계에서 발생하는 무응답으로 인한 추정량의 편향을 제거하기 위해 응답률 보정 방법이 사용되는데, 이 또한 추정량의 분산에 영향을 미치는 주요한 요인 중에 하나이다. 그러나 전통적인 표본배분 방법은 응답률(response rate)을 감안하지 않기 때문에 층별 응답율에 차이가 크게 나타날 경우 층화표본에 의한 효과가 저하될 수 있다. 이에 본 연구는 층화표본추출에서 층간 응답률의 차이가 추정량의 분산에 미치는 영향을 살펴보고, 층별 응답률 정보를 표본설계에 반영하는 새로운 표본배분 방법을 제안하였다. 모의실험을 통해 확인한 결과 네이만배분법은 당초 표본배분 시에 적용한 층별 표준편차의 구조가 각 층의 응답률 보정과정에서 증가하는 분산을 반영하지 못하기 때문에 층간 응답률의 편차가 커질수록 효율이 저하되는 것으로 나타났다. 반면 층 크기와 층별 응답률을 함께 반영한 배분방법은 비례배분법에 비해 효율이 개선되며, 층간 응답률의 편차가 클수록 그 효과는 커진다. 특히 층별 응답률의 변동계수(coefficient of variance)가 층별 표준편차의 변동계수를 상회하는 경우는 네이만배분법 보다도 효율적인 추정량을 제공함을 확인하였다. 아울러 응답률을 반영한 배분방법은 기존 배분방법에 비해 각 층별 추정량을 보다 안정적으로 추정할 수 있기 때문에 층별 추정을 목적으로 하는 층화표본조사에서는 여타 추정방법보다 더 효과적이다. 층별 응답률에 대한 정보는 관심변수가 다르더라도 추출틀이 유사한 기존 조사의 결과를 활용할 수 있다는 점에서 표준편차에 비해 비교적 정보 수집이 용이한 장점이 있고, 다목적조사에서도 관심변수의 척도(scale)나 개수와 관계없이 적용 가능하기 때문에 활용도가 높을 것으로 생각된다.

이단계표본추출을 이용한 소결핵병 유병률 추정 (Two-stage Sampling for Estimation of Prevalence of Bovine Tuberculosis)

  • 박선일
    • 한국임상수의학회지
    • /
    • 제28권4호
    • /
    • pp.422-426
    • /
    • 2011
  • For a national survey in which wide geographic region or an entire country is targeted, multi-stage sampling approach is widely used to overcome the problem of simple random sampling, to consider both herd- and animallevel factors associated with disease occurrence, and to adjust clustering effect of disease in the population in the calculation of sample size. The aim of this study was to establish sample size for estimating bovine tuberculosis (TB) in Korea using stratified two-stage sampling design. The sample size was determined by taking into account the possible clustering of TB-infected animals on individual herds to increase the reliability of survey results. In this study, the country was stratified into nine provinces (administrative unit) and herd, the primary sampling unit, was considered as a cluster. For all analyses, design effect of 2, between-cluster prevalence of 50% to yield maximum sample size, and mean herd size of 65 were assumed due to lack of information available. Using a two-stage sampling scheme, the number of cattle sampled per herd was 65 cattle, regardless of confidence level, prevalence, and mean herd size examined. Number of clusters to be sampled at a 95% level of confidence was estimated to be 296, 74, 33, 19, 12, and 9 for desired precision of 0.01, 0.02, 0.03, 0.04, 0.05, and 0.06, respectively. Therefore, the total sample size with a 95% confidence level was 172,872, 43,218, 19,224, 10,818, 6,930, and 4,806 for desired precision ranging from 0.01 to 0.06. The sample size was increased with desired precision and design effect. In a situation where the number of cattle sampled per herd is fixed ranging from 5 to 40 with a 5-head interval, total sample size with a 95% confidence level was estimated to be 6,480, 10,080, 13,770, 17,280, 20.925, 24,570, 28,350, and 31,680, respectively. The percent increase in total sample size resulting from the use of intra-cluster correlation coefficient of 0.3 was 22.2, 32.1, 36.3, 39.6, 41.9, 42.9, 42,2, and 44.3%, respectively in comparison to the use of coefficient of 0.2.

타겟 샘플링 검사를 통한 출하품질 향상에 관한 사례 연구 (A Case Study on the Target Sampling Inspection for Improving Outgoing Quality)

  • 김준세;이창기;김경남;김창우;송혜미;안성수;오재원;조현상;한상섭
    • 품질경영학회지
    • /
    • 제49권3호
    • /
    • pp.421-431
    • /
    • 2021
  • Purpose: For improving outgoing quality, this study presents a novel sampling framework based on predictive analytics. Methods: The proposed framework is composed of three steps. The first step is the variable selection. The knowledge-based and data-driven approaches are employed to select important variables. The second step is the model learning. In this step, we consider the supervised classification methods, the anomaly detection methods, and the rule-based methods. The applying model is the third step. This step includes the all processes to be enabled on real-time prediction. Each prediction model classifies a product as a target sample or random sample. Thereafter intensive quality inspections are executed on the specified target samples. Results: The inspection data of three Samsung products (mobile, TV, refrigerator) are used to check functional defects in the product by utilizing the proposed method. The results demonstrate that using target sampling is more effective and efficient than random sampling. Conclusion: The results of this paper show that the proposed method can efficiently detect products that have the possibilities of user's defect in the lot. Additionally our study can guide practitioners on how to easily detect defective products using stratified sampling

기관패널 표집설계를 통한 훈련 교·강사 실태조사 방안 연구 (A Study on the Survey of Vocational Training Teachers and Instructors through Institutional Panel Sampling Design)

  • 정혜경;정일찬;이진구
    • 실천공학교육논문지
    • /
    • 제13권2호
    • /
    • pp.393-403
    • /
    • 2021
  • 본 연구의 목적은 훈련 교·강사를 모집단으로 데이터 기반 의사결정을 위한 토대를 마련하고자 직업훈련기관 수준에서의 패널조사 표집설계 방안을 제시하여 지속적이고 체계적인 훈련 교·강사 실태조사의 기초를 제공하는데 있다. 이에 본 연구에서는 체계적인 조사 설계를 위한 요소인 목표 모집단과 표본추출틀을 제안하였으며, 전문가 자문과 실증 자료 분석을 토대로 데이터의 대표성, 자료 수집의 효율성 및 지속가능성 등을 종합적으로 고려하여 표본추출단위, 외층변인과 내층변인을 고려한 표본추출방법 등을 제시하였다. 연구 결과 패널의 단위를 직업훈련기관으로 하여 패널로 선정된 기관과 그 기관에 소속된 훈련 교·강사가 설문조사에 참여할 수 있도록 2단계 층화 비례 표집 방안을 마련하였으며, 이를 바탕으로 패널조사 표본 설계 방안에 대한 시사점을 제시하였다.

다단추출 표본설계의 층효율성 연구 (Measuring stratification effects for multistage sampling)

  • 김태훈;이기재;박인호
    • 응용통계연구
    • /
    • 제36권4호
    • /
    • pp.337-347
    • /
    • 2023
  • 표본설계는 개체 혹은 집락을 층으로 나눈후 층별로 독립적으로 표본추출하는 층화추출을 종종 채택한다. 층화 전략은 크게 층구분과 표본할당으로 구성되는데 이는 조사연구에서 반복적으로 고려되는 중요한 주제이다. 조사연구에서는 층화다단추출 방식의 복합표본설계를 채택하고 있지만 층효과 혹은 층효율성과 관련하여서 표본론 교재들에서 주로 단순추출에 대해서 다루어지고 있다. 본 연구는 이단추출에 대한 기존 층효율성 측도를 살펴보며 설계효과모형을 적용한 추가적인 층효율성 측도들을 제안하였다. 제안된 측도들을 활용하여 제4기 국민환경기초조사의 고등학교 대상 표본설계의 층화전략에 대해 평가하였다.

Maximizing the Overlay of Sample Units for Two Stratified Designs by Linear Programming

  • Ryu, Jea-Bok;Kim, Sun-Woong
    • Communications for Statistical Applications and Methods
    • /
    • 제8권3호
    • /
    • pp.719-729
    • /
    • 2001
  • Overlap Maximization is a sampling technique to reduce survey costs and costs associated with the survey. It was first studied by Keyfitz(1951). Ernst(1998) presented a remarkable procedure for maximizing the overlap when the sampling units can be selected for two identical stratified designs simultaneously, But the approach involves mimicking the behaviour of nonlinear function by linear function and so it is less direct, even though the stratification problem for the overlap corresponds directly to the linear programming problem. furthermore, it uses the controlled selection algorithm that repeatedly needs zero-restricted controlled roundings, which are solutions of capacitated transportation problems. In this paper we suggest a comparatively simple procedure to use linear programming in order to maximize the overlap. We show how this procedure can be implemented practically.

  • PDF

층화 확률화 응답 기법 (A Stratified Randomized Response Technique)

  • Ki Hak Hong;Jun Keun Yum;Hwa Young Lee
    • 응용통계연구
    • /
    • 제7권1호
    • /
    • pp.141-147
    • /
    • 1994
  • 범죄의 성향이나 도박, 마약 복용 실태 등과 같은 사회적으로나 개인적으로 매우 민감한 문제에 대한 조사에서 세대별 또는 계층별로 상당히 차이가 나는 경우에 단순임의 추출법에 의한 Warner의 확률화 응답 기법보다 효율적인 층화 임의 추출법에 의한 층화 확률화 응답 기법을 제시하고 그 효율성을 증명하였다.

  • PDF