• 제목/요약/키워드: Survey sampling

검색결과 1,881건 처리시간 0.025초

절사층 총합추정을 위한 복합추정량 (An Alternative Composite Estimator for the Take-Nothing Stratum of the Cut-Off Sampling)

  • 황종민;신기일
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.13-22
    • /
    • 2012
  • 절사표본 추출법은 절사층, 표본층, 전수층으로 모집단을 분리한 후 표본층과 전수층의 조사결과를 이용하여 전체 모집단의 총합을 추정하는 방법이다. 이 방법은 왜도가 심한 사업체조사에서 흔히 사용하는 방법이다. 절사층의 총합 추정은 전체 모집단 총합 추정에 영향을 미치므로 절사층 총합의 정확한 추정은 매우 중요하다. 최근 김지학과 신기일 (2011)은 절사층에서 소수의 표본을 추출하여 얻은 결과와 기존의 추정량에서 얻은 결과를 선형결합하는 복합추정법을 제안하였다. 본 논문에서는 최량선형불편예측(best linear unbias predictor; BLUP)을 이용한 새로운 복합추정량을 제안하였으며 모의실험을 통하여 기존의 방법과 새로운 복합 추정량의 우수성을 비교하였다.

The Analysis of the Relationship among Physical Activity Level, Subjective Health Status, COVID-19 Fear applying the Complex Sampling Design

  • Park, Jae-Ahm
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.139-147
    • /
    • 2022
  • 본 연구는 신체활동수준, 주관적 건강상태, 코로나19 염려의 관계를 분석하는 것에 목적이 있다. 이를 위하여 2020년 지역사회건강조사를 바탕으로 전국 만 19세 이상 성인 229,269명의 설문데이터 자료를 분석하였다. 복합표본설계로 가중치, 층화변수, 집락변수를 지정하여 분석하였다. SPSS 통계분석 프로그램을 이용하여 복합표본 빈도분석, 복합표본 교차분석, 복합표본 회귀분석을 실시하고, 다음과 같은 결과를 얻었다. 첫째, 신체활동수준이 높은 그룹이 신체활동수준이 낮은 그룹에 비하여 주관적 건강상태가 높은 것으로 나타났다. 둘째, 신체활동수준이 높은 그룹이 신체활동수준이 낮은 그룹에 비하여 코로나19 염려가 낮은 것으로 나타났다. 셋째, 주관적 건강수준이 높은 그룹이 낮은 그룹에 비하여 코로나19 염려가 낮은 것으로 나타났다. 다만 본 연구에서는 실제 코로나19 감염여부는 분석에 포함하지 않았다는 제한점이 있다.

An Additive Quantitative Randomized Response Model by Cluster Sampling

  • Lee, Gi-Sung
    • 응용통계연구
    • /
    • 제25권3호
    • /
    • pp.447-456
    • /
    • 2012
  • For a sensitive survey in which the population is comprised of several clusters with a quantitative attribute, we present an additive quantitative randomized response model by cluster sampling that adapts a two-stage cluster sampling instead of a simple random sample based on Himmelfarb-Edgell's additive quantitative attribute model and Gjestvang-Singh's one. We also derive optimum values for the number of 1st stage clusters and the optimum values of observation units in a 2nd stage cluster under the condition of minimizing the variance given constant cost. We can see that Himmelfarb-Edgell's model is more efficient than Gjestvang-Singh's model under the condition of cluster sampling.

Easy and Quick Survey Method to Estimate Quantitative Characteristics in the Thin Forests

  • Mirzaei, Mehrdad;Bonyad, Amir Eslam;Bijarpas, Mahboobeh Mohebi;Golmohamadi, Fatemeh
    • Journal of Forest and Environmental Science
    • /
    • 제31권2호
    • /
    • pp.73-77
    • /
    • 2015
  • Acquiring accurate quantitative and qualitative information is necessary for the technical and scientific management of forest stands. In this study, stratification and systematic random sampling methods were used to estimation of quantitative characteristics in study area. The estimator ($((E%)^2xT)$) was used to compare the systematic random and stratified sampling methods. 100 percent inventory was carried out in an area of 400 hectares; characteristics as: tree density, crown cover (canopy), and basal area were measured. Tree density of stands was compared through systemic random and stratified sampling methods. Findings of the study reveal that stratified sampling method gives a better representation of estimates than systematic random sampling.

Self-Collection Tools for Routine Cervical Cancer Screening: A Review

  • Othman, Nor Hayati;Zaki, Fatma Hariati Mohamad
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권20호
    • /
    • pp.8563-8569
    • /
    • 2014
  • Sub-optimal participation is a major problem with cervical cancer screening in developing countries which have no organized national screening program. There are various notable factors such as 'embarrassment', 'discomfort' and 'no time' cited by women as they are often also the bread winners for the family. Implementation of self-sampling methods may increase their participation. The aim of this article was to provide a survey of various types of self-sampling tools which are commonly used in collection of cervical cells. We reviewed currently available self-sampling devices and collated the advantages and disadvantages of each in terms of its acceptance and its accuracy in giving desired results. In general, regardless of which device is used, self-sampling for cervical scrapings is highly acceptable to women in most of the studies cited.

On inference of multivariate means under ranked set sampling

  • Rochani, Haresh;Linder, Daniel F.;Samawi, Hani;Panchal, Viral
    • Communications for Statistical Applications and Methods
    • /
    • 제25권1호
    • /
    • pp.1-13
    • /
    • 2018
  • In many studies, a researcher attempts to describe a population where units are measured for multiple outcomes, or responses. In this paper, we present an efficient procedure based on ranked set sampling to estimate and perform hypothesis testing on a multivariate mean. The method is based on ranking on an auxiliary covariate, which is assumed to be correlated with the multivariate response, in order to improve the efficiency of the estimation. We showed that the proposed estimators developed under this sampling scheme are unbiased, have smaller variance in the multivariate sense, and are asymptotically Gaussian. We also demonstrated that the efficiency of multivariate regression estimator can be improved by using Ranked set sampling. A bootstrap routine is developed in the statistical software R to perform inference when the sample size is small. We use a simulation study to investigate the performance of the method under known conditions and apply the method to the biomarker data collected in China Health and Nutrition Survey (CHNS 2009) data.

표집틀 설정과 표본추출방법에 따른 정치성향 분석의 문제점: 임의번호걸기(Random Digit Dialing)과 전화번호부 추출방법 비교 (Study on Sampling Frame and Methods for Analyzing Political Attitudes : A Comparison of RDD and Direct Sampling)

  • 우정엽;김지윤;문종배
    • 한국조사연구학회지:조사연구
    • /
    • 제12권1호
    • /
    • pp.153-174
    • /
    • 2011
  • 이 연구는 현재 한국의 정치사회여론조사에서 쓰이고 있는 표집틀 설정과 표본추출방법의 문제점을 지적하고 이로 인해 발생하는 여론조사의 비정확성에 대해 논하고자 한다. 현재 한국의 여론조사기관에서 가장 보편적으로 쓰이고 있는 표본추출방법은 KT에서 제공한 전화번호부에 등재되어 있는 번호를 표집틀로 사용하는 것이다. 이러한 방법의 문제점은 전화번호부에 등재되어 있지 않은 전화번호들은 표본추출작업의 초기부터 제외된다는 것이다. 이 제외된 번호들과 등재된 번호들 간에 사회인구학적 또는 정치경제학적으로 구조적인 차이가 존재한다면, 전화번호부에 등재되어 있는 전화번호들만을 대상으로 표본을 구축하는 방법은 한국의 전체 성인 인구라는 모집단을 적절히 대변하지 못하는 문제점이 있다. 2011년 1월에 발표된 아산정책연구원의 데이터를 통해 분석한 결과, 전화번호부에 등재된 번호들과 등재되지 않은 번호들 간에는 사회인구학적, 정치경제학적인 차이가 엄연히 존재하며, 이는 대통령 지지도나 정당 지지도에도 영향을 미치는 것으로 나타났다. 본 연구에 따르면, 전화번호부에 등재된 표본은 등재되지 않은 표본에 비해 친한나라당적인 태도를 보이며 대통령 지지도도 높게 나타나는 것으로 나타났다.

  • PDF

절사표본 설계에서 비용함수를 고려한 복합추정량 (A Composite Estimator for Cut-off Sampling using Cost Function)

  • 심효선;신기일
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.43-59
    • /
    • 2014
  • 왜도가 심한 사업체 조사에서는 모집단의 일부를 제외하고 표본을 추출하는 방법인 절사표본추출법이 자주 사용된다. 절사층의 경우 표본 관리가 어렵고 조사비용이 많이 들기 때문에 이를 제외한 조사를 실시함으로써 조사의 효율을 높일 수 있다. 그러나 전체 모집단 추정을 위해서는 절사층의 정확한 총합 추정이 매우 중요하다. 최근 Hwang과 Shin (2013)은 Lavallee와 Hidiroglou (1988)가 제안한 LH 알고리즘을 이용하여 표본층을 층화한 후 표본층에서 얻어진 정보와 절사층에서 얻어진 정보를 결합한 복합추정량을 제안하였다. 본 논문에서는 비용함수를 고려한 새로운 표본 설계를 제안하고, 이를 위한 새로운 복합추정량을 제안하였다. 모의실험과 실제 자료 분석을 통하여 본 논문에서 제안한 복합추정량의 우수성을 확인하였다.

산업.직업별 고용구조 분석 및 표본설계 (Analysis and Sampling Design for Occupational Employment Statistics)

  • 류제복;손창균;박상현;남기성;이기성
    • 한국조사연구학회지:조사연구
    • /
    • 제8권2호
    • /
    • pp.91-115
    • /
    • 2007
  • 산업 직업별 고용구조조사(OES : Occupational Employment Statistics)는 국가승인통계로 산업소분류(194개) 직업세분류(392개) 수준에서의 고용구조를 파악하여 국가적 인적자원 수급정책을 위한 기본통계와 직업별 고용전망, 진로 선택, 직업훈련, 취업알선 등 노동시장 정책과 연구를 위한 기초 자료를 제공하는데 목적이 있다. 이러한 목적을 달성하기 위하여 본 연구에서는 2005년도와 2006년도에 실시된 산업 직업별 고용구조조사 자료를 특성별로 정밀 분석하고, 10% 인구주택총조사 자료를 사용하여 우리나라의 고용현황을 살펴서 이들을 바탕으로 모집단을 충분히 대표할 수 있도록 새로운 표본설계 방안을 마련하고자 한다. 표본설계방안에서는 표본배정 기준을 마련하고 아울러 가중치 부여 과정을 포함해서 추정식과 추정식의 오차계산 공식을 유도한다. 새로운 표본설계를 통해서 산업 직업별 고용구조를 보다 정확히 파악하여 국가적 인력수급 정책을 원활히 세울 수 있게 되고, 또한 고용관련 연구에도 기여를 할 것으로 기대된다.

  • PDF

무시할 수 없는 무응답에서 편향 보정을 이용한 무응답 대체 (Bias corrected imputation method for non-ignorable non-response)

  • 이민하;신기일
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.485-499
    • /
    • 2022
  • 표본오차와 비표본오차를 포함하는 총오차(total survey error)를 관리하는 것은 표본설계에서 매우 중요하다. 무응답으로 인해 발생한 비표본오차는 총오차에서 차지하는 비중이 매우 크며 이를 해결하는 방법인 무응답 대체에 관한 다수의 연구가 수행되었다. 최근 전통적 통계학 관련 기법에 추가하여 기계학습 관련 기법을 이용한 무응답 대체법이 다수 연구되고 실질적으로 사용되고 있다. 기존에 발표된 다수의 방법은 MCAR(missing completely at random) 또는 MAR(missing at random) 가정을 사용하고 있다. 그러나 관심변수에 영향을 받는 MNAR(missing not at random) 또는 무시할 수 없는 무응답(non-ignorable non-response; NN)은 편향을 발생시켜 대체 결과의 정확성을 크게 떨어뜨리지만 이에 관한 연구는 상대적으로 미미하다. 본 연구에서는 무시할 수 없는 무응답이 발생한 경우에 적용 가능한 무응답 대체법을 제안하였다. 특히 편향을 추정한 후 이를 제거하는 방법을 이용하여 무응답 대체 결과의 정확성을 향상하는 방법을 제안하였다. 또한, 모의실험을 이용하여 제안된 방법의 타당성을 확인하였다.