• 제목/요약/키워드: stratified sampling

검색결과 605건 처리시간 0.024초

국민영양조사(國民營養調査)를 위한 표본설계(標本設計) 소고(小考) (A Sample Design for National Nutrition Servey)

  • 전태윤;정기혜
    • Journal of Nutrition and Health
    • /
    • 제17권3호
    • /
    • pp.236-241
    • /
    • 1984
  • In order to make clear the relationship between sample design and sample survey in community, it was conducted research on sample design for National Nutrition Survey in 1983. In this paper it was tried to analize the data based on The Report of a Settled Population, 1981 conducted by National Bureau of Statistics Economic Planning Board. The sample was basically using stratified two-stage sampling with systematic sampling of Ban or Li as administrative unit. The population represents the whole nation excluding Jeju-do because of budget. The selection of sampling unit and sampling procedure was as follows. 1) Stratify the nation-wide area in 20 sections according to administrative districts. 2) Determine the sample size in each section according to equal proportional rate (1 / 8040) and to about 1,000 households in the sample. 3) Select the 25 sampling units by section according to households proportion. 4) Select the 10 households at random from each Ban or Li according to equal probability proportion as the final sampling unit. Using the procedure, it was sampled 1,000 households for National Nutrition Survey in 1983.

  • PDF

A Comparison of Systematic Sampling Designs for Forest Inventory

  • Yim, Jong Su;Kleinn, Christoph;Kim, Sung Ho;Jeong, Jin-Hyun;Shin, Man Yong
    • 한국산림과학회지
    • /
    • 제98권2호
    • /
    • pp.133-141
    • /
    • 2009
  • This study was conducted to support for determining an efficient sampling design for forest resources assessments in South Korea with respect to statistical efficiency. For this objective, different systematic sampling designs were simulated and compared based on an artificial forest population that had been built from field sample data and satellite data in Yang-Pyeong County, Korea. Using the k-NN technique, two thematic maps (growing stock and forest cover type per pixel unit) across the test area were generated; field data (n=191) and Landsat ETM+ were used as source data. Four sampling designs (systematic sampling, systematic sampling for post-stratification, systematic cluster sampling, and stratified systematic sampling) were employed as optimum sampling design candidates. In order to compute error variance, the Monte Carlo simulation was used (k=1,000). Then, sampling error and relative efficiency were compared. When the objective of an inventory was to obtain estimations for the entire population, systematic cluster sampling was superior to the other sampling designs. If its objective is to obtain estimations for each sub-population, post-stratification gave a better estimation. In order to successfully perform this procedure, it requires clear definitions of strata of interest per field observation unit for efficient stratification.

응답면기법을 이용한 적응적 중요표본추출법 (Adaptive Importance Sampling Method with Response Surface Technique)

  • 나경웅;김상효;이상호
    • 전산구조공학
    • /
    • 제11권4호
    • /
    • pp.309-320
    • /
    • 1998
  • 중요표본추출기법중에서도 층화표본추출법을 이용한 적응적 중요표본추출기법이 일반적으로 가장 합리적인 것으로 알려져 있다. 그러나 확률장 유한요소모형문제와 같이 기본 확률변수의 규모가 큰 경우에는 층화표본추출법에서 요구되는 기본적인 표본점의 규모가 급증하여 효율성이 떨어지게 된다. 본 연구에서는 이러한 한계성을 극복하기 위하여 층화표본추출에서 기본확률변수를 사용하는 대신에 기본확률변수들의 함수이며 새로운 확률변수인 응답값을 이용하는 방법을 개발하였다. 여기에서 응답값은 일반적인 함수형태로 표시되지 않으며, 한 번의 응답계산에 많은 계산량이 소요되므로 이러한 문제점을 해결하기 위하여 응답면식을 이용한 층화표본추출법을 개발하였다. 개발된 기법에서는 기본확률변수의 모의발생규모는 기본의 기본확률변수를 이용한 층화표본추출법에서 보다 증가하지만 매우 많은 계산량을 요구하는 실제응답해석규모는 응답면식을 이용함으로써 획기적으로 감소되었다. 특히 본 기법은 기본확률변수의 규모가 크고 대상한계상태의 파괴확률이 낮을수록 기존의 방법과 비교해 효율성이 증대되는 것으로 분석되었다.

  • PDF

적합탐색 관찰을 이용한 층화 공간표본설계에서의 추정 (Adaptive Searching Estimation in Stratified Spatial Sample design)

  • 변종석
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.353-369
    • /
    • 2000
  • 관찰 단위들간 특정한 공간 종속관계를 지닌 공간모집단에서 사각형의 칸들로 분할한 후 각 칸마다 하나의 표본점을 임의추출하여 관심 변수의 모수를 추정할 때 탐색 관찰조건을 만족하는 인접한 표본단위만을 추가 관찰하여 모수를 추정하는 적합탐색 추정 방법을 층화 공간표본설계에 적용시켜 보았다. 모의자료를 설정한 가상의 2차원 공간모집단을 층화 공간표본설계에 의해 층화시킨 후 적합 탐색 추정방법을 적용시켜 본 결과, 단순히 공간모집단을 분할하는 전통적인 공간표본설계보다 적은 수의 표본이 관찰되었으며, 효율성이 크게 감소하지 않는 결과를 얻음으로써 층화효과와 적합탐색 관찰효과가 동시에 존재하는 적절한 추정 결과를 얻을 수 있었다.

  • PDF

Development of a Sampling Strategy and Sample Size Calculation to Estimate the Distribution of Mammographic Breast Density in Korean Women

  • Jun, Jae Kwan;Kim, Mi Jin;Choi, Kui Son;Suh, Mina;Jung, Kyu-Won
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권9호
    • /
    • pp.4661-4664
    • /
    • 2012
  • Mammographic breast density is a known risk factor for breast cancer. To conduct a survey to estimate the distribution of mammographic breast density in Korean women, appropriate sampling strategies for representative and efficient sampling design were evaluated through simulation. Using the target population from the National Cancer Screening Programme (NCSP) for breast cancer in 2009, we verified the distribution estimate by repeating the simulation 1,000 times using stratified random sampling to investigate the distribution of breast density of 1,340,362 women. According to the simulation results, using a sampling design stratifying the nation into three groups (metropolitan, urban, and rural), with a total sample size of 4,000, we estimated the distribution of breast density in Korean women at a level of 0.01% tolerance. Based on the results of our study, a nationwide survey for estimating the distribution of mammographic breast density among Korean women can be conducted efficiently.

표본조사에서 일반회귀 추정량의 활용 (General Regression Estimators in Survey Sampling)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제5권2호
    • /
    • pp.49-70
    • /
    • 2004
  • 표본조사에서 사용 가능한 보조변수가 있는 경우에 추정의 효율을 높이기 위하여 보조변수를 활용하는 방법이 다각적으로 개발되어 왔다. 이 논문은 보조변수를 효과적으로 이용하는 방법 중의 하나인 일반회귀추정량에 대한 개괄적인 고찰이다. 일반회귀추정량의 출현부터 분산추정법의 제안까지 이론전개 과정을 살펴보았으며, 보정추정량 및 QR추정량과의 관련성을 통하여 일반회귀추정량의 성질을 알아보았다. 특히 분산추정에서 통상적인 설계기반 분산추정량이 가지는 조건부 성질의 약점을 보완하기 위하여 가중잔차기법을 사용하는 과정을 살펴보았다. 층화표집이나 집략표집과 같은 복합설계에서 활용할 수 있는 일반회귀추정량의 형태를 소개하였고, 마지막으로 일반회귀추정량의 장단점, 그리고 향후 이론적인 발전방향 및 실용적인 발전방향을 언급하였다.

  • PDF

출구조사의 투표소 표집방안 비교 (How to Select Polling Places in Exit Poll?)

  • 조성겸;김지연
    • 한국조사연구학회지:조사연구
    • /
    • 제5권2호
    • /
    • pp.3-30
    • /
    • 2004
  • 출구조사에서 투표소 표집방법으로는 지금까지 판단표집의 일종인 대표구 추출방법과 층화 대표구의 두 가지 방법이 주로 사용되고 있지만 아직 어느 방법이 더 효과적인가에 대해서 체계적인 연구가 이어지지 않았다. 본 연구는 지금까지 논의되어 온 네가지 투표소 추출방법 중에서 어느 방법을 사용할 때 오차가 가장 적을것인지 그리고 어느 정도의 투표소를 추출하는 것이 적절한지에 대해서 분석해 보았다. 17대 총선에서 1위와 2위간의 격차가 8% 이내로 경합을 보인 50개 선거구를 대상으로 투표소 추출방법과 추출규모를 달리했을 때 예측오차가 어떻게 달라지는가를 분석한 결과, 과거 선거결과를 토대로 투표소를 정치성향별로 정렬한 후 체계적으로 추출하는 '종단적 체계적 추출방법'이 지금까지 주로 사용되었던 대표구 혹은 층화후 대표구 방법보다 우수한 것으로 나타났다. 그리고 표집규모는 9개에서 11개 정도의 투표소 추출이 적절한 것으로 나타났다.

  • PDF

Assessment of environmental sanitation behaviour of market traders in selected markets in Ibadan, Nigeria

  • Oluwole, Daramola;Oluwaseun, Olowoporoku;Oluwafemi, Odunsi
    • Advances in environmental research
    • /
    • 제6권3호
    • /
    • pp.229-240
    • /
    • 2017
  • This paper assessed environmental sanitation behaviour of market operators in selected markets in Ibadan, Nigeria. The two largest markets in the study area (Aleshinloye and Bodija markets) were selected for sampling. The selected markets represented the two types of markets; modern and traditional markets. The modern market comprises 3803 shops while the traditional market comprises 5943 shops. Multistage sampling technique was adopted in questionnaire administration. The selected markets were stratified into zones based on the goods sold. Systematic sampling was used in the selection of traders across the markets. 2% of traders were selected for sampling in each category of goods sold making a total of 189 respondents. This comprises 77 of traders from modern market and 112 traders from traditional markets. Descriptive and Inferential statistics were used in analysing the data. Findings revealed poor access to environmental sanitation facilities especially at the traditional market. The study also established poor environmental sanitation behaviour in terms of utilisation of available amenities across both markets. It recommended a synergy of efforts by all environmentally concerned institutions in managing the market environment. It also advocated for the provision of environmental sanitation facilities in markets by, government, market management authorities, traders, Community Based Organizations (CBOs) and Non-governmental Organizations (NGOs). In addition environmental education is imperative while enforcement of environmental regulations in the market and others with similar setting is strongly encouraged.

기계학습 알고리즘의 컴퓨팅시간 단축을 위한 새로운 통계적 샘플링 기법 (A New Statistical Sampling Method for Reducing Computing time of Machine Learning Algorithms)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.171-177
    • /
    • 2011
  • 기계학습에서 모형의 정확도와 컴퓨팅시간은 중요하게 다루어지는 부분이다. 일반적으로 모형을 구축하는 데 사용되는 컴퓨팅시간은 분석에 사용되는 데이터의 크기에 비례하여 커진다. 따라서 컴퓨팅시간 단축을 위하여 분석에 사용되는 데이터의 크기를 줄이는 샘플링전략이 필요하다. 하지만 학습데이터의 크기가 작게 되면 구축된 모형의 정확도도 함께 떨어지게 된다. 본 논문에서는 이와 같은 문제를 해결하기 위하여 전체데이터를 분석하지 않아도 전체를 분석할 때와 비슷한 모형성능을 유지할 수 있는 새로운 통계적 샘플링방법을 제안한다. 주어진 데이터의 구조에 따라 최선의 통계적 샘플링기법을 선택할 수 있는 기준을 제시한다. 군집, 층화, 계통추출에 의한 통계적 샘플링기법을 사용하여 정확도를 최대한 유지하면서 컴퓨팅시간을 단축할 수 있는 방법을 보인다. 제안방법의 성능을 평가하기 위하여 객관적인 기계학습 데이터를 이용하여 전체데이터와 샘플데이터 간의 정확도와 컴퓨팅시간을 비교하였다.

항공사진(航空寫眞)을 이용(利用)한 산림조사(山林調査) 방법(方法)에 관한 연구(硏究) (A Study on Forest Inventory Method Using Aerial Photographs)

  • 이천용
    • 한국산림과학회지
    • /
    • 제60권1호
    • /
    • pp.10-16
    • /
    • 1983
  • 오스트리아 salzburg에서 약 40km 떨어진 schneegattern림(林)에서 실시(實施)한 이 조사(調査)는 적외선(赤外線) 흑백(黑白) 항공사진(航空寫眞)을 판독(判讀), 해석(解析)하여 임지(林地)를 제지(除地), 유령림(幼齡林), 너도밤나무림(林), 침엽수림(針葉樹林)으로 나누고 침엽수림(針葉樹林)은 임령별(林齡別)로 41~80년생(年生)과 81년생(年生) 이상(以上)으로 구분(區分)한 후 다시 이것을 수관밀도(樹冠密度) 60%를 기준(基準)으로 소밀(疎密)을 구분(區分)하였다. 여기서 무작위(無作爲)로 추출(抽出)한 표본점(標本點)을 현지(現地)에서 확인(確認)하고 relascope로 직경(直徑)을 조사(調査)하여 얻은 결과(結果)는 다음과 같다. 1) 침엽수림(針葉樹林)의 ha당(當) 평균축적(平均蓄積)은 $470{\pm}31.9m^3$이었다. 2) 침엽수림(針葉樹林) 40~80년생(年生)의 직경분포(直徑分布)가 이항분포(二項分布)인 반면 81년생(年生) 이상(以上) 임분(林分)은 정규분포(正規分布)이었다. 3) 5%의 표준오차내(標準誤差內)에서 $C_2$는 시화(尸化)하는 것이 27 plot의 현지(現地) 조사수(調査數)가 감소(減少)되었다. 4) 년평균(年平均) 생장량(生長量)은 $C_1$, $C_2$에 관계(關係)없이 ha당(當) $5.7m^3$으로 생장(生長)이 아주 느렸다.

  • PDF