• 제목/요약/키워드: 표본의 수

검색결과 3,539건 처리시간 0.029초

가설검정과 신뢰구간의 재현성 (Reproducibility of Hypothesis Testing and Confidence Interval)

  • 허명회
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.645-653
    • /
    • 2014
  • p-값은 관측 표본과 관측 결과보다 심하게 대안가설의 방향으로 영가설을 이탈하는 표본들이 영가설 하에서 갖는 확률이다. p-값이 일정 ${\alpha}$(= 0:05)보다 작게 나타나면 연구자는 대안가설이 지지된 것으로 본다. 그런 경우라고 하더라도 그의 가설이 향후 연구에서 번복될 수 있는데 그 이유는 p-값이 표본에 따라 변동하는 통계량이기 때문이다. Boos와 Stefanski (2011)는 붓스트랩 방법으로 p-값의 예측분포를 구할 수 있음을 보였다. 그들은 그 분포의 상위 10-20% 분위수가 ${\alpha}$보다 작은가를 확인할 필요가 있음을 강조한다. 만약 그렇지 않은 경우에는 "지지"된 가설의 재현성이 문제될 수 있기 때문이다. 가설검정에서 일정 수준의 재현율을 확보하기 위해서는 표본의 증대가 요구된다. 이 연구는 k배 확대 붓스트랩 표본추출(boosted bootstrap sampling)로써 필요한 표본크기를 계산할 수 있음을 두 표본의 비교와 다중선형회귀의 수치 예에서 보인다. k 값을 정하기 위해서는 몇 차례 시행착오를 해야 하지만 계산적 부담은 크지 않다. 95% 신뢰구간은 독립적인 표본들로부터 같은 방식으로 산출되는 구간이 미지의 모수를 포함할 확률이 95%가 되도록 설정된다. 이 연구는 한 관측표본으로부터 얻어진 95% 신뢰구간 내 개별 점이 미래 연구의 신뢰구간에도 포함될 것인지 그 재현성을 붓스트랩 재표본들에서 평가한다. 이 연구는 개별 점에서 산출한 신뢰구간 재현율을 그래프로 보인다.

농업 기본통계 및 가축통계 조사 標本設計에 관한 연구 (A study on a multi-purpose sampling design involving both a farm population survery and a livestock survey)

  • 박홍래
    • 응용통계연구
    • /
    • 제1권1호
    • /
    • pp.12-20
    • /
    • 1987
  • 본 연구는 한 개의 표본에서 농업 基本統計와 家畜統計 조사를 다같이 실시하는 多目的 표본설계에 관한 연구를 목적으로 한다. 본 연구의 특징은 첫째 全國 및 道別 추정오차를 작게 하는 동시에 市郡별 추정오차를 균등하게 유지하도록 시도하였고, 둘째 任意標本과 有意標本을 결합하여 표본의 효율을 높이는 방법을 제안하였다. 유의표본은 農家 유의표본과 調査區 유의표본으로 구분하였고, 이들 유의표본 선정에 있어서 추정치의 精度를 높일 수 있는 선정 기준에 관하여 고찰하였다.

  • PDF

위해평가 및 모니터링 수행을 위한 표본크기 추정연구: 식품 중 중금속 모니터링 데이터를 중심으로 (Sample Size Estimation for Risk Assessment and Monitoring Based on Heavy Metal Monitoring Data from Food Items)

  • 강희승;고아라;정다현;하미라;황명실;홍진환;황인균;윤혜정
    • 한국식품위생안전성학회지
    • /
    • 제30권2호
    • /
    • pp.127-131
    • /
    • 2015
  • 본 연구에서는 기존에 수행된 식품 중금속 모니터링 데이터를 이용하여 위해평가 및 모니터링을 수행할 때 요구되는 표본 수를 추정하고자 하였다. 중금속 3종 (카드뮴, 납 및 수은)과 17개의 식품을 대상으로 2,400개의 모니터링 데이터를 선정하여 연구에 활용하였다. 기존의 연구에서 수행된 모니터링 데이터의 표준편차와 오차범위 및 신뢰구간 값(95, 99% CI)을 활용하여 표본 수 추정공식에 따라 계산하였다. 표본 수 추정 공식에 따라 표본 크기를 추정한 결과, 95% 신뢰구간에서 카드뮴의 경우 계산된 표본의 크기는 최소 8개에서 최대 90개, 납의 경우 최소 7개에서 최대 1,062개, 수은의 경우 최소 11개에서 최대 238개로 각각 추정되었다. 식품 중 중금속 데이터의 표준 편차와 오차범위가 표본 수를 추정하는데 가장 큰 영향을 주는 것으로 나타났다. 본 연구에서는 모니터링 데이터의 특성을 반영하여 표본 크기를 추정하고자 하였으며, 이는 향후 위해평가 및 모니터링 수행 계획을 수립하기 위한 표본 수를 결정하는 기초연구로 활용될 수 있을 것이다.

적합탐색 관찰방법을 이용한 추정 (Estimating using the method of adaptive searching observation)

  • 변종석;남궁평
    • 응용통계연구
    • /
    • 제9권2호
    • /
    • pp.145-159
    • /
    • 1996
  • 2차원의 공간모집단에서 모수를 추정하기 위하여 모집단내에서 존재하는 위치들간의 공간적 종속관계를 이용하여 표본단위를 관찰하는 적합탐색 관찰방법을 제안하고, 공간모집단에서 관심영역의 면적이나 비율을 추정하고자 할 때 적합탐색 관찰방법을 적용하여 얻은 추정량에 대하여 살펴본다. 각 표본점들 사이에 존재하는 공간종속관계를 이용한 적합탐색 관찰방법을 적용한다면 조사이전에 미리 정해지는 표본크기 n에 대하여 추출된 표본단위들을 모두 관찰하는 전통적인 표본설계에 비하여 보다 적은 수 $m(m \leq n)$개의 관찰로써 추정할 수 있을 것이다. 이로써 표본조사시 발생하는 비용과 시간 등의 절감효과가 기대되며, 추정하려는 관심영역의 형상에 대한 사전 정보가 존재하지 않더라도 적합탐색 관찰방법으로 그 형상을 파악할 수 있게 된다.

  • PDF

수량구성요소(收量構成要素)를 위(爲)한 표본수(標本數)에 대(對)한 연구(硏究) (제(第)1보(報)) (A Study on the Number of Sample Units for Yield Components (I))

  • 오왕근;장수환;이희철
    • 한국토양비료학회지
    • /
    • 제2권1호
    • /
    • pp.75-78
    • /
    • 1969
  • 1967년(年) 및 1968년도(年度)에 얻은 성적(成績)을 이용(利用)하여 주당(株當) 수수조사(數穗調査)에 필요(必要)한 표본수(標本數)를 계산(計算)한 바 타도(他道)에 비(比)하여 표본오차(標本誤差)가 큰 강원도(江原道)와 전라남도(全羅南道)에서 더 많은 표본(標本)을 취(取)하여야 하는것으로 생각된다. 수량구성요소(收量構成要素)를 위(爲)한 표본수(標本數)는 위도(緯度)에 따라 다른 것이 아니라 도내(道內)에서의 이들 수량구성요소(收量構成要素)의 변이성(變異性)에 따라 좌우(左右)된다고 보며 5%의 표본(標本)을 취(取)함으로서 약(約) 75% 내지(乃至) 85%의 상대적(相對的) 정보(情報)를 얻을수 있다고 생각된다.

  • PDF

강우사상 이변량 빈도해석을 위한 Peaks Over Threshold (POT) 방법을 이용한 적정 확률표본 선택 연구 (Appropriate Sample Size for Bivariate Frequency Analysis of Rainfall Event using Peaks Over Threshold (POT))

  • 주경원;김한빈;안현준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.304-304
    • /
    • 2018
  • 이변량 빈도해석은 일반적으로 고정지속기간 강우량에 대해 빈도해석하는 단변량 빈도해석에 비해 지속기간을 확률변수로 이용하여 강우량과 동시에 확률변수로 사용할 수 있다는 장점이 있다. 하지만 확률분포형의 차원이 증가하기 때문에 기존 단변량 빈도해석에서 요구되던 표본크기보다 더 많은 표본이 필요하다. 우리나라 강우관측소의 경우 오래된 관측소의 경우에도 기록년수가 60년을 넘지 않아 연최대계열로 확률표본을 작성할 경우 이변량 빈도해석을 수행하기에 부족할 수 있다. 따라서 본 연구에서는 Peaks Over Threshold (POT) 방법을 이용하여 적정 확률표본을 선택하는 연구를 진행하였다. 서울 기상청 지점의 강우자료로부터 최소무강우시간을 이용하여 모든 강우사상을 추출하였으며 각 강우사상의 강우량과 지속기간이 확률변수로 사용되었다. 기존에 알려진 POT 방법들과 Anderson-Darling 적합도 검정을 이용한 절단값 산정방법등을 적용하여 확률표본 개수의 변화에 따른 주변분포형의 적합도 검정과 이변량 확률모형의 적합성을 살펴보았다.

  • PDF

복합재 초기 공극 결함에 따른 횡하중 강도 확률론적 분석 (Stochastic Strength Analysis according to Initial Void Defects in Composite Materials)

  • 지승민;조성욱;전성식
    • Composites Research
    • /
    • 제37권3호
    • /
    • pp.179-185
    • /
    • 2024
  • 본 연구는 Representative Volume Element(RVE) 모델을 사용하여 초기 공극 결함이 있는 단방향 섬유강화 복합재의 횡방향 인장 강도 변화에 대해 정량적 평가 및 조사되었다. 초기 공극 결함을 표본오차와 신뢰 수준을 기준으로 적정 표본의 수가 계산된 후, 총 5000개의 초기 공극 결함이 있는 RVE 모델이 표본 집단으로 생성되었다. 표본 집단은 차원 축소법과 밀도 기반 군집 분석을 통해 유사도 분석이 진행되었으며 편향되지 않은 표본 집단임이 확인 및 검증되었다. 검증된 표본 분석 결과는 복합재 구조의 신뢰성 해석에 적용될 수 있게 Weibull 분포로 표현되었다.

예산제약하에서 O/D 추정을 위한 최소표본율 결정 (Sample Size Determination for O/D Estimation under Budget Constraint)

  • 신희철;이향숙
    • 대한교통학회지
    • /
    • 제24권3호
    • /
    • pp.7-15
    • /
    • 2006
  • O/D 추정을 위한 표본조사시 최소표본율의 결정은 조사 전체 및 구축된 O/D의 신뢰성과 직결되는 중요한 문제이다. 현재 대부분의 O/D 추정을 위한 교통조사시 정해진 기준 없이 단순히 전체 모집단에 대하여 정률로 표본율을 결정하거나, 모집단의 크기에 따라 약간씩 표본수를 가감하는 표본율을 사용하고 있으나, 적용시 신뢰성 문제가 존재하므로 이에 대한 보완이 필요하다. 본 연구에서는 이러한 문제점의 해결방안으로 최악의 경우에도 zero cell을 없애도록 고안된 교통조사지침의 표본수결정식을 이용하되, 이 방법의 문제점인 과도한 표본율을 줄이기 위하여 카테고리수를 조사여건에 따라 차등 적용하여 예산제약의 문제를 해결하는 방안에 대하여 검토하였다. 전국 지역간 여객 O/D자료를 대상으로 기존 O/D자료에서 zero cell을 제외하는 경우(1안), 대권역으로 적용하는 경우(2안) 인접죤으로 통행하는 경우(3안), 다음 인접죤까지 통행하는 경우(4안) 등 4개 안을 제안하여 분석하였고. 그 결과 각 대안들은 신뢰성과 표본율 측면에서 대체관계(trade-off)로 각각 장단점을 내포하고 있는 것으로 나타났으므로, 각 조사기관은 조사의 신뢰성과 예산 등의 문제를 포괄적으로 고려하여 최적의 방법을 선택하여 적용하여야 할 것이다.

층화추출과 계통추출을 이용한 효율적인 보조정보 사용 (Efficient Use of Auxiliary Information through the Stratified Sampling and Systematic Sampling Design)

  • 김관수;박민규
    • 한국조사연구학회지:조사연구
    • /
    • 제10권1호
    • /
    • pp.155-168
    • /
    • 2009
  • 표본설계 단계에서 이용 가능한 보조정보가 있는 경우 효율적인 표본추출방법으로 층화추출법이 흔히 고려된다. 특별히 층화변수로 이용할 수 있는 변수가 많은 경우 전체 층의 숫자가 커지게 되며, 이때 각 층으로부터 한 단위를 추출하는 층 표본크기가 1인 층화추출이 효율적임이 알려져 있다. 그러나 각 층으로부터 하나의 추출단위를 추출하는 층 표본크기가 1인 층화추출의 경우 불편 분산 추정량의 계산이 불가능하다. 불편 분산 추정량의 계산은 층의 수를 줄이고 각 층으로부터 두 개의 표본추출단위를 표집하는 층 표본크기가 2인 층화추출에서 가능하나 중요 층화변수가 누락될 경우 층 표본크기가 1인 층화추출에 비해 그 효율성이 떨어진다. 본 연구에서는 Park & Fuller(2008)에 의해 제시된 층 표본크기가 2인 균형 층화추출과 호르비츠-톰슨 추정량의 불편 분산 추정량을 살펴보고, 모의실험을 통하여 여러 가지 층화추출법과 계통추출법을 비교한다. 또한 제시된 표본추출법을 2006년 청년패널 자료에 적용하여 그 효율성을 평가한다.

  • PDF

소맥의 수수조사를 위한 표본단위의 크기와 표본수 결정 (Determination of Size and Number of Sampling Units for Spike Count in Wheat)

  • 장석환;하용웅
    • 한국작물학회지
    • /
    • 제26권4호
    • /
    • pp.293-297
    • /
    • 1981
  • 맥류시험에 있어서 표본추출 체계를 확립하기 위하여 1979/80년 맥류연구소의 포장에서 실시한 몇가지 소맥재배양식에 대한 표본단위의 크기 및 주어진 정도를 위한 표본수 결정을 시도하였던 바 그 결과를 요약하면 다음과 같다. 1. 소맥의 수수에 대한 변이계수는 휴입광철파를 제외하고는 맥류수량의 평균변이계수와 거의 같았다. 2. 수수의 변이계수와 표본단위의 크기에 대한 회귀계수는 유입광철파를 제외하고 모두 1% 수준에서 유의성을 보였다. 3. 표본단위의 크기는 재배양식에 따라 차이가 크며 변이계수 15%를 허용한다면 협폭파, 관행 및 Drill 파는 각각 0.40, 0.17 및 0.11$m^2$, 로 추정되며 답리작의 유입광철파는 0.55$m^2$, 로 추정되었다. 4. 표본단위간 변이가 심하여 시험오차의 분산성분이 영인 조건하에서 CV=12%를 위해서 2반복인 경우는 구당 2개의 표본단위, 4반복민 경우는 구당 1개의 표본단위로 충분한 것으로 추정되었다.

  • PDF