• 제목/요약/키워드: 표본분산

검색결과 370건 처리시간 0.023초

표본분산에 대한 고찰

  • 장대홍
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.141-148
    • /
    • 2004
  • 우리는 모분산 $\sigma^2$에 대한 추정량으로서 표본분(equation omitted)을 주로 사용한다. 그러나, 제 7차 교육 과정에 따른 고등학교 수학 교과서(10-가, 수학 I과 실용수학)에서는 표본분산의 정의를(equation omitted)으로 사용하고 있다. 이 두 표본분산들의 관계를 알아보고, 시뮬레이션을 통하여 확인하여 본다.

  • PDF

표본분산에 대한 고찰 (A Study on Sample Variance)

  • 장대흥
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.689-699
    • /
    • 2005
  • 우리는 모분산 ${\sigma}^2$에 대한 추정량으로서 표본분산 $S^2=\frac{{\Sigma}^n_{i=1}(X_i-\={X})^2}{n-1}$을 주로 사용한다. 그러나, 제 7차 교육과정에 따른 고등학교 수학 교과서(10-가, 수학 I과 실용수학)에서는 표본분산의 정의를 $S^2_n=\frac{{\Sigma}^n_{i=1}(X_i-\={X})^2}{n}$로 사용하고 있다. 이 두 표본분산들의 관계를 알아보고, 시뮬레이션을 통하여 확인하여 본다. 또한, 이 두 표본분산들을 포함하여 일반적으로 정의할 수 있는 표본분산을 제안한다.

양쪽 절단된 정규분포의 평균과 분산의 추정

  • 최윤영;홍종선
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.127-132
    • /
    • 2002
  • 절단된 정규분포의 평균과 분산을 추정하기 위하여 전체 표본에 기초한 최대가능도 추정량을 사용한 방법과 절단된 후에 남아있는 표본만을 고려한 절단된 표본의 표본평균과 표본분산을 시뮬레이션을 통해 비교 연구하였다. 평균을 추정하는 경우에는 놀랍게도 절단된 자료에 기초한 추정량이 전체 표본에 기초한 추정량보다 평균제곱오차가 더 작다는 것을 발견하였다.

  • PDF

분산성분모형 관리도의 설계와 효율 (Design and efficiency of the variance component model control chart)

  • 조찬양;박창순
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.981-999
    • /
    • 2017
  • 단순확률모형을 고려하는 표준관리도에서는 표본간 분산을 고려하지 않고 공정분산을 추정한다. 표본간 분산이 존재하는 경우에는, 공정분산이 과소추정된다. 공정분산이 과소추정되면 좁아진 관리한계로 인해 관리도의 민감도는 향상되지만 과도한 오경보율을 발생시킨다. 이 논문에서는 공정모형으로 분산성분모형, 즉 변동의 원인을 표본내 분산과 표본간 분산으로 구분하는 확률모형을 고려한다. 관리한계는 표본내 분산과 표본간 분산을 모두 사용하여 설정하고 그에 따른 평균런길이를 통하여 효율을 살펴 보았다. 관리형태는 가장 널리 사용되는 ${\bar{X}}$, EWMA, CUSUM 관리도를 고려하였다. 관리한계 설정에서 표본내 분산만을 사용한 경우 (Case I)와 표본간 분산도 함께 사용한 경우 (Case II)를 통해 관리도의 효율을 비교하였다. 또한, 공정 모수가 주어진 경우와 추정된 두 경우에 대해서도 관리도의 효율을 비교하였다. 그 결과, 표본간 분산이 증가할 때 Case I의 오경보율은 급격히 증가한 반면 Case II의 경우에는 동일하게 유지됨을 알 수 있었다.

두 자료들의 평균과 분산을 이용한 혼합자료의 분산 계산 (Calculating Sample Variance for the Combined Data)

  • 신미영;조태경
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.177-182
    • /
    • 2008
  • 공통분산을 갖는 두 모집단에서 얻은 두 독립표본 자료로부터 공통분산을 추정하거나, 한 모집단에서 얻는 두 자료의 혼합자료로부터 모분산을 추정할때 각 표본분산의 가중평균값인 합동추정량(pooled estimator)을 주로 사용한다. 본 논문에서는 동일한 모집단에서 얻은 혼합자료의 표본분산 식을 각 자료의 평균과 분산만 이용하여 구한 후 합동추정량과 비교한다.

불균등확률표본에서 붓스트랩

  • 정주경;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.39-43
    • /
    • 2000
  • 분산 추정 및 신뢰구간 추정의 한 방법으로 널리 쓰이고 있는 붓스트랩 방법을 복합표본에 적용하는 방법에 대해 알아보았다. 복합 표본은 유한 모집단에서 추출되고 추출확률이 다르기 때문에 i.i.d. 표본에 기초하여 개발된 전통적인 붓스트랩 방법을 직접 적용하면 추론의 오류가 발생할 수 있다. 본 연구에서는 복원 확률비례표본과 랜덤그룹표본에 붓스트랩을 적용하는 방법을 알아보았다.

  • PDF

층화 집락추출시 $m_{opt}$의 결정

  • 신동윤;신민웅;최기철
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.131-135
    • /
    • 2003
  • 표본조사를 하는 경우에 사전에 전체 표본의 크기를 정하여 놓고, 표본설계를 하는 경우가 많다. 이 때에는 조사 비용은 고려의 대상이 안되고 주어진 전체표본 크기로 각 층별로 표본을 할당하여 분산을 최소로 하는 문제가 된다. 이 논문에서는 pps 집락추출과 각 집락에서 같은 크기의 부표본(subsample)을 추출하여 자체 가중이 되도록 표본설계를 하는 경우에 표본의 크기 $m_{0}$가 사전에 주어졌을 때에 모총계의 추정량의 분산을 최소로 하는 최적의 표본추출율을 구하고. 이러한 $m_{0}$값들 중에서 최적의 $m_{opt}$값을 구한다.

  • PDF

층화표본에서의 표본 배분에 대한 연구 (A Study on Sample Allocation for Stratified Sampling)

  • 이인규;박민규
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1047-1061
    • /
    • 2015
  • 층화표본추출(stratified sampling)은 모집단을 구성하는 층에 대한 정보를 표본설계에 반영함으로써 추정량의 분산을 낮추기 위한 표본추출 방법으로, 표본배분 방안의 선택이 층화표본의 효과를 결정하는데 매우 중요한 요소이다. 전통적인 표본배분 방법으로는 비례배분법(proportional allocation)과 네이만배분법(Neyman alloction)이 주로 사용되는데, 이는 층별 추정량의 분산에 영향을 미치는 요인들을 표본 배분에 반영함으로써 전체 추정량의 분산을 최적화하기 위한 것이다. 이론적으로는 층크기(size of strata)만을 반영하는 비례배분법보다 층별 표준편차(standard deviation)를 함께 고려하는 네이만배분법이 추정량의 분산을 낮추는데 더 효과적임이 알려져 있다. 그러나 층별 표준편차에 대한 사전 정보가 모집단을 잘 반영하지 못하면 네이만배분법의 효과를 기대할 수 없으며, 특히 복수의 관심변수를 조사하는 다목적조사(multi-purpose survey)에서는 각 관심변수들의 층별 표준편차가 서로 다른 양상을 나타내기 때문에 네이만배분법이 적합하지 않다는 주장이 제기되기도 한다. 한편 표본조사에서는 조사단계에서 발생하는 무응답으로 인한 추정량의 편향을 제거하기 위해 응답률 보정 방법이 사용되는데, 이 또한 추정량의 분산에 영향을 미치는 주요한 요인 중에 하나이다. 그러나 전통적인 표본배분 방법은 응답률(response rate)을 감안하지 않기 때문에 층별 응답율에 차이가 크게 나타날 경우 층화표본에 의한 효과가 저하될 수 있다. 이에 본 연구는 층화표본추출에서 층간 응답률의 차이가 추정량의 분산에 미치는 영향을 살펴보고, 층별 응답률 정보를 표본설계에 반영하는 새로운 표본배분 방법을 제안하였다. 모의실험을 통해 확인한 결과 네이만배분법은 당초 표본배분 시에 적용한 층별 표준편차의 구조가 각 층의 응답률 보정과정에서 증가하는 분산을 반영하지 못하기 때문에 층간 응답률의 편차가 커질수록 효율이 저하되는 것으로 나타났다. 반면 층 크기와 층별 응답률을 함께 반영한 배분방법은 비례배분법에 비해 효율이 개선되며, 층간 응답률의 편차가 클수록 그 효과는 커진다. 특히 층별 응답률의 변동계수(coefficient of variance)가 층별 표준편차의 변동계수를 상회하는 경우는 네이만배분법 보다도 효율적인 추정량을 제공함을 확인하였다. 아울러 응답률을 반영한 배분방법은 기존 배분방법에 비해 각 층별 추정량을 보다 안정적으로 추정할 수 있기 때문에 층별 추정을 목적으로 하는 층화표본조사에서는 여타 추정방법보다 더 효과적이다. 층별 응답률에 대한 정보는 관심변수가 다르더라도 추출틀이 유사한 기존 조사의 결과를 활용할 수 있다는 점에서 표준편차에 비해 비교적 정보 수집이 용이한 장점이 있고, 다목적조사에서도 관심변수의 척도(scale)나 개수와 관계없이 적용 가능하기 때문에 활용도가 높을 것으로 생각된다.

l/G 교체표본디자인에서의 일반화복합추정량과 평균제곱오차에 관한 연구 (Generalized Composite Estimators and Mean Squared Errors for l/G Rotation Design)

  • 김기환;박유성;남궁재은
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.61-73
    • /
    • 2004
  • 교체표본조사에서는 모든 표본단위를 복수 개(=G)의 교체그룹으로 나누고 일정 횟수만큼 조사한 후 표본단위 의 교체를 하는 경우와 조사기 간 동안 동일한 표본단위를 조사한 후 교체그룹 자체를 교체하는 두 가지 경우가 있다. 본 연구는 후자의 경우를 일반화하는 것으로, 매 조사월에서 하나의 교체그룹이 조사되고 이 교체그룹에 속한 모든 표본단위는 최근 l개월 동안의 정보를 제공하는 l-수준 교체표본설계이다. 표본단위 교체가 오직 교체그룹의 총 개수인 G와 회상 개월 수인 l에 의해 결정되므로 이를 l/G 교체표본설계로 일반화하였으며 일반화복합추정량의 분산과 두 가지 형태의 편향(bias)하에서 MSE를 구하고 절충 GCE(compromise GCE)의 계수를 유도하였다. 또한 GCE의 분산과 MSE를 상관계수, 편향, 표본조사단위의 분산의 형태, 그리고 설계간격(design gap)의 형태에 따라 분석하였다.

감귤원에서 귤녹응애 공간분포 분석과 표본조사법 개발 (Spatial Distribution and Sampling Plan for Pink Citrus Rust Mite, Aculops pelekassi (Acari: Eriophyidae) in Citrus Orchard)

  • 송정흡;홍순영;이신찬
    • 한국응용곤충학회지
    • /
    • 제51권2호
    • /
    • pp.91-97
    • /
    • 2012
  • 온주밀감에서 귤녹응애, Aculops pelekassi의 분산지수와 분포양상, 표본조사시 적정 표본수에 대하여 조사하였다. 귤녹응애는 집중분포를 하고 있었으며, 분산지수는 Taylor's power law가 Iwao's patchiness regression보다 더 잘 설명하고 있었다. Taylor's power law의 상수를 이용하여 고정 정확도 수준에서 열매 표면 $cm^2$당 누적충수에 따라 조사를 중지할 수 있는 표본조사법을 만들었다. 경제적인 표본조사를 위하여 Kono-sugino의 경험적 이항모델을 개발하였으며, 이항모델을 이용하면 귤녹응애가 $cm^2$당 12마리 이상 발생한 열매 비율을 이용하여 평균밀도를 추정할 수 있었다 : $ln(m)=4.61+1.23ln[-ln(1-p_{12})]$. 최적의 tally threshold를 결정하기 위하여 추정평균에 대한 분산을 계산한 결과 tally threshold가 12일 때 추정평균의 분산이 적었으며, 발생과율 0.1~0.5의 범위에서 분산의 변동이 거의 없어 다른 tally threshold에 비해 높은 정확도로 평균을 추정할 수 있었다. 적정 표본수를 결정하기 위하여 계층표본조사법을 이용하여 분석한 결과 고정 정확도 0.25수준에서 감귤원당 적정 조사 나무수는 13주였으며, 나무당 조사 열매수는 5개, 열매당 2지점에서 $cm^2$당 귤녹응애수 조사가 바람직하였다(총 130표본).