• 제목/요약/키워드: 표본추출방법

검색결과 610건 처리시간 0.019초

2단 크기비례 계통추출법의 분산추정량 효율성 비교 (Efficiency of Variance Estimators for Two-stage PPS Systematic Sampling)

  • 김영원;김예니;한혜은;곽은선
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.1033-1041
    • /
    • 2013
  • 본 논문에서는 크기비례 계통추출법에서 적용할 수 있는 다양한 분산추정 방법들을 정리하고 각 분산추정 방법들의 통계적 특성에 대해서 논의하였다. 이론적으로 하나의 계통표본을 가지고 비편향 분산추정량을 구하는 것은 불가능 하지만 실제 표본자료 분석에 있어서 어떤 대안이 있을 수 있는지 살펴보고, 다양한 분산추정 방법들의 성질을 상대편향 및 상대평균제곱오차 관점에서 비교해 보았다. 또한 우리나라 가구나 사업체 표본설계에서 흔히 발생하는 2단 크기비례 계통추출 표본에서 적용 가능한 효과적인 분산추정 방법을 알아보기 위해 2008년 사업체근로실태조사 자료의 근로자 평균임금과 2011년 식품원료소비실태조사 자료의 가구당 연평균 쌀 소비량의 분산 추정 문제를 기초로 모의실험을 수행하였다.

선형추세를 갖는 모집단에 대한 효율적인 모평균 추정 : 계통추출의 확장 (Efficient Estimation of the Mean for Populations with a Linear Trend : An Extension of Systematic Sampling)

  • 김혁주;석은양
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.457-476
    • /
    • 2000
  • 본 연구에서는 선형추세를 갖는 모집단에 대한 효율적인 표본추출방법과 모평균 추정법을 제안하였다. 이 방법은 계통추출을 확장한 중심균형계통추출을 써서 표본을 뽑은 뒤 표본평균보다 수정된 추정량을 써서 모평균을 추정하는 것이다. 수정된 추정량을 정하는 데에 보간법의 개념을 사용하였다. 제안된 추정량과 기존의 방법에 으한 추정량들의 효율을 Cochran(1946)의 무한초모집단모형에 근거를 둔 기대평균제곱오차를 기준으로 하여 비교하였다. 제안된 방법은 표본크기 n($\geq$5)이 홀수이고 추출률의 역수인 $textsc{k}$가 짝수인 경우에 사용하기 위한 것이다. 모의실험을 이용한 예어서도 역시 좋은 결과가 얻어졌다.

  • PDF

영 과잉 포아송 모형에 대한 베이지안 방법 연구 (Bayesian Approaches to Zero Inflated Poisson Model)

  • 이지호;최태련;우윤성
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.677-693
    • /
    • 2011
  • 본 논문에서는 영 과잉 계수형 자료 분석을 위한 모형중의 하나인 영 과잉 포아송 모형의 베이지안 접근 방법에 대해서 연구한다. 구체적으로는 베이지안 영 과잉 포아송 모형의 적합을 위한 사후 표본을 추출하는데 있어서, 깁스 표집기(Gibbs sampler)를 이용하는 마르코프 연쇄 몬테칼로(MCMC) 방법과 역 베이즈공식(IBF)에 의한 표본추출 방법 두 가지를 고려한다. 이러한 두 가지 사후 표본 추출방법을 비교 설명하고, IBF를 통한 사후표본을 깁스 표집기 사후표본의 수렴성 여부를 확인하는 방식에 대해서도 소개한다. 이를 바탕으로 베이지안 영 과잉 포아송 모형을 Trajan이라는 사과 품종의 발아자료(Trajan data, Marin 등, 1993)에 적용하고 모수에 대한 사후추론을 실시하고 기존의 결과와 비교한다. 또한 주어진 자료에 대하여 영 과잉 포아송 모형이 적합한지에 대한 여부를 여러 가지 모형선택 기준을 통해서 살펴보고, 아울러 기존의 자료 분석 결과 (Rodrigues, 2003)를 보완하기 위하여 계층적 베이지안 모형과 같은 대안에 대해서도 논의해본다.

지역교육청 수요자 만족도조사를 위한 표본설계에 관한 연구 (A sample survey design for service satisfaction evaluation of regional education offices)

  • 허순영;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.669-679
    • /
    • 2010
  • 지역교육청 수요자 만족도조사를 위한 표본설계는 경상남도의 2009년 경남지역교육청 고객만족도 조사의 표본크기에 기초하여 시 군별 지역교육청평가에 맞추어 설계하였다. 대도시의 구단위 지역 교육청과 달리 지방의 시 군 교육청은 학생수와 학교수, 학급당 학생수 등의 변동이 크다. 시간 비용 등을 고려하여 전체 표본크기를 작게 하면서도 각 시 군 교육청 평가에 필요한 최소표본수를 확보하도록 설계하였다. 경상남도는 10개의 시지역과 10개의 군지역을 가지고 있고, 학생수가 상대적으로 작은 군지역교육청 평가에 필요한 최소표본수를 확보하기위해 지역별 평가에 필요한 최소표본을 우선배분한 후, 나머지는 지역별 학급수에 비례배분하였고, 표본학교는 지역과 학교설립유형별로 층화하여 학급수에 비례하여 추출하였다. 표본학교 내에서 조사대상 학생은 2단집락추출하였다. 지역별 추출율의 상이함을 보정하기 위해 가중치를 산정하였다. 조사자료의 분석은 가중치를 적용하여 가중평균, 가중총합 등을 이용하며, 분산의 추정은 통계소프트웨어에서 제공하는 균형반복복제, 잭나이프, 선형화방법 등을 사용할 수 있다.

통계적 신뢰구간 개념을 도입한 검지기 성능평가 (Detector Evaluation Scheme Including the Concept of Confidence Interval in Statistics)

  • 장진환;김병화
    • 한국ITS학회 논문지
    • /
    • 제10권1호
    • /
    • pp.67-75
    • /
    • 2011
  • 본 논문은 기존의 단일값(점추정)으로 제시하던 검지기 성능평가 결과를 통계적 신뢰구간(구간추정)으로 제시하기 위한 검지기 성능평가 방안을 제시했다. 일반적으로 구간추정은 점추정에 비해 표본 통계의 더 많은 정보를 제공하기 때문에 기존 단일값으로 제시해 오던 검지기 성능평가 결과의 신뢰성을 향상시킬 수 있다. 방법론은 크게 표본 추출, 평가척도 분석, 평가결과 제시의 세 부분으로 나누어진다. 표본추출 방법에는 다양한 통계적 표본 추출 방법이 있지만 교통, 조도, 기상조건에 따라 변화하는 차량검지기 성능의 특성상 층화추출법이 통계적 신뢰구간 제시를 위한 가장 적합한 방법론으로 간주되었다. 또한 기존에 널리 사용된 검지기 성능평가 척도들의 특징을 면밀히 분석하여 평가자로 하여금 해당 검지자료에 적합한 평가척도를 선택할 수 있는 프로세스를 정립하였다. 마지막으로 평가기간 전체(예. 30분)와 개별분석 단위(예. 1분) 평가결과의 통계적 신뢰구간을 반영하기 위한 방법론을 제시했다. 본 연구는 기존 검지기 성능평가 결과의 단일값 제시로 인해 불가능 했던 신뢰구간 제시를 가능하게 함에 따라 검지기 성능평가 결과의 신뢰성을 향상시킬 수 있을 것으로 판단된다.

목표 범주가 희귀한 자료의 과대표본추출에 대한 연구 (A Study on the Adjustment of Posterior Probability for Oversampling when the Target is Rare)

  • 김은나;이성건;최종후
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.477-484
    • /
    • 2011
  • 반응/미반응 목표변수를 갖는 모집단에서 관심 목표범주의 빈도가 극히 작을 경우, 즉 희귀할(rare) 경우, 모형 구축을 위한 데이터마트를 형성할 때 반응/미반응 범주 구성비는 구축된 모형의 성능에 영향을 준다. 본 연구는 이러한 점에 착안하여 반응/미반응 범주 구성비와 모형성능의 관련성을 모형평가 통계량에 기반하여 판단한다. 이로써 데이터마트 형성에 이상적인 반응/미반응 범주 구성비를 탐지하려는데 본 연구의 목적을 두고 있다. 또한 일반적으로 목표범주의 빈도가 희귀할 경우, 분할 표본추출에 의하여 희귀사건(rare event)을 과대표본추출(oversampling)하는 것이 일반적이며, 이로부터 기인하는 사후확률에 대한 편향을 조정하게 된다. 본 연구에서는 사후확률 조정방법으로 오프셋(offset) 방법과 가중치 방법(sampling weights)을 적용하고 이를 비교하였다.

한국의 가구형태에 따른 Kish-격자의 조정

  • 손창균;홍기학;이기성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.55-60
    • /
    • 2004
  • 하나의 가구에서 대표되는 사람을 뽑는 문제가 조사의 마지막 단계에서 종종 발생한다. 일반적으로 가구내에서 성별과 연령에 따라 최종 조사단위로 선정되는 표본은 대표성에 문제가 있기 때문에 이를 해결하기 위한 방법으로서 Kish-격자를 이용한 방법을 사용하게 된다. 본 논문에서는 한국의 가구형태에 따라 기존의 Kish-격자를 수정하여 대표성 있는 표본을 선택하는 문제를 다루었다.

  • PDF

변량가중치를 이용한 EWMA 관리도

  • 이재헌;한정희
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 추계 학술발표회 논문집
    • /
    • pp.67-72
    • /
    • 2005
  • 이 논문은 표본크기와 표본추출간격 이외의 관리모수인 EWMA 관리도의 가중치를 이전 시점의 관리통계량 값에 기초하여 변화시키는 VW(variable weight) 방법에 대한 것이다. 이 방법을 VSR(variable sampling rate)과 병행하는 절차를 제안하고, 절차의 효율에 대하여 알아보았다.

  • PDF

내점객 인터뷰에 근거한 슈퍼마켓 입지분석 모델의 실용성 평가 (Usefulness of In-store Spotting Survey in Developing a Supermarket Location Analysis Model)

  • 서성무;고윤배
    • Asia Marketing Journal
    • /
    • 제1권1호
    • /
    • pp.5.1-5.11
    • /
    • 1998
  • 이 연구는 2차자료가 부족한 우리나라 슈퍼마켓 업체의 여건을 감안하여 간편하게 활용할 수 있는 입지분석 모델의 가능성을 탐구하였다. 연구모델은 두 가지 기준을 근거로 모두 네가지 모델을 설정하고 비교검토했다. 먼저 표본추출방법에 의해 내점객표본과 지역할당표본으로 분류하고, 이것을 다시 포함하는 변수의 범위에 따라 축소모델과 확장모델로 구분하였다. 공간상호작용모델의 추정에는 MNL(Multinomial Logit)방식을 이용했다. 분석결과 내점객표본으로 조사해서 얻은 응답자의 주거지와 주로 찾는 점포, 그리고 사전적으로 입수한 경쟁점포의 매장면적, 인접점포까지의 거리에 대한 자료만을 이용해서 추정한 가장 간단한 모델이 비교적 만족스러운 결과를 나타냈다.

  • PDF

민감한 정보를 얻기 위한 대체 전략에 관한 연구

  • 홍기학;이기성;손창균
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.195-199
    • /
    • 2003
  • Hansen과 Hurwitz(1946)는 우편조사에서의 무응답 문제를 처리하는 방법으로 표본을 응답결과에 따라 응답층과 무응답층으로 나눈 다음, 무응답층의 일부를 랜덤 추출하여 면대면 직접조사에 의해 무응답층의 정보를 얻는 방법을 제안하였다. 본 연구에서는 민감한 모집단에 대한 자료수집 방법으로 직접질문 방법인 Black-Box 방법과 간접질문 방법인 확률화응답기법(RRT)의 결합적 방법을 제시하였고, 층화이중 추출방법을 이용하여 모수를 추정하였다.

  • PDF