• 제목/요약/키워드: 표본배분

검색결과 59건 처리시간 0.018초

층화표본에서의 표본 배분에 대한 연구 (A Study on Sample Allocation for Stratified Sampling)

  • 이인규;박민규
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1047-1061
    • /
    • 2015
  • 층화표본추출(stratified sampling)은 모집단을 구성하는 층에 대한 정보를 표본설계에 반영함으로써 추정량의 분산을 낮추기 위한 표본추출 방법으로, 표본배분 방안의 선택이 층화표본의 효과를 결정하는데 매우 중요한 요소이다. 전통적인 표본배분 방법으로는 비례배분법(proportional allocation)과 네이만배분법(Neyman alloction)이 주로 사용되는데, 이는 층별 추정량의 분산에 영향을 미치는 요인들을 표본 배분에 반영함으로써 전체 추정량의 분산을 최적화하기 위한 것이다. 이론적으로는 층크기(size of strata)만을 반영하는 비례배분법보다 층별 표준편차(standard deviation)를 함께 고려하는 네이만배분법이 추정량의 분산을 낮추는데 더 효과적임이 알려져 있다. 그러나 층별 표준편차에 대한 사전 정보가 모집단을 잘 반영하지 못하면 네이만배분법의 효과를 기대할 수 없으며, 특히 복수의 관심변수를 조사하는 다목적조사(multi-purpose survey)에서는 각 관심변수들의 층별 표준편차가 서로 다른 양상을 나타내기 때문에 네이만배분법이 적합하지 않다는 주장이 제기되기도 한다. 한편 표본조사에서는 조사단계에서 발생하는 무응답으로 인한 추정량의 편향을 제거하기 위해 응답률 보정 방법이 사용되는데, 이 또한 추정량의 분산에 영향을 미치는 주요한 요인 중에 하나이다. 그러나 전통적인 표본배분 방법은 응답률(response rate)을 감안하지 않기 때문에 층별 응답율에 차이가 크게 나타날 경우 층화표본에 의한 효과가 저하될 수 있다. 이에 본 연구는 층화표본추출에서 층간 응답률의 차이가 추정량의 분산에 미치는 영향을 살펴보고, 층별 응답률 정보를 표본설계에 반영하는 새로운 표본배분 방법을 제안하였다. 모의실험을 통해 확인한 결과 네이만배분법은 당초 표본배분 시에 적용한 층별 표준편차의 구조가 각 층의 응답률 보정과정에서 증가하는 분산을 반영하지 못하기 때문에 층간 응답률의 편차가 커질수록 효율이 저하되는 것으로 나타났다. 반면 층 크기와 층별 응답률을 함께 반영한 배분방법은 비례배분법에 비해 효율이 개선되며, 층간 응답률의 편차가 클수록 그 효과는 커진다. 특히 층별 응답률의 변동계수(coefficient of variance)가 층별 표준편차의 변동계수를 상회하는 경우는 네이만배분법 보다도 효율적인 추정량을 제공함을 확인하였다. 아울러 응답률을 반영한 배분방법은 기존 배분방법에 비해 각 층별 추정량을 보다 안정적으로 추정할 수 있기 때문에 층별 추정을 목적으로 하는 층화표본조사에서는 여타 추정방법보다 더 효과적이다. 층별 응답률에 대한 정보는 관심변수가 다르더라도 추출틀이 유사한 기존 조사의 결과를 활용할 수 있다는 점에서 표준편차에 비해 비교적 정보 수집이 용이한 장점이 있고, 다목적조사에서도 관심변수의 척도(scale)나 개수와 관계없이 적용 가능하기 때문에 활용도가 높을 것으로 생각된다.

표본배분에 관한 소고

  • 김종호
    • Communications for Statistical Applications and Methods
    • /
    • 제3권3호
    • /
    • pp.299-302
    • /
    • 1996
  • 표본조사에 있어서 층화추출법은 모집단에 관한 예비정보를 필요로 하고 있다. 조사자가 표본설계시 층화와 표본배분의 문제를 막연히 추상적으로 처리함으로 생기는 오류를 줄이기 위해서 다원적 입장에서 모집단에 대한 예비 정보를 정확하게 파악하고 이용해야 층화추출법의 효율을 올릴 수 있음을 지적하고 있다.

  • PDF

층화확률화 응답기법에 대한 동적 최적배분 (An Dynamic Optimal Allocation for the Stratified Randomized Response Technique)

  • 손창균;홍기학;이기성
    • Communications for Statistical Applications and Methods
    • /
    • 제16권4호
    • /
    • pp.595-603
    • /
    • 2009
  • 통상적으로 표준적인 최적배분은 층별 조사비용을 고려하여 표본을 배분한다. 만일 조사단위당 비용이 서로 다를 경우 보다 현실적인 배분방법을 고려할 필요가 있다. 즉, 개별 조사단위의 특성에 따라 이익비용비를 최대로 하는 단위를 먼저 표본으로 고려하는 동적배분을 고려하였다. 이러한 관점에서 층별 표본수를 배분하고, 배분된 표본규모에 따라 임의로 표본을 선정하는 방식인 표준적인 최적배분과는 차이가 있다. 이 논문은 약물오용, 낙태, 알콜중독 등과 같은 민감한 특성을 조사하는 층화확률화 응답기법에 대해 각 층별로 표본을 배분할 경우 최적 동적배분을 고려하여 보다 현실적인 문제를 해결하고자 하였으며, 수치적 예제를 통해 동적배분 방법의 효과성을 증명하였다.

경북인의 생활과 의식조사 표본설계 (A sample design for life and attitude survey of Gyeongbuk people)

  • 김달호;조길호;황진섭;정경하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1155-1167
    • /
    • 2009
  • 2007년 경북인의 생활과 의식조사를 위한 표본설계를 연구하였다. 기존 조사에 대한 분석을 바탕으로 새로운 표본설계를 위한 여러 가지 사항을 검토하였다. 최근 시행된 2005년 인구주택총조사의 10% 표본조사자료를 조사모집단으로 사용하였고, 2006년 조사결과를 바탕으로 3가지 주요 항목 (경제활동상태, 연간소득수준, 주택소유)을 이용하여 표본조사구수에 대한 추정의 정도를 제시하고, 여러가지 층별 표본 배분을 검토한 후 비례배분을 사용하여 층별로 표본을 배분하고 적절한 표본의 크기를 결정하였다. 새로운 표본설계에서는 가중치를 계산하였고 이를 이용한 추정량과 추정오차 공식을 유도하여 기존의 단순집계를 벗어나 시군별 그리고 특성별 추정과 추정의 정도에 대한 평가를 가능하게 하였다.

  • PDF

Neyman 최적배분의 공분산 행렬에 근거한 다변량 절충배분

  • 김호일
    • Communications for Statistical Applications and Methods
    • /
    • 제3권1호
    • /
    • pp.131-143
    • /
    • 1996
  • 다변량 층화임의추출에서 한 변수의 Neyman 최적배분은 다른 변수에 대한 층화분산을 최소화시키지 못하는 결과를 초래할 수도 있다. 따라서 다변량 자료의 경우 '최적'배분 대신에 '절충'배분이 도입되어 왔다. 이 연구에서는 각 변수별 Neyman 최적배분에 근거해서 얻은 층화표본평균벡터의 공분산 행렬에 가장 잘 적합되는 층별로 동일한 크기의 절충배분을 찾고자 한다. 이에 적절한 기준 다섯가지를 제시하고 예를 통해 비교, 분석하였다.

  • PDF

상가권리금 현황조사를 위한 표본설계 연구 (A sample design for the survey on goodwill in retail properties)

  • 김달호;우남교;조준우
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1443-1452
    • /
    • 2016
  • 본 연구는 소상공인과 임차상인 보호정책을 지원하고, 권리금 분쟁소송 등에 참고자료로 활용할 뿐만 아니라 상가권리금 현황 파악을 위한 최초 조사를 실시하기 위한 표본설계 연구이다. 개별 임차 사업체 단위로 발생하는 권리금의 특성상 통계청의 전국사업체조사를 모집단으로 활용 하였으며, 우선적인 정보 제공이 필요한 7개 도시지역을 반영하였다. 전체 표본수는 8,000개로 하였으며, 7개 도시지역을 부차모집단으로 하고 지역별 상권별 표본수는 비례배분 하였으며, 상권내 업종은 제곱근비례배분 하였다. 목표오차를 활용하여 최종 표본수를 조정 하였으며, 표본설계가중치를 이용한 권리금 평균 추정량과 추정오차, 구간추정 공식을 유도하였으며, 이를 통해 도시별 상권별 및 업종별 통계 추정과 추정의 정도에 대한 평가를 가능하게 하였다.

층화 다지 확률화응답모형 (A Stratified Multi-proportions Randomized Response Model)

  • 이기성;박경순
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1113-1120
    • /
    • 2015
  • 본 논문에서는 사회적으로나 개인적으로 매우 민감한 조사에서 세대별, 연령별 또는 계층별에 따라 조사하고자 하는 모집단이 여러 개의 층으로 구성되어 있고, 각 층이 다지속성으로 되어 있는 경우에, Abul-Ela 등의 다지모형과 Eriksson의 다지무관모형에서 사용한 단순임의추출법 대신에 층화추출법을 적용하여 각 층의 다지속성에 대한 모비율의 추정뿐만 아니라 모집단 전체 모비율에 대한 추정을 할 수 있는 층화 다지 확률화응답모형을 제안하였다. 그리고 층화 다지모형에 있어서 각 층의 표본배분에 대하여 비례배분과 최적배분을 고려하여 다루었다. 또한 층화 다지 확률화응답모형들간의 효율성을 비교해 본 결과 Eriksson의 다지무관모형이 Abul-Ela 등의 다지모형보다 효율적임을 알 수 있었다.

낮은 모비율 추정을 위한 표본추출방법 (A sampling scheme for the estimation of low proportion)

  • 김지현
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.1-7
    • /
    • 1995
  • 표본조사에서 추정하고자 하는 모비율이 낮으면 많은 표본을 추출해야 한다. 이 때 단위표본의 비용이 높아 추출할 수 있는 표본의 크기가 제한된다면 추정량의 분산을 줄일 수 있는 방법을 신중히 고려해야 할 것이다. 본 논문에서는 모집단에 대한 사전 정보가 있어 이를 이용하여 층화추출하는 경우에 층의 표본크기의 새로운 배분방법을 제안하고 기존의 배분방법들과 비교해 본다.

  • PDF

중소기업실태조사를 위한 표본설계 (A sample design for the survey on actual state of SMEs)

  • 김달호;황진섭;곽상규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1021-1029
    • /
    • 2010
  • 중소기업의 조사부담 완화를 위하여 2009년부터 기존의 "중소기업실태조사", "중소기업인력실태 조사" 및 "중소기업사업전환실태조사"를 통합하여 하나의 조사로 수행하게 되었다. 통합 중소기업실태조사를 위한 새로운 표본설계에서 중소제조업과 지식기반서비스업 부문이 너무 상이하므로 별개의 모집단을 구성하였으며, 전체 표본수는 10,000개로 하였다. 변동계수를 사용한 배분공식으로 1차 층인 종사자규모 산업분류별로 표본을 배분하고 루트비례배분을 사용하여 2차 층인 지역별로 표본의 크기를 결정하였다. 새로운 표본설계에서는 가중치를 계산하였고 이를 이용한 추정량과 추정오차 공식을 유도하여 기존의 단순집계를 벗어나 종사자 규모별, 업종별 그리고 지역별 추정과 추정의 정도에 대한 평가를 가능하게 하였다.

층화 집락 반복계통 무관질문모형에 관한 연구 (A Study on the Stratified Cluster Replicated Systematic Unrelated Question Model)

  • 이기성
    • 응용통계연구
    • /
    • 제26권2호
    • /
    • pp.209-222
    • /
    • 2013
  • 본 논문에서는 대규모 표본조사에서 많이 나타나는 모집단이 층으로 형성되어 있고, 각 층들이 집락으로 구성되어 있을 때 사용 가능한 층화 집락추출법을 얻고자 하는 정보가 민감할 때 반복계통 무관질문모형에 적용하였다. 먼저 모집단이 집락으로 구성되어 있고, 추출된 집락으로부터 계통표본을 반복적으로 추출하여 민감한 정보를 얻는 데 무관질문모형을 사용한 집락 반복계통 무관질문모형을 제안하였다. 다음으로 제안한 모형을 층화된 모집단에서도 사용할 수 있도록 층화집락 반복계통추출법에 의한 무관질문모형으로 발전시켰으며, 각 층의 집락을 확률비례복원추출 또는 확률비례비복원추출하는 층화 확률비례 반복계통 무관질문모형을 제안하였다. 또한 제안한 층화집락 반복계통 추출법에 의한 무관질문모형에서 각 층의 표본배분하는 문제를 비례배분과 최적배분 측면에서 다루었다. 마지막으로 제안한 층화집락 반복계통추출법에 의한 무관질문모형과 집락 반복계통추출법에 의한 무관질문모형과의 효율성을 비교하였다.