• 제목/요약/키워드: 층화추출법

검색결과 60건 처리시간 0.03초

축산물생산비조사를 위한 복합표본설계 (A Complex Sampling Design for the Estimation of Korean Livestock Production Cost)

  • 김수택;김영원
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.675-694
    • /
    • 2008
  • 축산물 생산비 조사는 우리나라에서 생산되는 7종의 주요 축산물에 대한 생산비를 산출하는 것을 목적으로 한다. 따라서 2005년 농업총조사 자료를 바탕으로 전국의 양축 농가 현황을 파악하였으며, 축산물별 평균 생산비에 대한 추정오차가 3%이내가 되도록 표본 축산농가수를 결정하고, 표본의 대표성을 유지하면서 조사 업무의 수월성을 고려하여 농업특성화 조사구를 1차 추출단위로 활용하였다. 본 연구에서는 농업특성화 조사구들을 양축 특성에 따라 층화하고 각 층에서 예비 표본 조사구를 추출하였다. 다음으로 예비 표본 조사구를 실사하여 1단계 표본을 구성하고, 1단계 표본 양축 농가로부터 최종 표본 농가를 계통추출하는 이중추출법을 이용하였으며 이에 따른 추정법을 제시하였다.

주거 실태 및 수요조사 표본설계 (Sample Design in Korea Housing Survey)

  • 변종석;최재혁
    • 한국조사연구학회지:조사연구
    • /
    • 제11권1호
    • /
    • pp.123-144
    • /
    • 2010
  • 지역별 계층별 주거실태 파악을 위한 주거 실태 및 수요조사의 새로운 표본설계는 전국 16개 시도별로 조사결과의 독립추계가 가능하도록 설계하는 것을 원칙으로 하여 총 45개의 층으로 층화한다. 조사의 표본오차 관리 대상 변수로 주택사용면적, 가구소득, 가구주 소득, 가구 생활비 등을 고려하여 표본규모를 결정한다. 각 지역의 표본크기는 기존조사의 결과 중 상대표준오차를 이용하여 결정하고 세부 층에 대한 표본배정은 가구 수의 제곱근비례 배정방법을 적용한다. 표본조사구의 추출은 조사구의 크기에 비례한 확률비례계통추출법으로 추출하고 계통추출에 있어서는 추출단위를 분류지표에 따라 정렬한 후 추출한다. 주택의 재건축, 재개발 등의 변화를 반영하기 위해 신규 아파트 단지를 고려하되 주택은 멸실에 대한 자료를 얻기 어렵기 때문에 신규 주택은 고려하지 않는다. 가중값은 설계가중값, 무응답 조정, 사후층화 조정의 과정을 통해 추정량과 분산 추정량에 이용한다. 추정의 효율을 살펴보기 위해 분산추정량의 설계효과를 계산한다.

  • PDF

층화추출법에 의한 해양기상환경의 표본추출 타당성 연구 (Feasibility Study on Sampling Ocean Meteorological Data using Stratified Method)

  • 한송이;조용진
    • 한국해양공학회지
    • /
    • 제28권3호
    • /
    • pp.254-259
    • /
    • 2014
  • The infrared signature of a ship is largely influenced by the ocean environment of the operating area, which has been known to cause large changes in the signature. As a result, the weather condition has to be clearly set for an analysis of the infrared signatures. It is necessary to analyze meteorological data for all the oceans where the ship is supposed to be operated. This is impossibly costly and time consuming because of the huge size of the data. Therefore, the creation of a standard environmental variable for an infrared signature research is necessary. In this study, we compared and analyzed sampling methods to represent ocean data close to the Korean peninsula. In order to perform this research, we collected ocean meteorological records from KMA (Korea Meteorological Administration), and sampled these in numerous ways considering five variables that are known to affect the infrared signature. Specifically, a simple random sampling method for all the data and 1-D, 2-D, and 3-D stratified sampling methods were compared and analyzed by considering the mean square errors for each method.

응답률이 관심변수의 지수함수를 따를 경우 정보적 표본설계 기법을 이용한 모수추정 (Estimation using informative sampling technique when response rate follows exponential function of variable of interest)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.993-1004
    • /
    • 2017
  • 표본조사에서는 추정의 정확성 및 정밀성 향상을 위해 흔히 층화추출법을 사용하며 층 내에서는 동일한 표본 가중치를 이용하여 표본을 추출한다. 그러나 실제 응답률은 관심변수 값에 영향을 받을 수 있기 때문에 주어진 동일한 가중치는 응답률을 반영하여 보정되어야 한다. 또한 관심변수가 연속형 보조변수와 선형 관계가 있고 보조변수를 기준으로 층이 나누어진 경우에는 층 내에서 동일한 가중치를 사용하는 것 보다 층을 세분화한 후 얻어진 가중치를 사용하는 것이 효과적일 수 있다. 본 연구에서는 응답률이 관심변수 자료 값의 지수함수이고, 관심변수가 보조변수와 선형 관계가 있을 때 정보적 표본설계 기법을 이용하여 추정의 정확성과 정밀성을 높이는 방법을 제안하였다. 또한 모의실험을 통하여 제안된 방법의 우수성을 확인하였다.

층화표본에서의 표본 배분에 대한 연구 (A Study on Sample Allocation for Stratified Sampling)

  • 이인규;박민규
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1047-1061
    • /
    • 2015
  • 층화표본추출(stratified sampling)은 모집단을 구성하는 층에 대한 정보를 표본설계에 반영함으로써 추정량의 분산을 낮추기 위한 표본추출 방법으로, 표본배분 방안의 선택이 층화표본의 효과를 결정하는데 매우 중요한 요소이다. 전통적인 표본배분 방법으로는 비례배분법(proportional allocation)과 네이만배분법(Neyman alloction)이 주로 사용되는데, 이는 층별 추정량의 분산에 영향을 미치는 요인들을 표본 배분에 반영함으로써 전체 추정량의 분산을 최적화하기 위한 것이다. 이론적으로는 층크기(size of strata)만을 반영하는 비례배분법보다 층별 표준편차(standard deviation)를 함께 고려하는 네이만배분법이 추정량의 분산을 낮추는데 더 효과적임이 알려져 있다. 그러나 층별 표준편차에 대한 사전 정보가 모집단을 잘 반영하지 못하면 네이만배분법의 효과를 기대할 수 없으며, 특히 복수의 관심변수를 조사하는 다목적조사(multi-purpose survey)에서는 각 관심변수들의 층별 표준편차가 서로 다른 양상을 나타내기 때문에 네이만배분법이 적합하지 않다는 주장이 제기되기도 한다. 한편 표본조사에서는 조사단계에서 발생하는 무응답으로 인한 추정량의 편향을 제거하기 위해 응답률 보정 방법이 사용되는데, 이 또한 추정량의 분산에 영향을 미치는 주요한 요인 중에 하나이다. 그러나 전통적인 표본배분 방법은 응답률(response rate)을 감안하지 않기 때문에 층별 응답율에 차이가 크게 나타날 경우 층화표본에 의한 효과가 저하될 수 있다. 이에 본 연구는 층화표본추출에서 층간 응답률의 차이가 추정량의 분산에 미치는 영향을 살펴보고, 층별 응답률 정보를 표본설계에 반영하는 새로운 표본배분 방법을 제안하였다. 모의실험을 통해 확인한 결과 네이만배분법은 당초 표본배분 시에 적용한 층별 표준편차의 구조가 각 층의 응답률 보정과정에서 증가하는 분산을 반영하지 못하기 때문에 층간 응답률의 편차가 커질수록 효율이 저하되는 것으로 나타났다. 반면 층 크기와 층별 응답률을 함께 반영한 배분방법은 비례배분법에 비해 효율이 개선되며, 층간 응답률의 편차가 클수록 그 효과는 커진다. 특히 층별 응답률의 변동계수(coefficient of variance)가 층별 표준편차의 변동계수를 상회하는 경우는 네이만배분법 보다도 효율적인 추정량을 제공함을 확인하였다. 아울러 응답률을 반영한 배분방법은 기존 배분방법에 비해 각 층별 추정량을 보다 안정적으로 추정할 수 있기 때문에 층별 추정을 목적으로 하는 층화표본조사에서는 여타 추정방법보다 더 효과적이다. 층별 응답률에 대한 정보는 관심변수가 다르더라도 추출틀이 유사한 기존 조사의 결과를 활용할 수 있다는 점에서 표준편차에 비해 비교적 정보 수집이 용이한 장점이 있고, 다목적조사에서도 관심변수의 척도(scale)나 개수와 관계없이 적용 가능하기 때문에 활용도가 높을 것으로 생각된다.

농촌거주 농업인과 비농업인의 식행동과 건강행동의 비교

  • 정금주;조영숙;이승교
    • 대한지역사회영양학회:학술대회논문집
    • /
    • 대한지역사회영양학회 2004년도 춘계학술대회
    • /
    • pp.413.1-413
    • /
    • 2004
  • 농촌지역은 건강과 식생활의 자연친화적으로 볼 수 있으나 실제로 농약사용과 과다한 노동 부하와 함께 농업의 세계화 추세에 따라 농업종사자의 정신적 육체적 어려움이 클 것으로 본다. 이에 따라 농촌에서 거주하지만 농업에 종사하는 사람과 비농업에 종사하는 사람들 간에 식품의 생산과 식행동 및 건강관리 행동에 차이를 알아보고 농업종사자의 나은 건강생활을 위한 자료로 활용하기 위하여 본 연구를 실시하였다. 농촌을 행정구역별로 인구비례에 따라 층화추출법으로 1870명을 선발하였다.(중략)

  • PDF

상가건물 임대차 실태조사

  • 박무익;이계오
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.321-326
    • /
    • 2002
  • 상가건물임대차보호법의 시행령을 제정하는데 필요한 근거정보를 수집하기 위한 임차 사업체조사의 표본설계과정과 추정법을 설명하고 주요 조사결과를 제시하였다.

  • PDF

지천유입이 있는 대하천에서 수질예측을 위한 인공신경망모델의 개발 (Development of Artificial Neural Network Model for Prediction of Water Quality Parameters in Large Rivers with Tributary Inflow)

  • 서일원;윤세훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.141-141
    • /
    • 2017
  • 본 연구에서는 대하천의 8개의 수질인자(수온, 용존산소, 수소이온농도, 전기전도도, 총질소, 총인, 탁도, 클로로필-a)를 예측할 수 있는 인공신경망모델을 개발하였다. 인공신경망모델(ANN)은 수질데이터가 가지는 불확실성 및 비정상성, 복잡한 상호관련성에 효과적으로 대응할 수 있는 데이터기반 모델이다. 데이터기반 모델의 특성상 예측정확도를 높이기 위해서 양질의 입력데이터를 구성하는 것이 가장 중요하다. 때문에 각각의 수질인자뿐만 아니라 기상학적 인자 또한 예측을 위한 입력자료로 사용하였으며, 요인분석 및 층화표층추출법을 적용하여 입력데이터를 구성하였고 앙상블기법을 이용하여 추가적으로 예측의 정확도를 향상시켰다. 개발된 모델을 이용하여 지천유입이 있는 북한강의 수질자료를 예측한 결과 탁도를 제외한 7개의 수질인자 모두 0.85 이상의 설명력을 보였으며, 실측값과 예보값을 비교해본 결과 평균적으로 10% 미만의 에러값을 나타냈다. 요인분석을 통하여 연관성있는 인자를 입력인자로 추가한 경우 향상된 결과값을 보였주었으며, 앙상블기법을 적용한 결과 정확도 면에서 큰 향상을 보여주었다.

  • PDF

층화 혼합 승법 양적속성 확률화응답모형 (A Stratified Mixed Multiplicative Quantitative Randomize Response Model)

  • 이기성;홍기학;손창균
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2895-2905
    • /
    • 2018
  • Lee(2016a)는 Bar-Lev et al.(2004)의 모형에 무관한 변수를 추가하여 민감한 변수, 변환된 변수 그리고 무관한 변수 중에서 확률장치에 의해 선택된 질문에 응답하도록 하는 승법 양적 확률화응답모형을 제안하였다. 본 연구에서는 Bar-Lev et al.(2004)이 제안한 강요 양적속성 승법모형에 무관한 변수와 강요응답을 새롭게 추가한 혼합 승법 양적속성 확률화응답모형을 제안하였다. 그리고 무관한 변수에 대한 정보를 아는 경우와 모르는 경우로 나누어 민감한 양적속성을 추정할 수 있는 이론적 체계를 구축하였다. 또한, 모집단이 층화되어 있을 때에도 제안한 모형의 적용이 가능하도록 층화 혼합 승법 양적속성 확률화응답모형으로 확장하였고 층화추출에 있어서 비례배분과 최적배분 문제를 다루었다. 마지막으로 기존의 승법모형인 Eichhorn-Hayre(1983) 모형, Bar-Lev et al.(2004) 모형, Gjestvang-Singh(2007) 모형, Lee(2016a) 모형이 제안한 혼합 승법 양적속성 확률화응답모형의 특수한 형태임을 확인할 수 있었고, Bar-Lev et al.(2004) 모형과의 효율성 비교 결과 $C_x$값이 작을수록 그리고 $C_z$값이 클수록 제안한 혼합 승법 양적속성 확률화응답모형이 Bar-Lev et al.(2004)의 모형보다 효율적이었다.