• 제목/요약/키워드: 표본추출방법

검색결과 609건 처리시간 0.031초

A comparison of alternative estimators in view of the Rao-Hartley-Cochran sampling scheme

  • 홍기학;이기성;손창균
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.181-187
    • /
    • 2006
  • 대규모 표본조사와 관련해서 관심변수와 보조변수간의 약한 상관관계를 고려한 Amahia et al.(1989)의 대체추정방법을 Rao-Hartley-Cocharn 추출방법에 적용해서 Rao추정량과 효율성을 비교 하였다.

  • PDF

모의실험을 기반으로 지수형 응답률 보정을 위한 세부 층 결정에 관한 연구 (A study on the determination of substrata using the information of exponential response rate by simulation studies)

  • 민주원;신기일
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.621-636
    • /
    • 2018
  • 정보적 표본설계 기법을 적용하여 무응답의 영향을 줄이기 위한 연구가 진행되고 있다. 특히 초모집단모형(super population model)에 포함된 오차의 분포가 정규분포를 따르고 응답률이 지수함수를 따를 때 지수형 응답률 정보를 모수추정에 사용함으로써 추정의 정확성이 향상되는 것으로 알려져 있다. 최근 Chung과 Shin (2017)은 정보적 표본설계의 가중치를 구하기 위해 세부 층을 등간격으로 나누는 방법을 고려하였으며 세부 층의 개수가 추정의 정확성에 영향을 주는 것을 확인하였다. 이에 본 연구에서는 주어진 표본 규모에 따른 최적의 세부 층 개수와 최적의 층 경계를 구하기 위해 등간격, 분위수, LH 알고리즘을 이용하여 층을 나누는 방법을 살펴보았으며 모의실험을 통하여 각 방법의 결과를 비교하였다. 또한 다양한 형태의 보조변수 분포를 이용하여 실무에서 사용할 수 있는 세부 층 경계와 세부 층 개수를 정하는 기준을 제안하였다.

가설검정과 신뢰구간의 재현성 (Reproducibility of Hypothesis Testing and Confidence Interval)

  • 허명회
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.645-653
    • /
    • 2014
  • p-값은 관측 표본과 관측 결과보다 심하게 대안가설의 방향으로 영가설을 이탈하는 표본들이 영가설 하에서 갖는 확률이다. p-값이 일정 ${\alpha}$(= 0:05)보다 작게 나타나면 연구자는 대안가설이 지지된 것으로 본다. 그런 경우라고 하더라도 그의 가설이 향후 연구에서 번복될 수 있는데 그 이유는 p-값이 표본에 따라 변동하는 통계량이기 때문이다. Boos와 Stefanski (2011)는 붓스트랩 방법으로 p-값의 예측분포를 구할 수 있음을 보였다. 그들은 그 분포의 상위 10-20% 분위수가 ${\alpha}$보다 작은가를 확인할 필요가 있음을 강조한다. 만약 그렇지 않은 경우에는 "지지"된 가설의 재현성이 문제될 수 있기 때문이다. 가설검정에서 일정 수준의 재현율을 확보하기 위해서는 표본의 증대가 요구된다. 이 연구는 k배 확대 붓스트랩 표본추출(boosted bootstrap sampling)로써 필요한 표본크기를 계산할 수 있음을 두 표본의 비교와 다중선형회귀의 수치 예에서 보인다. k 값을 정하기 위해서는 몇 차례 시행착오를 해야 하지만 계산적 부담은 크지 않다. 95% 신뢰구간은 독립적인 표본들로부터 같은 방식으로 산출되는 구간이 미지의 모수를 포함할 확률이 95%가 되도록 설정된다. 이 연구는 한 관측표본으로부터 얻어진 95% 신뢰구간 내 개별 점이 미래 연구의 신뢰구간에도 포함될 것인지 그 재현성을 붓스트랩 재표본들에서 평가한다. 이 연구는 개별 점에서 산출한 신뢰구간 재현율을 그래프로 보인다.

인구주택총조사 마이크로자료의 개인정보 노출제한방법 (A Method of Masking for 2005 Korean Census Microdata)

  • 정동명;정미옥
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.313-325
    • /
    • 2008
  • 통계이용자들의 마이크로자료 제공요구가 갈수록 증가하고 있으며 통계작성기관도 마이크로자료의 제공을 위해 노력을 기울이고 있는 실정이다. 그러나 마이크로자료에는 응답자의 개인정보가 많이 담겨 있으므로 자료를 그대로 제공할 경우 개인정보가 노출 될 가능성이 높기 때문에 자료제공시 적절한 방법으로 노출을 제한시켜 주어야만 한다. 본 논문에서는 마이크로자료 제공시 발생하는 응답자의 정보노출에 대한 개념과 이를 제한하는 방법 등을 소개하고, 2005년에 통계청에서 실시한 인구주택총조사의 2% 마이크로자료 제공을 위해 다양한 노출제한방법을 적용하여 자료파일을 작성하는 과정을 설명하였다. 즉, 10% 표본조사결과를 모집단으로 하고 계통추출한 표본을 대상으로 외부인이 식별할 가능성이 높은 12개 항목을 key 변수로 선정한 후, 각 변수의 조합별 유일성을 파악하고 노출위험을 계산하였다. 그 결과 2% 표본을 통한 정보의 축소는 물론 그룹화, 코딩 등을 포함한 일련의 방법들을 적용함으로써 인구주택총조사 마이크로자료의 개인정보 노출을 제한하는데 상당한 효과가 있음을 알 수 있었다.

어림과 나머지 성분을 이용한 연안 수온자료의 이상자료 감지 (Outlier Detection of the Coastal Water Temperature Monitoring Data Using the Approximate and Detail Components)

  • 조홍연;오지희
    • 한국해양환경ㆍ에너지학회지
    • /
    • 제15권2호
    • /
    • pp.156-162
    • /
    • 2012
  • 연안 환경모니터링 사업이 확대되면서 방대하게 축적되어 있는 연안 환경모니터링 자료의 통계적 분석을 위해서는 모니터링 자료에서 빈번하게 발생하는 이상 자료의 감지 처리가 우선적으로 필요하다. 본 연구에서는 연안 환경모니터링 자료의 어림성분과 나머지(또는 잔차)성분을 이용한 이상자료 진단기법을 제안하였다. 주기함수를 이용한 조화분석 방법과 국지 회귀함수추정 방법을 이용하여 각각 어림성분과 나머지성분을 추출한 후, 추출된 나머지성분 자료에 범용적인 Grubbs 검정기법 및 수정표본점수기법을 적용하여 이상자료를 진단 제거한 후 이상자료가 제거된 자료로 재구성하는 방법이다. 제안된 이 기법을 국립수산과학원 실시간어장정보시스템 제공하는 연안 수온 연속 모니터링 자료에 적용한 결과 이상자료가 성공적으로 제거되는 양상을 보이는 것으로 파악되었다.

統計學과 應용

  • 윤기중
    • 응용통계연구
    • /
    • 제2권1호
    • /
    • pp.1-17
    • /
    • 1989
  • 本稿는 統計學의 理論 개척과 발전을 위해서 應用分野의 연구에 주력해야 할 필요성을 밝히려 한다. 우선 기존의 統計理論이 應用分野에서 生成 발전된 점을 밝히는 동시에 應用分野에 대한 연구의 관심을 확대시켜야 할 필요성을 설명하려 한다. 물론 數理統計學이나 確率論과 같은 分野는 論理的 硏究方法으로 數理解析의 발전이나 方法을 개척할 수가 있다. 그러나 그것도 人類의 福祉증진에 기여하게 된다는 최종적인 목적성이 전제된다면 현실의 應用分野와 결코 무관할 수는 없을 것이다. 이상과 같은 목적을 위해서 우선 統計學이 과학으로 성립하기 이전의 生成 배경을 설명하면서 統計學이 人間의 生活과 얼마나 밀접하고 그 대상이 얼마나 광범위한가에 대하여 설명하려 한다. 처음부터 그것은 個人生活보다는 集團生活과 더욱 밀접한 관계가 있었다는 점을 강조하게 된다. 그리고 20世紀初에 론돈大學의 生物測定硏究室, 겔톤優生學硏究室 등을 중심으로 한 웰든, 겔톤, 피어슨 그리고 네이만의 生物測定硏究와 數理統計學연구와 핏샤와 끄ㅅ 등의 연구업적에 의해서 統計學이 科學으로 성립된 歷史的 사실을 반취하면서 統計學의 연구방법과 대상을 간접적으로 인식하게 된다. 또 統計學이 他科學과 비교하여 硏究對象 方法 그리고 實踐的 側面에서의 學問的 特殊性을 설명하면서 統計學연구의 應用側面을 강조하게 된다. 끝으로 선구자들의 統計學연구방법과 태도를 조감하면서 어떻게 하면 새로운 統計的方法을 개척할 수 있고 또 他分理 연구에 기존의 統計的方法이 기여할 수 있는가의 方法을 탐색하게 될 것이다. 즉 專門硏究機關에서, 實務現場에서 새로운 硏究對象을 찾아 새 方法을 개척할 수 있는가 하는 문제를 論議하게 된다. 이러한 탐구는 모두 과거에 統計學발전에 기여한 여러 선구자들의 연구방법과 업적을 되새기면서 유도된다.격)개발에 관심을 가진 사람들이 모이는 일일 것이다. 통계분야에서도 몇가지 표준화 활동이 ISO 를 중심으로 진행되고 있다. 예를 들면 실험과 검증 결과의 표현과 해석, 표본추출 방법 등에 관한 것으로 이들은 통계의 응용분야에서 꼭 필요한 표준이다. 구체적인 예로서 우리나라 국민의 표준체위값을 설정하기 위하여 측정조사할 때 측정방법 뿐 아니라 표본추출 방법과 통계자료 처리과정의 표준화가 이루어 지지 않는다면 각 기관에서 조사 발표하는 체위관계 자료가 상이하여 국가기관의 통계자료에 대한 신뢰성이 저하되고 통계값을 이용하여 의류, 신발 등의 제품을 제조하는 산업계에 혼란을 야기시킬 수 있다. 본 고에서는 ISO의 활동을 정보처리 분야에 초점을 맞춰 간략하게 설명하고 통계분야의 국제 활동을 비전문가인 필자들이 아는대로 소개하는 한편 국내활동의 필요성을 강조하여 관련 기관, 학계 및 산업계 관련전문가들의 ISO 국내활동 참여를 제의하고자 한다.mes$E조합에서는 견층비율의 자잠에서, D$\times$F조합에서는 웅잠의 견층비율에서 비교적 높은 값을 나타내었다.

좋은 컴퓨터 수업에 대한 대학생들의 인식 유형 분석 (Analyzing College Students' Perception of Quality Computer Class)

  • 김두규;이재무
    • 정보교육학회논문지
    • /
    • 제24권3호
    • /
    • pp.225-232
    • /
    • 2020
  • 본 연구는 대학생들이 좋은 컴퓨터 수업에 대하여 어떻게 생각하고 있는지를 밝히기 위함이다. 대학생들의 좋은 컴퓨터 수업에 대한 인식 유형을 분류하고 유형별 특징을 분석하였다. 대학생들의 주관적 생각을 추출하기 위하여 Q 방법론을 이용하였다. 먼저 면담과 선행 연구 분석을 통하여 진술문을 추출한 후 54개의 Q 표본을 선정하였다. 대학생 50명을 남녀 동수로 나누어 P 표본을 구성하고 Q 분류를 하게 하였다. Q 분류는 QUANL 프로그램을 수행하여 분석하였다. 분석 결과, 대학생들이 인식하는 좋은 컴퓨터 수업에 대한 유형은 네 가지로 추출되었다. 그리고 유형별 남녀 간의 차이는 없었으나, 일반대학과 교육대학 학생들은 유형의 차이가 확실히 나타났다. 좋은 컴퓨터 수업에 대하여 <유형 1>은 '창의적 문제해결을 통한 가치관 변화 지향 수업'이며, <유형 2>는 '학습자간 경쟁을 통한 컴퓨터 활용 능력 향상 수업'이고, <유형 3>은 '프로그래밍 능력과 함께 최신 컴퓨터 기술 습득 수업'이고, 그리고 <유형 4>는 '학습자 중심의 즐거운 수업'으로 인식하였다.

토양(土壤)중 물의 침투속도(浸透速度)의 공간변이성(空間變異性) 분석(分析) -I. Variogram (Analysis of Spatial Variability for Infiltration Rate of Field Soil -I. Variogram)

  • 박창서;김재정;조성진
    • 한국토양비료학회지
    • /
    • 제16권4호
    • /
    • pp.305-310
    • /
    • 1983
  • 화동미사질식양토(華東微砂質埴壤土)의 침투속도(浸透速渡)에 대한 변이성(變異性)이 표준통계학적(標準統計學的) 방법(方法)과 지질통계학적(地質統計學的) 방법(方法)인 Variogram에 의해 연구(硏究)되었다. 지질통계학적(地質統計學的) 개념(槪念)인 지역(地域) 변수(變數) 이론(理論)으로 관측치(觀測値)에 대한 공간변이성(空間變異性)이 기술(記述)되었고 구조분석(構造分析)된 후 Kriging을 위한 최적(最適)의 표본추출수(標本抽出數)와 그 거리(距離)를 결정(決定)할 수 있도록 장방형(長方型)의 $2{\times}3m$ Grid 형태(形態)로 표본추출(標本抽出)하여 수행(遂行)한 결과(結果)는 다음과 같다. 1. 표본(標本)에 대한 산술평균(算術平均)값과 표준편차(標準偏差) 값이 각각(各各) 3.56, 0.67cm/day이었으며 변이계수(變異係數)는 18.93%로서 관측치(觀測値)는 거의 정규분포(正規分布)를 나타내었다. 2. Sill값을 갖는 선형(線型)의 평균(平均) Variogram을 선정(選定)한 결과(結果) Nugget효과(效果)를 보였으며 그 범위(範圍)는 7.4m이었다. 3. Variogram의 구조분석(溝造分析) 결과(結果) 공시지역(供試地域) 표본수(標本數) 96과 같은 결과(結果)를 가져올 수 있고 최적표본수(最適標本數)는 8~10이었다. 4. Kriging값과 Kriging분산(分散)을 계산(計算)하는데 필요(必要)한 이론적(理論的)인 Variogram함수(函數)의 계수(係數)는 Nugget 효과(效果) 0.444cm/day, 선형(線型) Variogram의 기울기 0.003cm/day, 그리고 이웃간 거리(距離) h=7.4m이었다.

  • PDF

이동최소제곱근사법을 이용한 개선된 구조 신뢰성 해석 (An Improved Structural Reliability Analysis using Moving Least Squares Approximation)

  • 강수창;고현무
    • 대한토목학회논문집
    • /
    • 제28권6A호
    • /
    • pp.835-842
    • /
    • 2008
  • 응답면 기법은 수치적 효율성을 증대시키기 위해 구조 신뢰성 해석에 널리 적용되고 있다. 그러나 응답면 기법을 사용한 대형구조물의 신뢰성 해석에는 아직도 과도한 해석시간이 요구되고 비선형성이 큰 한계상태에 대해서는 확률변수에 대한 신뢰도지수의 민감도 측면에서 많은 오차가 발생한다. 그러므로, 이 연구에서는 이동최소제곱근사법을 적용한 새로운 응답면 기법을 제안한다. 기존의 응답면 기법에 사용되어온 최소제곱근사법은 표본점들에 동일한 가중값을 부여하여 응답면 함수의 계수를 결정한다. 반면에 이동최소제곱근사법은 설계점에 가까운 표본점들에 더 높은 가중값을 부여함으로써 설계점 근처에서 한계상태식에 더 가까운 응답면 함수를 제공하여 정확도를 증대시킨다. 이동최소제곱근사법을 이용한 신뢰성 해석 절차를 살펴보면, 먼저 선형 응답면 함수를 생성하여 설계점이 있을 영역을 결정한 다음, 이 영역에서 추출된 표본점들을 이용하여 2차 응답면 함수를 생성한다. 그 다음 단계에서는 기존에 추출된 표본점에 연속적으로 하나의 표본점을 더해가면서 응답면 함수를 더욱더 정확히 근사시킨다. 제안된 방법의 효율성을 검토하기 위해서 기존 연구자에 의해 제안된 수치적 문제 및 트러스 문제들에 대하여 신뢰성 해석을 수행하였다. 그 결과 제안된 방법은 민감도를 포함한 정확성 뿐만 아니라 계산 효율성도 증대시킴을 확인할 수 있었다.

예비교사들의 통계적 표집에 대한 이해 (Pre-service Teachers' Understanding of Statistical Sampling)

  • 고은성;이경화
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제21권1호
    • /
    • pp.17-32
    • /
    • 2011
  • 본 연구에서는 예비교사들의 통계적 표집에 대한 이해를 조사하였다. 먼저 선행 연구를 바탕으로 표집의 이해와 관련된 주요 주제를 표본의 대표성, 표집 변이성, 표집분포로 구분하고, 각각의 주요 주제에 대한 세부 개념 요소들을 선정하였다. 이에 대한 예비교사들의 이해를 조사한 결과 대부분의 예비교사들이 편의를 일으키지 않는 무작위 추출이 표집방법으로 적절함을 이해하고 있었으나 약 64%의 예비교사들만이 표본을 모집단의 준비례적 축소버전으로 인식하고 있었다. 표집에서 표본이 모집단에서 차지하는 비율보다 표본의 크기 자체가 중요함을 인식하는 예비교사는 극소수에 불과했으며, 조사 대상의 절반에 해당하는 예비교사들만이 신뢰할 수 있는 결과를 도출하기 위해 전체 표본의 크기가 아니라 표집 횟수가 중요함을 인식하였다. 그리고 표집분포는 모집단 분포의 형태와 무관하게 모집단의 평균을 중심으로 대칭적인 형태를 나타낸다는 것을 이해하는 예비교사는 매우 적었다.

  • PDF