• 제목/요약/키워드: 표본 포함확률

검색결과 58건 처리시간 0.025초

중도절단된 생존함수의 신뢰구간 비교연구

  • 이경화;이재원
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.251-255
    • /
    • 2005
  • 중도절단된 자료와 표본수가 적은 자료를 가지는 생존분석에서 생존율을 추정하거나 두 집단의 생존율을 비교할 때 정규분포 근사를 가정한 신뢰구간을 이용하는 데는 많은 어려움이 생긴다. 생존함수의 신뢰구간에 대한 중도절단을, 표본의 크기에 따른 다양한 상황의 모의실험을 통하여 Kaplan-Meier, Nelson, 적률 추정량 그리고 cox model의 ${\beta}$을 가지고 붓스트랩을 이용한 신뢰구간과 비모수 신뢰구간, 우도비 신뢰구간의 실제 포함 확률을 비교해보고자 한다.

  • PDF

분산 성분 모형에 대한 붓스트랩 보정 신뢰구간 (Bootstrap Calibrated Confidence Bound for Variance Components Model)

  • 이용희
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.535-544
    • /
    • 2006
  • 분산 성분 모형 하에서 분산 성분들의 함수에 대한 통계적인 추론, 특히 소표본 하에서의 신뢰구간에 대한 방법들은 오랜 기간에 걸쳐서 여러 가지 방법들이 개발되어져 왔다. 그 대표적인 방법이 Graybill and Wang(1980)에 의해 제안된 수정 대표본 방법에 의거한 신뢰구간 추정법이며 현재까지 다양한 실험계획 방법 하에서 분산 성분들의 여러 가지 형태의 함수들에 대하여 확장과 개량이 이루어져 왔다. 본 연구에서는 분산 성분 모형의 균형 실험 가정 하에서 분산 성분들의 선형 결합이 관심있는 모수일 때 분산 분석에 의해 얻어진 수정 대표본 신뢰구간의 실제 포함확률을 툴스트랩 보정을 이용하여 개선하는 방법에 대하여 논의한다. 붓스트랩 보정을 이용함으로서 신뢰구간의 포함 확률의 정도는 점근적 이차 차수까지 개선되며 특히 선형 결합의 계수들이 모두 양수이고 결합의 수가 증가할 경우 수정 대표본 신뢰구간의 포함확률이 주어진 신뢰계수보다 항상 커지게 되는 단점을 개선할 수 있음을 보인다. 제안된 붓스트랩 보정 신뢰구간의 효율을 소표본의 경우에 모의실험을 통하여 평가한다.

비 가우시안 잡음이 존재하는 무선 센서 네트워크에서 Robust Statistics를 활용하는 수신신호세기기반의 위치 추정 기법 (A RSS-Based Localization Method Utilizing Robust Statistics for Wireless Sensor Networks under Non-Gaussian Noise)

  • 안태준;구인수
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.23-30
    • /
    • 2011
  • 무선 센서 네트워크에서, 각 센서 노드들로부터 수집된 정보를 효율적으로 활용하기 위해 센서 노드의 정확한 위치 정보는 필수적이다. 센서 노드의 위치를 추정하는 다양한 기법들 중, 일반적으로 많이 사용되는 수신신호세기(RSS)기법은 추가적인 하드웨어 자원 없이 쉽게 구현될 수 있으나 채널 환경에 따라 다양한 표본 데이터들이 수집 될 수 있고, 특히 이상점(outlier)이 포함 될 수 있다. 이러한 이상점들은, 수집된 표본들로부터 통계적 분석(statistical analysis)에 상당한 요인을 미치며 위치 추정 오차를 발생시키는 주요한 원인이 된다. 따라서 본 논문에서는, 이상점이 포함 된 표본들로부터 정확한 위치 추정을 위해 Robust Statistics를 적용한 가우시안 필터 알고리즘을 제안한다. 제안한 알고리즘은 이상점이 포함된 표본들로부터 이상점을 제거하고, 낮은 확률값의 표본들을 배제함으로써 위치 추정의 정확도를 향상시킨다. 시뮬레이션 결과로부터, 이상점이 포함 된 표본들로부터 비 가우시안적 환경에서 제안된 방법의 위치 추정의 정확성 향상과 강인성을 확인하였다.

독립표본에서 두 모비율의 차이에 대한 가중 POLYA 사후분포 신뢰구간 (The Weighted Polya Posterior Confidence Interval For the Difference Between Two Independent Proportions)

  • 이승천
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.171-181
    • /
    • 2006
  • 모비율 차이의 구간 추정에서 표준으로 인식되고 있는 Wald 신뢰구간은 모비율 구간 추정과 마찬가지로 포함확률의 근사성에서 문제가 있다는 것이 알려져 있다. 이에 대한 대안으로 모비율 차이의 신뢰구간에 대한 많은 연구가 있어 왔으나 대부분의 신뢰구간은 매우 복잡한 과정을 통해 얻어지게 되어 있어 실용성에 대한 문제가 제기될 수 있다. 이와 비교하여 Agresti와 Caffo(2000)에 의해 제시된 신뢰구간은 매우 간편한 식에 의해 구할 수 있어 이해하기 쉽고 포함확률과 포함확률의 평균절대오차에 있어 다른 복잡한 신뢰 구간과 필적할 수 있다. 그러나 Agresti-Caffo 신뢰 구간은 포함확률이 명목 신뢰수준을 상회하는 보수적인 구간으로 알려져 있다. 본 논문에서는 이승천(2005)에서 이항비율의 신뢰구간을 구하기 위해 사용된 가중 Polya 사후분포를 이용하여 두 모비율 차이의 신뢰구간을 구하였다. 이렇게 구하여진 신뢰구간은 간편성은 물론 Agresti-Caffo 신뢰구간의 보수성을 개선하였다.

낮은 이항 비율에 대한 신뢰구간 (Confidence Intervals for a tow Binomial Proportion)

  • 류제복;이승주
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.217-230
    • /
    • 2006
  • 본 연구에서는 낮은 이항비율에 관한 구간추정을 위해서 어떤 신뢰구간이 바람직한지를 살펴보았다. 실제 적으로 희귀질병, 특정 산업재해율, 그리 고 기생충에 관한 실태조사를 위해서 대규모 표본조사가 실시된다. 표본 규모가 크고, 0 < p ${\leq}$ 0.1인 상황에서 모비율 p의 추정에 바람직한 신뢰구간을 살펴보았다. 위의 조건에서 6가지의 신뢰구간들에 대해 평균포함확률과 평균제곱오차의 제곱근, 그리고 평균기대폭을 사용한 결과 Mid-p 신뢰 구간이 가장 바람직하고 다음으로 AC, score와 Jeffrey 신뢰 구간들이 적절한 것으로 밝혀졌다.

가설검정과 신뢰구간의 재현성 (Reproducibility of Hypothesis Testing and Confidence Interval)

  • 허명회
    • 응용통계연구
    • /
    • 제27권4호
    • /
    • pp.645-653
    • /
    • 2014
  • p-값은 관측 표본과 관측 결과보다 심하게 대안가설의 방향으로 영가설을 이탈하는 표본들이 영가설 하에서 갖는 확률이다. p-값이 일정 ${\alpha}$(= 0:05)보다 작게 나타나면 연구자는 대안가설이 지지된 것으로 본다. 그런 경우라고 하더라도 그의 가설이 향후 연구에서 번복될 수 있는데 그 이유는 p-값이 표본에 따라 변동하는 통계량이기 때문이다. Boos와 Stefanski (2011)는 붓스트랩 방법으로 p-값의 예측분포를 구할 수 있음을 보였다. 그들은 그 분포의 상위 10-20% 분위수가 ${\alpha}$보다 작은가를 확인할 필요가 있음을 강조한다. 만약 그렇지 않은 경우에는 "지지"된 가설의 재현성이 문제될 수 있기 때문이다. 가설검정에서 일정 수준의 재현율을 확보하기 위해서는 표본의 증대가 요구된다. 이 연구는 k배 확대 붓스트랩 표본추출(boosted bootstrap sampling)로써 필요한 표본크기를 계산할 수 있음을 두 표본의 비교와 다중선형회귀의 수치 예에서 보인다. k 값을 정하기 위해서는 몇 차례 시행착오를 해야 하지만 계산적 부담은 크지 않다. 95% 신뢰구간은 독립적인 표본들로부터 같은 방식으로 산출되는 구간이 미지의 모수를 포함할 확률이 95%가 되도록 설정된다. 이 연구는 한 관측표본으로부터 얻어진 95% 신뢰구간 내 개별 점이 미래 연구의 신뢰구간에도 포함될 것인지 그 재현성을 붓스트랩 재표본들에서 평가한다. 이 연구는 개별 점에서 산출한 신뢰구간 재현율을 그래프로 보인다.

깁스 표본 기법을 이용한 베이지안 계층적 모형: 야생쥐의 예 (Bayesian Hierachical Model using Gibbs Sampler Method: Field Mice Example)

  • 송재기;이군희;하일도
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권2호
    • /
    • pp.247-256
    • /
    • 1996
  • 본 논문은 깁스 표본 기법을 이용하여 Demster et al.(1981)에 의해 소개된 Field Mice자료를 분석하기 위하여 베이지안 계층적 모형을 적용시켜 보았다. Jeffrey의 사전확률을 이용한 사후 평균을 깁스 표본 기법을 이용하여 구하였고, 이로 부터 얻은 베이지안 추정량을 최소 자승 추정량, EM알고리즘을 이용한 랜덤 효과를 포함한 가능도함수에 대한 최대 가능도 추정량(MLR)과 비교하였다.

  • PDF

모의실험을 기반으로 지수형 응답률 보정을 위한 세부 층 결정에 관한 연구 (A study on the determination of substrata using the information of exponential response rate by simulation studies)

  • 민주원;신기일
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.621-636
    • /
    • 2018
  • 정보적 표본설계 기법을 적용하여 무응답의 영향을 줄이기 위한 연구가 진행되고 있다. 특히 초모집단모형(super population model)에 포함된 오차의 분포가 정규분포를 따르고 응답률이 지수함수를 따를 때 지수형 응답률 정보를 모수추정에 사용함으로써 추정의 정확성이 향상되는 것으로 알려져 있다. 최근 Chung과 Shin (2017)은 정보적 표본설계의 가중치를 구하기 위해 세부 층을 등간격으로 나누는 방법을 고려하였으며 세부 층의 개수가 추정의 정확성에 영향을 주는 것을 확인하였다. 이에 본 연구에서는 주어진 표본 규모에 따른 최적의 세부 층 개수와 최적의 층 경계를 구하기 위해 등간격, 분위수, LH 알고리즘을 이용하여 층을 나누는 방법을 살펴보았으며 모의실험을 통하여 각 방법의 결과를 비교하였다. 또한 다양한 형태의 보조변수 분포를 이용하여 실무에서 사용할 수 있는 세부 층 경계와 세부 층 개수를 정하는 기준을 제안하였다.

응답률이 관심변수의 지수함수를 따를 경우 정보적 표본설계 기법을 이용한 모수추정 (Estimation using informative sampling technique when response rate follows exponential function of variable of interest)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.993-1004
    • /
    • 2017
  • 표본조사에서는 추정의 정확성 및 정밀성 향상을 위해 흔히 층화추출법을 사용하며 층 내에서는 동일한 표본 가중치를 이용하여 표본을 추출한다. 그러나 실제 응답률은 관심변수 값에 영향을 받을 수 있기 때문에 주어진 동일한 가중치는 응답률을 반영하여 보정되어야 한다. 또한 관심변수가 연속형 보조변수와 선형 관계가 있고 보조변수를 기준으로 층이 나누어진 경우에는 층 내에서 동일한 가중치를 사용하는 것 보다 층을 세분화한 후 얻어진 가중치를 사용하는 것이 효과적일 수 있다. 본 연구에서는 응답률이 관심변수 자료 값의 지수함수이고, 관심변수가 보조변수와 선형 관계가 있을 때 정보적 표본설계 기법을 이용하여 추정의 정확성과 정밀성을 높이는 방법을 제안하였다. 또한 모의실험을 통하여 제안된 방법의 우수성을 확인하였다.

응답률이 선형인 표본조사에서 편향 보정 추정 (Bias adjusted estimation in a sample survey with linear response rate)

  • 정희영;신기일
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.631-642
    • /
    • 2019
  • 다수의 항목무응답이 발생한 표본조사에서는 추정의 정확성이 떨어진다. 이를 해결하기 위한 많은 방법이 개발되었으나 응답률이 관심변수에 의해 영향을 받는 경우임에도 이를 고려하지 않고 랜덤으로 무응답이 발생한다는 가정 하에서 사용하는 무응답 처리 방법을 사용하게 되면 편향이 발생하는 것으로 알려져 있다. Chung과 Shin (2017)과 Min과 Shin (2018)은 응답률이 관심변수의 함수인 경우에서 발생된 편향을 적절히 처리하여 추정의 정확성을 향상시키는 방법을 제안하였다. 본 연구에서는 응답률 함수가 선형(linear)이면서 초모집단 모형의 오차가 정규분포를 따르는 경우를 살펴보았으며 층별 모집단 수가 편향 보정에 영향을 주는지도 살펴보았다. 모의실험을 통하여 제안된 추정량의 성능을 살펴보았으며 실제 자료 분석을 통해 이를 확인하였다.