• 제목/요약/키워드: sample variance

검색결과 978건 처리시간 0.03초

소지역 추정방법을 이용한 실업자 수 추정 사례연구 (Estimation of the Number of the Unemployed Using Small Area Estimation Methods)

  • 권세혁
    • 한국조사연구학회지:조사연구
    • /
    • 제10권1호
    • /
    • pp.141-154
    • /
    • 2009
  • 정보화 사회에서는 목표지향적이고 세분화된 통계의 필요성이 높아지고 있으나 현재 사용되는 조사체계를 이용하면 추정 분산이 커져 생산된 통계의 정확도가 낮아진다. 표본크기를 늘리면 추정분산을 줄일 수 있으나 비용이나 시간 면에서는 비효율적이다. 현재와 비슷한 규모의 표본조사구 조사와 일반 행정통계를 이용하여 일정 신뢰수준을 갖춘 통계를 생산할 수 있는 소지역 추정법에 대한 연구가 진행되어 개발 적용되고 있다. 본 연구에서는 소지역 추정법을 활용하여 대전광역시의 5개 구별 실업자 수를 추정하고 추정치의 CV 값을 계산하여 추정방법의 효율성을 비교하는 사례분석을 실시하였다. 또한 합성추정량과 복합추정량의 MSE를 보다 정확하게 계산하는 방법으로 잭나이프 방법을 제안하고 계산방법을 보였다.

  • PDF

임상시험에서 중도탈락을 고려한 표본크기의 결정 (Sample Size Calculations with Dropouts in Clinical Trials)

  • 이기훈
    • Communications for Statistical Applications and Methods
    • /
    • 제15권3호
    • /
    • pp.353-365
    • /
    • 2008
  • 임상시험에서 피험자수는 검정가설, 변수값의 분산과 유효차이, 검정력과 유의수준 등에 의해 결정되어진다. 일반적으로 수학적으로 계산된 피험자수에 중도탈락 예상치를 고려한 피험자수를 추가하여 최종적인 실험참가자수를 결정하는데 본 논문에서는 이론적인 계산식에서부터 중도탈락을 고려하여 피험자수를 결정하는 방법을 제안한다. 임상시험에서 많은 자료는 경시적(longitudinal) 형태를 갖고, ITT(intention to treat) 실험의 경우 중도탈락이 생기면 결측값으로 처리하지 않고 탈락직전에 관측된 값을 최종값으로 대체하는 LOCF(last observation carried forward) 방법을 주로 사용한다. 이러한 LOCF 방법은 피험자수 계산에 사용했던 분산과 유효차이 값의 가정에 왜곡을 가져오기 때문에 우리가 원하는 검정력을 보장 받지 못할 수 있다. 본 연구에서는 중도탈락률에 관한 정보를 포함하는 피험자수의 결정식을 제안하고 평균의 동일성 검정 경우에 검정력을 비교하여 이러한 산출방식이 합리적임을 실증하였다.

변량표본추출간격을 이용한 범위관리도와 분산관리도의 ATS비교 (A Comparison of Average Time Rate with range and variance chart when using variable sampling interval)

  • 이희춘;지선수
    • 산업경영시스템학회지
    • /
    • 제17권30호
    • /
    • pp.101-106
    • /
    • 1994
  • The basic of the VSI charts is that if the sample statistic computed after a sample is taken shows some indication of a process change than the sampling interval before the next sample should be short otherwise long. This paper was shown the VSS chart can be considerably more efficient than the FSS chart and the effectiveness of VSI R chart with S chart used for monitoring a process standard deviation.

  • PDF

Sample Size Determination for the Estimation of Population Density of Marine Benthos on a Tidal Flat and a Subtidal Area, Korea

  • Koh, Chul-Hwan;Kang, Seong-Gil
    • Journal of the korean society of oceanography
    • /
    • 제33권3호
    • /
    • pp.113-122
    • /
    • 1998
  • The requisite numbers of sample replicates for the population study of soft-bottom benthos were estimated from survey data on the Songdo tidal flat and subtidal zone in Youngil Bay, Korea. Large numbers of samples were taken; two-hundred-fifty 0.02 m$^2$ box corers and fifty 0.1m$^2$ van Veen grabs were taken on the Songdo tidal flat and in Youngil Bay, respectively. The effect of sampler size on sampling efforts was investigated by pooling the unit samples in pairs, fours, eights, etc. The requisite number of sample replicates (n$_r$) was determined by sample variance (s$^2$) and mean (m) function (n$_r$:s$^2$/P$^2$m$^2$), at P=0.2 level, in which s$^2$ and m were calculated from the counts of individuals collected. For example, seven samples of 0.02 m$^2$ corer for the intertidal and two samples of 0.1 m$^2$ van Veen grab for subtidal fauna were required to estimate the total density of community. The smaller sampler size was more efficient than larger ones when sampling costs were compared on the basis of the total sampling area. The requisite number of sample replicates was also predicted ($\^{n}$n$_r$) by substituting $\^{s}$$^2$ obtained from the regression of s$^2$ against m using the Taylor's power law ($\^{s}$$^2$:am$^b$). The regression line of survey data on s$^2$ and m plotted on log scale was well fitted to the Taylor's power law (r$^2$${\geq}$0.95, p<;0.001) over the whole range of m. The exponent b was, however, varied when it was estimated from m which was categorized into classes by its scale. The fitted exponent b was large when both density class and the sampler size were large. The number of sample replicates, therefore, could be more significantly estimated, if regression coefficients (a and b) would be calculated from sample variance and mean categorized into density classes.

  • PDF

Improved Statistical Testing of Two-class Microarrays with a Robust Statistical Approach

  • Oh, Hee-Seok;Jang, Dong-Ik;Oh, Seung-Yoon;Kim, Hee-Bal
    • Interdisciplinary Bio Central
    • /
    • 제2권2호
    • /
    • pp.4.1-4.6
    • /
    • 2010
  • The most common type of microarray experiment has a simple design using microarray data obtained from two different groups or conditions. A typical method to identify differentially expressed genes (DEGs) between two conditions is the conventional Student's t-test. The t-test is based on the simple estimation of the population variance for a gene using the sample variance of its expression levels. Although empirical Bayes approach improves on the t-statistic by not giving a high rank to genes only because they have a small sample variance, the basic assumption for this is same as the ordinary t-test which is the equality of variances across experimental groups. The t-test and empirical Bayes approach suffer from low statistical power because of the assumption of normal and unimodal distributions for the microarray data analysis. We propose a method to address these problems that is robust to outliers or skewed data, while maintaining the advantages of the classical t-test or modified t-statistics. The resulting data transformation to fit the normality assumption increases the statistical power for identifying DEGs using these statistics.

당뇨환자의 자기간호행위 영향요인 분석 (A Study of Factors Predicting Self-care Behavior in Diabetics)

  • 김영옥
    • 대한간호학회지
    • /
    • 제28권3호
    • /
    • pp.625-637
    • /
    • 1998
  • To determine factors affecting self-care behavior of diabetics, the relationships of hardiness, family support, demographic and medical variables to self-care behavior were investigated in 180 samples with non-insulin dependent diabetes mellitus. In stepwise multiple regression analysis, 26.76% of the variance in self-care behavior was accounted for by family support(15.52%), age(7.76%), and clinical history (2.07%). To compare the magnitude of predictor's significance by gender, stepwise multiple regression was conducted seperatively by gender group. In the male sample 25.22% of the variance in self-care behavior was accounted for by family support, age, and challenge. In the female sample family support, age, and committment were significant predictors in self-care behavior with 28.82% of the variance. The results highlight the value of family support in self-care behavior in diabetics regardless of gender difference. According to the finding of this study, family support is the most significant predictor of self-care behavior in NIDDM. This implicates that in future diabetic care, a family member should be encouraged to participate in the patient education process. Also as hardiness is not supported by a unidimensional construct, more empirical studies are recommended to differentiate the conceptual traits for the three subconcepts of hardiness.

  • PDF

원 달러 선물시장을 이용한 헤지효과성 (Hedge Effectiveness in Won-Dollar Futures Markets)

  • 홍정효;문규현
    • 재무관리연구
    • /
    • 제21권1호
    • /
    • pp.231-253
    • /
    • 2004
  • 본 연구는 원 달러현물포지션보유에 따른 현물변동의 위험을 헤지하기 위하여 원 달러선물시장(Futures Markets)을 이용한 헤지효과성을 분석하고자 하였다. 이를 위하여 동적헤지모형인, 이변량 ECT-ARCH(1)모형과 최소분산모형을 설정한 후, 2001년 1월 2일부터 2002년 12월 31일까지의 일별 단위로 추출된 원 달러현물환율자료와 원 달러선물자료를 사용하여 헤지비율을 추정하고 헤지성과를 분석하였다. 또한 헤지성과의 비교 및 분석 시에서는 단순헤지모형(naive hedging model)을 추가적으로 포함시켰으며, 전통적 헤지모형인 최소분산헤지모형과 이변량 ECT-ARCH(1)모형을 이용하여 추정한 헤지비율의 크기는 크게 다르지 않는 것으로 나타났다. 주요 실증분석결과는 다음과 같다. 첫째, 전체분석기간과 분석기간을 세분화한 연도별 헤지비율 모두 최소분산헤지모형의 헤지비율이 시간이 경과함에 따라 헤지비율이 변동하는 것으로 가정하는 이변량 ECT-ARCH(1)모형의 헤지비율보다 상대적으로 나쁘지 않는 것으로 나타났다. 둘째, 헤지효과성을 측정한 결과 내표본(within-sample) 및 외표본(out-of-sample)기간동안 단순헤지모형과 최소분산헤지모형(minimum variance hedging model)모두 헤지비율이 시간에 따라 변화하는 이변량 ECT-ARCH(1)모형의 헤지효과성보다 상대적으로 더 나은 것으로 나타났다. 따라서 투자자들이 원 달러현물환율 및 선물환율의 시계열 특성이나 헤지비율의 시간가변성 등을 고려하지 않고 단순한 최소분산모형을 헤지전략에 사용하여도 무방함을 의미한다. 셋째, 헤지기간에 따른 헤지성과를 분석하기 위해 헤지기간을 1주일물과 2주일물 원 달러선물로 확대하였을 경우, 1일물을 이용한 경우보다 헤지성과가 내표본과 외표본에서 모두 상대적으로 더 나은 것으로 나타났다.

  • PDF

Estimating Variance Function with Kernel Machine

  • Kim, Jong-Tae;Hwang, Chang-Ha;Park, Hye-Jung;Shim, Joo-Yong
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.383-388
    • /
    • 2009
  • In this paper we propose a variance function estimation method based on kernel trick for replicated data or data consisted of sample variances. Newton-Raphson method is used to obtain associated parameter vector. Furthermore, the generalized approximate cross validation function is introduced to select the hyper-parameters which affect the performance of the proposed variance function estimation method. Experimental results are then presented which illustrate the performance of the proposed procedure.

층화 추출에서 보정추정량에 대한 붓스트랩 분산 추정 (Bootstrap Variance Estimation for Calibration Estimators in Stratified Sampling)

  • 염준근;정영미
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2001년도 추계학술대회 발표논문집
    • /
    • pp.77-85
    • /
    • 2001
  • 무응답 상황하에서 보정 추정량에 대해 관심변수와 강한 상관계수를 가진 보조정보의 수준에 따라 모집단 총합에 대한 추정량과 분산추정량을 붓스트랩 방법을 이용해서 구했다. 이때 존재하는 보조정보의 수준이 표본인 경우와 모집단인 경우로 나누어 모집단 총합에 대한 보정 추정량(calibration estimator)을 구하고, 그에 따른 붓스트랩 분산 추정량을 도출하였다. 또한 테일러 분산 추정량, 잭나이프 분산 추정량과 붓스트램 분산 추정량의 효율성을 모의 실험을 통해 비교해 보았다.

  • PDF