• 제목/요약/키워드: goodness of fit test

검색결과 425건 처리시간 0.021초

어랑 분포를 이용한 NHPP 소프트웨어 신뢰성장 모형에 관한 연구 (An Approach for the NHPP Software Reliability Model Using Erlang Distribution)

  • 김희철;최유순;박종구
    • 한국정보통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.7-14
    • /
    • 2006
  • 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개 당 고장 발생률은 일반적으로 상수, 혹은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 잔존 결함 1개당 고장 발생률이 증가추세를 가진 어랑 분포를 이용한 어랑 모형을 제안하였다. 고장 간격시간으로 구성된 실측자료를 이용하여 기존의 모형과 어랑 모형의 모수 추정을 실시하였다. 어랑 모형의 형상모수를 선택하기 위하여 (누적)분포적합도 검정을 사용하였고 이 자료들에서 어랑 모형의 제안과 비교를 위하여 산술적 및 라플라스 검정, 적합도 검정, 편의 검정 등을 이용하였다.

Goodenss of Fit Test on Density Estimation

  • Kim, J.T.;Yoon, Y.H.;Moon, G.A.
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.891-901
    • /
    • 1997
  • The objective of this research is to investigate the problem of goodness of fit testing based on nonparametric density estimation with a data-driven smoothing parameter. The small and large smaple properties of the proposed test statistic $Z_{mn}$ are investigated with the minimizer $\widehat{m}$ of the estimated mean integrated squared error by the Diggle and Hall (1986) method.

  • PDF

모수적 엔트로피 추정량과 비모수적 엔트로피 추정량에 기초한 정규분포에 대한 적합도 검정 (Goodness-of-fit test for normal distribution based on parametric and nonparametric entropy estimators)

  • 최병진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.847-856
    • /
    • 2013
  • 본 논문에서는 모수적과 비모수적 엔트로피 추정량들에 기초한 정규분포에 대한 적합도 검정을 다룬다. 정규분포의 엔트로피에 대한 모수적 추정량으로 사용할 최소분산비편향추정량을 유도한다. 이 추정량과 대립가설 하에서의 자료생성분포에 대한 비모수적 엔트로피 추정량으로 표본엔트로피와 이것의 변형된 추정량들을 이용하여 검정통계량들을 구축했고 이 검정통계량들을 사용하는 새로운 엔트로피 기반 적합도 검정들을 제시한다. 제안한 검정들의 기각값들을 모의실험을 통해 추정해서 표의 형태로 제시한다. 성능의 조사를 위해 수행한 모의실험에서 제안한 검정들이 기존의 Vasicek (1976) 검정보다는 더 좋은 검정력을 가지는 것으로 나타난다. 응용에서 새로운 검정들이 정규성 검정을 위한 경쟁적인 도구로 시용될 수 있을 것으로 기대된다.

전진 제 2종 중도절단자료에 대한 Shapiro-Wilk 형태의 지수검정 (The Shapiro-Wilk Type Test for Exponentiality Based on Progressively Type II Censored Data)

  • 김남현
    • 응용통계연구
    • /
    • 제23권3호
    • /
    • pp.487-495
    • /
    • 2010
  • 본 논문에서는 지수분포의 검정에 자주 쓰이는 Shapiro와 Wilk (1972) 통계량과 이의 단점을 보완한 Kim (2001a)의 통계량을 위치모수가 주어지고 척도모수가 미지인 지수분포에서의 전진 제 2종 중도절단자료에 적용하였다. 이를 위하여 각각의 통계량을 Stephens (1978)을 이용하여 위치모수가 주어진 경우의 검정통계량으로 수정하고, 자료를 정규화 간격(normalized spacings)을 이용하여 변환하는 방법을 사용하였다. 모의실험을 통하여 검정력을 비교한 결과 Shapiro-Wilk 통계량보다 Kim (2001a)의 통계량을 이용할 때 고려한 거의 모든 경우 더 우수한 검정력을 나타내었다.

Differences by Selection Method for Exposure Factor Input Distribution for Use in Probabilistic Consumer Exposure Assessment

  • Kang, Sohyun;Kim, Jinho;Lim, Miyoung;Lee, Kiyoung
    • 한국환경보건학회지
    • /
    • 제48권5호
    • /
    • pp.266-271
    • /
    • 2022
  • Background: The selection of distributions of input parameters is an important component in probabilistic exposure assessment. Goodness-of-fit (GOF) methods are used to determine the distribution of exposure factors. However, there are no clear guidelines for choosing an appropriate GOF method. Objectives: The outcomes of probabilistic consumer exposure assessment were compared by using five different GOF methods for the selection of input distributions: chi-squared test, Kolmogorov-Smirnov test (K-S), Anderson-Darling test (A-D), Akaike information criterion (AIC) and Bayesian information criterion (BIC). Methods: Individual exposures were estimated based on product usage factor combinations from 10,000 respondents. The distribution of individual exposure was considered as the true value of population exposures. Results: Among the five GOF methods, probabilistic exposure distributions using the A-D and K-S methods were similar to individual exposure estimations. Comparing the 95th percentiles of the probabilistic distributions and the individual estimations for 10 CPs, there were 0.73 to 1.92 times differences for the A-D method, and 0.73 to 1.60 times differences (excluding tire-shine spray) for the K-S method. Conclusions: There were significant differences in exposure assessment results among the selection of the GOF methods. Therefore, the GOF methods for probabilistic consumer exposure assessment should be carefully selected.

Negative Exponential Disparity Based Deviance and Goodness-of-fit Tests for Continuous Models: Distributions, Efficiency and Robustness

  • Jeong, Dong-Bin;Sahadeb Sarkar
    • Journal of the Korean Statistical Society
    • /
    • 제30권1호
    • /
    • pp.41-61
    • /
    • 2001
  • The minimum negative exponential disparity estimator(MNEDE), introduced by Lindsay(1994), is an excellenet competitor to the minimum Hellinger distance estimator(Beran 1977) as a robust and yet efficient alternative to the maximum likelihood estimator in parametric models. In this paper we define the negative exponential deviance test(NEDT) as an analog of the likelihood ratio test(LRT), and show that the NEDT is asymptotically equivalent to he LRT at the model and under a sequence of contiguous alternatives. We establish that the asymptotic strong breakdown point for a class of minimum disparity estimators, containing the MNEDE, is at least 1/2 in continuous models. This result leads us to anticipate robustness of the NEDT under data contamination, and we demonstrate it empirically. In fact, in the simulation settings considered here the empirical level of the NEDT show more stability than the Hellinger deviance test(Simpson 1989). The NEDT is illustrated through an example data set. We also define a goodness-of-fit statistic to assess adequacy of a specified parametric model, and establish its asymptotic normality under the null hypothesis.

  • PDF

조선시대 역사지진자료를 이용한 경주와 포항의 최근 지진규모 예측 (Prediction of recent earthquake magnitudes of Gyeongju and Pohang using historical earthquake data of the Chosun Dynasty)

  • 김준철;권숙희;장대흥;이근우;김영석;하일도
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.119-129
    • /
    • 2022
  • 본 논문에서는 최근 경주와 포항에서 심각한 피해를 주며 발생한 지진의 규모를 과거자료에 근거한 통계적 분석방법을 통해 예측하고자 한다. 이를 위해, 조선시대 역사지진 자료중에서 연단위 밀집도가 상대적으로 높은 1392~1771년의 5년 블록 최대 규모 자료를 이용하였다. 이 자료를 기반으로 일반화 극단값(generalized extreme value) 확률분포에 기초한 극단값 이론을 이용하여 조선시대 재현기간별 지진 규모 예측 및 분석을 제시하고자 한다. 일반화 극단값 분포의 모수추정을 위해 최대가능도추정법(maximum likelihood estimation, MLE)과 L-적률추정법(L-moments estimation, LME)을 사용한다. 특히 본 논문에서는 일반화 극단값 분포가 이러한 역사지진 자료에 대한 적절한 분석 모형이 될 수 있음을 적합도 검정(goodness-of-fit test)을 통해 보인다.

Case influence diagnostics for the significance of the linear regression model

  • Bae, Whasoo;Noh, Soyoung;Kim, Choongrak
    • Communications for Statistical Applications and Methods
    • /
    • 제24권2호
    • /
    • pp.155-162
    • /
    • 2017
  • In this paper we propose influence measures for two basic goodness-of-fit statistics, the coefficient of determination $R^2$ and test statistic F in the linear regression model using the deletion method. Some useful lemmas are provided. We also express the influence measures in terms of basic building blocks such as residual, leverage, and deviation that showed them as increasing function of residuals and a decreasing function of deviation. Further, the proposed measure reduces computational burden from O(n) to O(1). As illustrative examples, we applied the proposed measures to the stackloss data sets. We verified that deletion of one or few influential observations may result in big change in $R^2$ and F-statistic.

Testing Whether a Survival Distribution is Better Mean Residual Life at Age $t_0$

  • Alwasel Ibrahim A.;El-Bassiouny Ahmed H.
    • International Journal of Reliability and Applications
    • /
    • 제7권1호
    • /
    • pp.1-11
    • /
    • 2006
  • The better mean residual life at $t_0\;(BMRL-t_0)$ class of life distribution is introduced by Kulasekara and Park (1987). They proved that the $BMRL-t_0$ class contains the DMRL class, but it is a proper subclass of the NBUE class. In this paper we develop a new family of tests for testing exponentiality against the $BMRL-t_0\;(WMRL-t_0)$ alternatives based on the goodness of fit approach. It is shown that the suggested test is better than the one introduced by Kulasekara and Park (1987) in the sense of Pitman asymptotic efficiency values.

  • PDF

Mutual Information and Redundancy for Categorical Data

  • Hong, Chong-Sun;Kim, Beom-Jun
    • Communications for Statistical Applications and Methods
    • /
    • 제13권2호
    • /
    • pp.297-307
    • /
    • 2006
  • Most methods for describing the relationship among random variables require specific probability distributions and some assumptions of random variables. The mutual information based on the entropy to measure the dependency among random variables does not need any specific assumptions. And the redundancy which is a analogous version of the mutual information was also proposed. In this paper, the redundancy and mutual information are explored to multi-dimensional categorical data. It is found that the redundancy for categorical data could be expressed as the function of the generalized likelihood ratio statistic under several kinds of independent log-linear models, so that the redundancy could also be used to analyze contingency tables. Whereas the generalized likelihood ratio statistic to test the goodness-of-fit of the log-linear models is sensitive to the sample size, the redundancy for categorical data does not depend on sample size but its cell probabilities itself.