• 제목/요약/키워드: Goodness-of-fit tests

검색결과 134건 처리시간 0.021초

Does Breast Cancer Drive the Building of Survival Probability Models among States? An Assessment of Goodness of Fit for Patient Data from SEER Registries

  • Khan, Hafiz;Saxena, Anshul;Perisetti, Abhilash;Rafiq, Aamrin;Gabbidon, Kemesha;Mende, Sarah;Lyuksyutova, Maria;Quesada, Kandi;Blakely, Summre;Torres, Tiffany;Afesse, Mahlet
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권12호
    • /
    • pp.5287-5294
    • /
    • 2016
  • Background: Breast cancer is a worldwide public health concern and is the most prevalent type of cancer in women in the United States. This study concerned the best fit of statistical probability models on the basis of survival times for nine state cancer registries: California, Connecticut, Georgia, Hawaii, Iowa, Michigan, New Mexico, Utah, and Washington. Materials and Methods: A probability random sampling method was applied to select and extract records of 2,000 breast cancer patients from the Surveillance Epidemiology and End Results (SEER) database for each of the nine state cancer registries used in this study. EasyFit software was utilized to identify the best probability models by using goodness of fit tests, and to estimate parameters for various statistical probability distributions that fit survival data. Results: Statistical analysis for the summary of statistics is reported for each of the states for the years 1973 to 2012. Kolmogorov-Smirnov, Anderson-Darling, and Chi-squared goodness of fit test values were used for survival data, the highest values of goodness of fit statistics being considered indicative of the best fit survival model for each state. Conclusions: It was found that California, Connecticut, Georgia, Iowa, New Mexico, and Washington followed the Burr probability distribution, while the Dagum probability distribution gave the best fit for Michigan and Utah, and Hawaii followed the Gamma probability distribution. These findings highlight differences between states through selected sociodemographic variables and also demonstrate probability modeling differences in breast cancer survival times. The results of this study can be used to guide healthcare providers and researchers for further investigations into social and environmental factors in order to reduce the occurrence of and mortality due to breast cancer.

이표본 분포 동일성에 대한 분포무관 검정법 간 검정력 비교 연구 (Power comparison of distribution-free two sample goodness-of-fit tests)

  • 김선빈;이재원
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.513-528
    • /
    • 2017
  • 두 표본 집단이 동일한 분포를 따르는지 비교하기 위해 분포무관 검정이 많이 사용된다. 하지만 여러 검정법을 체계적으로 비교한 연구가 존재하지 않아서 각 검정법의 특성을 고려하여 연구 상황에 맞는 검정법을 선택하기가 어려웠다. 본 연구에서는 이표본 분포 동일성 검정에 해당하는 여러 분포무관 검정법들을 소개하고 체계적인 모의실험을 통해 그 성능을 비교하고자 한다. 두 표본이 각각 (1) 위치, (2) 척도, (3) 왜도, (4) 첨도, (5) 꼬리가중치가 다른 분포에서 추출된 상황에 대해 실험하였다. 실험 결과를 바탕으로 이표본 분포 동일성 검정법 사용에 대한 실용적인 지침을 제시하려고 한다.

Goodness-of-fit tests for randomly censored Weibull distributions with estimated parameters

  • Kim, Namhyun
    • Communications for Statistical Applications and Methods
    • /
    • 제24권5호
    • /
    • pp.519-531
    • /
    • 2017
  • We consider goodness-of-fit test statistics for Weibull distributions when data are randomly censored and the parameters are unknown. Koziol and Green (Biometrika, 63, 465-474, 1976) proposed the $Cram\acute{e}r$-von Mises statistic's randomly censored version for a simple hypothesis based on the Kaplan-Meier product limit of the distribution function. We apply their idea to the other statistics based on the empirical distribution function such as the Kolmogorov-Smirnov and Liao and Shimokawa (Journal of Statistical Computation and Simulation, 64, 23-48, 1999) statistics. The latter is a hybrid of the Kolmogorov-Smirnov, $Cram\acute{e}r$-von Mises, and Anderson-Darling statistics. These statistics as well as the Koziol-Green statistic are considered as test statistics for randomly censored Weibull distributions with estimated parameters. The null distributions depend on the estimation method since the test statistics are not distribution free when the parameters are estimated. Maximum likelihood estimation and the graphical plotting method with the least squares are considered for parameter estimation. A simulation study enables the Liao-Shimokawa statistic to show a relatively high power in many alternatives; however, the null distribution heavily depends on the parameter estimation. Meanwhile, the Koziol-Green statistic provides moderate power and the null distribution does not significantly change upon the parameter estimation.

Asymptotic Relative Efficiency of Chi-squared Type Tests Based on the Empirical Process

  • Lee, Sang-Yeol
    • Journal of the Korean Statistical Society
    • /
    • 제25권3호
    • /
    • pp.337-346
    • /
    • 1996
  • The chi-squared type statistic generated from the empirical process can be used for testing the goodness of fit hypothesis on iid random sample. Lee (1995) showed that under some conditions, the chi-squared type statistic is asymptotically maximin in the sense of Strasser (1985). Since the chi-squared type statistic depends on the choice of *points in the unit interval, it is worth investigating the points yielding more efficient tests. Motivated by this viewpoint, we are led to study the asymptotic relative efficiency of chi-squared type tests in the same setting of Lee (1995). Some examples are given for illustration.

  • PDF

쿨백­라이블러 정보함수 이용한 단계 스트레스 가속수명모형의 지수성 검정 (Test of Exponentiality in Step Stress Accelerated Life test Model based on Kullback­Leibler Information Function)

  • 박병구;윤상철
    • 품질경영학회지
    • /
    • 제31권4호
    • /
    • pp.194-202
    • /
    • 2003
  • In this paper, we propose goodness of fit test statistics for exponentiality in accelerated life tests data based on Kullback­Leibler information functions. This acceleration model is assumed to be a tampered random variable model. The procedure is applicable when the exponential parameter using the data from accelerated life tests is or is not specified under null hypothesis. And we compare the power of the proposed test statistics with Kolmogorov­Smirnov, Cramer von Mises and Anderson­Darling statistics in the small sample.

생산방식과 환경요인들을 고려한 최적성장함수의 선택에 관한 연구 (The Choice of an Optimal Growth Function Considering Environmental Factors and Production Style)

  • 최종두
    • 자원ㆍ환경경제연구
    • /
    • 제13권4호
    • /
    • pp.717-734
    • /
    • 2004
  • 본 연구는 생물경제학(bioeconomics)분석에 있어서 중요한 위치를 차지하는 생물학적 성장모델에 대한 계량적 접근을 시도하였다. 세계적으로 어류에 관한 생물학적 성장모델은 여러 연구자들에 의해 추정된 바 있으나, 갑각류나 패류와 관련된 적정 성장함수의 추정은 어류에 비해 크게 연구되어 있지 않은 실정이다. 이에 몇몇 연구자들에 의해 사용된 공통된 성장함수들(Linear, Log reciprocal, Double log, Polynomial, Linear with Interactions)을 생산방식과 지역별 환경요인을 감안하여 한국 참가리비(Patinopecten yessoensis)의 성장을 추정하는 데 응용해 보았으며, 가장 적절한 모델은 계량적 분석을 통하여 도출하였다. 분석결과 Log reciprocal 형태의 성장함수가 참가리비류에 가장 적합한 모델로 선정되었으며, 본 결과는 경영자의 최적 생산시기를 결정하는 데 이용되는 생물경제학 모델에 유용하게 응용될 수 있을 것으로 사료된다.

  • PDF

모수적 엔트로피 추정량과 비모수적 엔트로피 추정량에 기초한 정규분포에 대한 적합도 검정 (Goodness-of-fit test for normal distribution based on parametric and nonparametric entropy estimators)

  • 최병진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.847-856
    • /
    • 2013
  • 본 논문에서는 모수적과 비모수적 엔트로피 추정량들에 기초한 정규분포에 대한 적합도 검정을 다룬다. 정규분포의 엔트로피에 대한 모수적 추정량으로 사용할 최소분산비편향추정량을 유도한다. 이 추정량과 대립가설 하에서의 자료생성분포에 대한 비모수적 엔트로피 추정량으로 표본엔트로피와 이것의 변형된 추정량들을 이용하여 검정통계량들을 구축했고 이 검정통계량들을 사용하는 새로운 엔트로피 기반 적합도 검정들을 제시한다. 제안한 검정들의 기각값들을 모의실험을 통해 추정해서 표의 형태로 제시한다. 성능의 조사를 위해 수행한 모의실험에서 제안한 검정들이 기존의 Vasicek (1976) 검정보다는 더 좋은 검정력을 가지는 것으로 나타난다. 응용에서 새로운 검정들이 정규성 검정을 위한 경쟁적인 도구로 시용될 수 있을 것으로 기대된다.

Goodness-of-fit tests for the inverse Weibull or extreme value distribution based on multiply type-II censored samples

  • Kang, Suk-Bok;Han, Jun-Tae;Seo, Yeon-Ju;Jeong, Jina
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.903-914
    • /
    • 2014
  • The inverse Weibull distribution has been proposed as a model in the analysis of life testing data. Also, inverse Weibull distribution has been recently derived as a suitable model to describe degradation phenomena of mechanical components such as the dynamic components (pistons, crankshaft, etc.) of diesel engines. In this paper, we derive the approximate maximum likelihood estimators of the scale parameter and the shape parameter in the inverse Weibull distribution under multiply type-II censoring. We also develop four modified empirical distribution function (EDF) type tests for the inverse Weibull or extreme value distribution based on multiply type-II censored samples. We also propose modified normalized sample Lorenz curve plot and new test statistic.

비례위험모형의 적합도 검정법에 관한 연구 (A study on the goodness-of-fit tests for proportional hazards model)

  • 장애방;이재원
    • 응용통계연구
    • /
    • 제10권1호
    • /
    • pp.85-104
    • /
    • 1997
  • Cox(1972)가 제안한 비례위험모형은 두 표본의 처리를 비교하거나 공변량의 효과와 생존시간의 관계를 회귀적으로 해석하는 등 다양한 상황에 쓰일 수 있어 널리 이용되고 있다. 따라서 비례위험모형에 대하여 많은 통계 학자들이 연구를 하였는데, 그중에서도 적합도 검정법에 대하여 여러 편의 논문이 발표되었다. 본 논문에서는 지금까지 제안된 비례위험모형에 대한 적합도 검정법에 관하여 설명하고, 다양한 형태의 자료에 대한 모의실험을 통하여 비례위험모형을 이용하여 생존분석을 실시하려는 통계분석가들에게 도움이 되도록 각각의 특성에 관하여 논의하였다.

  • PDF

역가우스분포에 대한 쿨백-라이블러 정보 기반 적합도 검정 (Kullback-Leibler Information-Based Tests of Fit for Inverse Gaussian Distribution)

  • 최병진
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1271-1284
    • /
    • 2011
  • 본 논문에서는 위치와 척도모수가 모두 알려지지 않은 역가우스분포에 대한 적합도 검정으로 기존에 개발된 엔트로피 기반 검정을 확장한 쿨백-라이블러 정보 기반 적합도 검정을 소개한다. 역가우스분포에 대한 단순 또는 복합 영가설을 검정하기 위한 4가지 형태의 검정통계량을 제시하고 검정통계량의 계산에 사용할 표본크기에 따른 윈도크기와 기각값을 모의실험을 통해 결정하여 표의 형태로 제공한다. 검정력 분석을 위해 수행한 모의실험의 결과에서 위치와 척도모수가 모두 알려진 역가우스분포에 대한 쿨백-라이블러 정보 기반 적합도 검정은 모든 대립분포와 표본크기에서 EDF 검정들보다 좋은 검정력을 가지는 것으로 나타난다. 위치모수 또는 척도모수만 알려진 역가우스분포에 대한 쿨백-라이블러 정보 기반 적합도 검정은 모든 대립분포에 대해서 표본크기가 커짐에 따라 검정력이 증가하는 경향을 보인다. 위치와 척도모수가 모두 알려지지 않은 역가우스분포에 대한 쿨백-라이블러 정보 기반 적합도 검정은 대체적으로 엔트로피 기반 검정과 비슷한 수준의 검정력을 보이는 것으로 나타나고 이 결과를 통해서 두 검정은 동일함을 확인할 수 있다.