• 제목/요약/키워드: kolmogorov-smirnov test

검색결과 207건 처리시간 0.025초

Comprehensive comparison of normality tests: Empirical study using many different types of data

  • Lee, Chanmi;Park, Suhwi;Jeong, Jaesik
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1399-1412
    • /
    • 2016
  • We compare many normality tests consisting of different sources of information extracted from the given data: Anderson-Darling test, Kolmogorov-Smirnov test, Cramervon Mises test, Shapiro-Wilk test, Shaprio-Francia test, Lilliefors, Jarque-Bera test, D'Agostino' D, Doornik-Hansen test, Energy test and Martinzez-Iglewicz test. For the purpose of comparison, those tests are applied to the various types of data generated from skewed distribution, unsymmetric distribution, and distribution with different length of support. We then summarize comparison results in terms of two things: type I error control and power. The selection of the best test depends on the shape of the distribution of the data, implying that there is no test which is the most powerful for all distributions.

Goodness-of-Fit Test for the Normality based on the Generalized Lorenz Curve

  • Cho, Youngseuk;Lee, Kyeongjun
    • Communications for Statistical Applications and Methods
    • /
    • 제21권4호
    • /
    • pp.309-316
    • /
    • 2014
  • Testing normality is very important because the most common assumption is normality in statistical analysis. We propose a new plot and test statistic to goodness-of-fit test for normality based on the generalized Lorenz curve. We compare the new plot with the Q-Q plot. We also compare the new test statistic with the Kolmogorov-Smirnov (KS), Cramer-von Mises (CVM), Anderson-Darling (AD), Shapiro-Francia (SF), and Shapiro-Wilks (W) test statistic in terms of the power of the test through by Monte Carlo method. As a result, new plot is clearly classified normality and non-normality than Q-Q plot; in addition, the new test statistic is more powerful than the other test statistics for asymmetrical distribution. We check the proposed test statistic and plot using Hodgkin's disease data.

비모수적(非母數的) 통계(統計) 프로그램의 개발(開發) (Computer Programs for Nonparametric Tests)

  • 배도선;장중순;김상복
    • 대한산업공학회지
    • /
    • 제12권2호
    • /
    • pp.101-108
    • /
    • 1986
  • Computer programs for IBM PC/XT/AT or compatibles, are presented for running 9 nonparametric tests. They include sign test, Wilcoxon signed rank test, Mann-Whitney Wilcoxon test, Kruskal-Wallis test, Kolmogorov-Smirnov one sample and two sample tests, Kendall and Spearman rank correlation coefficient tests, and Chi square test for contingency table. Each program is written with BASIC language and is combined into a statistical package, 'NONPARA'. It is easily accessible through the menu programs. The alogorithms on which each test is based, are also explained and 3 examples are given.

  • PDF

고등학생의 수학 자기조절 학습 요인에 대한 집단별 수준 차이 비교 (Comparison of Differences in Levels per Group on Math Self-Regulated Learning Factors of High School Students)

  • 유기종
    • 한국수학사학회지
    • /
    • 제34권1호
    • /
    • pp.21-37
    • /
    • 2021
  • The purpose of the present study is to compare the differences in levels per group of high school students regarding the self-regulated learning factors for mathematics. For this purpose, a self-regulated learning measurement tool was developed and surveys were conducted. And the statistical analysis was completed using the frequency analysis, Kolmogorov-Smirnov normality test, Mann-Whitney U test and the Kruskal-Wallis H test. As a result, it is found that self-efficacy is of statistically significant differences in self-regulated learning levels regardless of the group classifications but test anxiety does not show statistically significant differences in self-regulated learning levels regardless of the group classifications.

우수거 설계를 위한 인천지방에서의 확률강우강도식의 산정 (Determination of Probable Rainfall Intensity Formulas for Designing Storm Sewer Systems at Incheon District)

  • 안태진;김경섭
    • 상하수도학회지
    • /
    • 제12권3호
    • /
    • pp.99-106
    • /
    • 1998
  • This paper presents a procedure for determining the design rainfall depth and the design rainfall intensity at Incheon city area in Korea. In this study the eight probability distributions are considered to estimate the probable rainfall depths for 11 different durations. The Kolmogorov - Smirnov test and the Chi-square test are adopted to test each distribution. The probable rainfall intensity formulas are then determined by i) the least squares (LS) method, ii) the least median squares (LMS) method, iii) the reweighted least squares method based on the LMS (RLS), and iv) the constrained regression (CR) model. The Talbot, the Sherman, the Japanese, and the Unified type are considered to determine the best type for the Incheon station. The root mean squared (RMS) errors are computed to test the formulas derived by four methods. It is found that the Unified type is the most reliable and that all methods presented herein are acceptable for determining the coefficients of rainfall intensity formulas from an engineering point of view.

  • PDF

쿨백­라이블러 정보함수 이용한 단계 스트레스 가속수명모형의 지수성 검정 (Test of Exponentiality in Step Stress Accelerated Life test Model based on Kullback­Leibler Information Function)

  • 박병구;윤상철
    • 품질경영학회지
    • /
    • 제31권4호
    • /
    • pp.194-202
    • /
    • 2003
  • In this paper, we propose goodness of fit test statistics for exponentiality in accelerated life tests data based on Kullback­Leibler information functions. This acceleration model is assumed to be a tampered random variable model. The procedure is applicable when the exponential parameter using the data from accelerated life tests is or is not specified under null hypothesis. And we compare the power of the proposed test statistics with Kolmogorov­Smirnov, Cramer von Mises and Anderson­Darling statistics in the small sample.

Goodness of Fit Test of Normality Based on Kullback-Leibler Information

  • Kim, Jong-Tae;Lee, Woo-Dong;Ko, Jung-Hwan;Yoon, Yong-Hwa;Kang, Sang-Gil
    • Communications for Statistical Applications and Methods
    • /
    • 제6권3호
    • /
    • pp.909-918
    • /
    • 1999
  • Arizono and Ohta(1989) studied goodness of fit test of normality using the entropy estimator proposed by Vasicek (1976) Recently van Es(1992) and Correa(1995) proposed an estimator of entropy. In this paper we propose goodness of fit test statistics for normality based on Vasicek ven Es and Correa. And we compare the power of the proposed test statistics with Kolmogorov-Smirnov Kuiper Cramer von Mises Watson Anderson-Darling and Finkelstein and Schefer statistics.

  • PDF

조정된 ROC와 CAP 곡선 (Adjusted ROC and CAP Curves)

  • 홍종선;김지훈;최진수
    • 응용통계연구
    • /
    • 제22권1호
    • /
    • pp.29-39
    • /
    • 2009
  • 신용평가 연구에서 부도율분포를 기반으로 부도기업과 정상기업의 판별력을 탐색하는 방법 중의 하나로 ROC와 CAP 곡선을 사용한다. 부도와 정상기업을 분류하는 절단점의 변동에 따라 구한 여러 부도비율을 통해 ROC와 CAP 곡선을 작성하는데 곡선의 각 좌표에 대응하는 절단점을 탐색하기 어렵다. 본 연구에서는 ROC와 CAP 곡선을 나타내는 부도비율들의 함수를 이용하여 조정된 ROC와 CAP곡선을 제안한다. 조정된 ROC와 CAP 곡선을 통해 절단점과의 관계를 파악할 수 있으며, 최적의 절단점을 식별할 수 있다. 또한 부도와 정상기업에 관한 분포함수의 동일성을 검정하는 Kolmogorov - Smirnov 통계량과 조정된 ROC와 CAP 곡선을 통해 얻은 최적 절단점의 관계를 토론한다.

ROC와 CAP 곡선에서의 최적 분류점 (Optimal Threshold from ROC and CAP Curves)

  • 홍종선;최진수
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.911-921
    • /
    • 2009
  • 신용평가 연구에서 부도와 정상차주에 대한 판별력을 평가하는 방법으로 Receiver Operating Characteristic(ROC)와 Cumulative Accuracy Profile(CAP) 곡선을 사용한다. ROC 곡선에서 최적의 분류정확도를 갖는 분류점과 CAP 곡선에서 최대의 이익을 나타내는 분류점은 일반적인 정확도의 개념으로 정의된 동일한 성과를 가진 접선을 사용하여 구한다. 본 연구에서는 정확도의 대안적인 측도로 진실율을 제안하고, 이 진실율을 이용하여 ROC와 CAP 곡선에서 대안적인 최적의 분류점을 구한다. 대부분 실제 차주의 모집단에서 부도차주는 정상차주보다 훨씬 수가 적다. 이러한 경우에 진실율은 정확도보다 비용함수의 측면에서 더욱 효율적일 수 있다. 진실율을 이용하여 최적의 분류정확도를 나타내는 분류점과 최대의 이익을 의미하는 분류점에 대응하는 스코어는 동일하다는 것을 보였으며, 이 스코어는 부도와 정상 차주의 분포함수의 동일성을 검정하는 Kolmogorov-Smirnov 통계량에 대응하는 스코어와도 일치하는 것을 발견하였다.

신뢰성에 기초한 사장교 케이블 장력 관리기준치 설정 (Reliability-Based Managing Criteria for Cable Tension Force in Cable-stayed Bridges)

  • 조효남;강경구;차철준
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제9권3호
    • /
    • pp.129-138
    • /
    • 2005
  • 본 논문은 사장교에서 모니터링 시스템을 통해 획득한 가속도 자료를 이용하여 케이블 관리기준 장력을 결정하기 위한 방법을 제시한다. 현재 한국의 많은 장대교량에 모니터링 시스템이 설치되어 있다. 모니터링 시스템은 교량의 이상현상이나 손상을 진단하고 관리주체에 경고하기 위해 설치된다. 사장교에 있어서는 그 기하학적인 형상 때문에 케이블 장력이 교량 이상징후의 중요한 지시가 될 수 있다. 만약 케이블 장력관리치가 너무 높거나 또는 너무 낮게 설정되면, 모니터링 시스템은 교량의 이상징후를 적절하게 경고하지 못할 것이다. 일반적으로, 관리치는 경험이나 공학적 판단에 의해 결정된다. 그러나 본 논문에서는 케이블 장력에 대한 확률분포모형과 신뢰성 해석에 기초한 새로운 케이블 장력관리치 설정에 대한 방법을 제시한다. 제안된 방법은 적용성 검토를 위하여 실제 콘크리트 사장교에 적용되었다.