• 제목/요약/키워드: Kolmogorov-smirnov statistic

검색결과 28건 처리시간 0.024초

Estimation of p-values with Two Dimensional Null Distributions from Genomic Data Set

  • Yee, Jaeyong;Park, Mira
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2711-2719
    • /
    • 2018
  • When an observable is described by a single value, the statistic significance may be estimated by construction of null distribution using permutation and counting the portion of it that exceeds the observed value by chance. Genome-wide association study usually focuses on the association measure between a single or interacting genotypes with a single phenotype. However investigation of common genotypes associated simultaneously on multiple phenotypes may involve the observables that should be described with multiple numbers. Statistical significance for such an observable would involve null distribution in multiple dimensions. In this study, extension of the p-value estimation process using null distribution in one dimension has been sought that may be applicable to two dimensional case. Comparison of the position of points within the set of points they form has been proposed to use a positioning parameter inspired by the extension of the Kolmogorov-Smirnov statistic to two dimensions.

조정된 ROC와 CAP 곡선 (Adjusted ROC and CAP Curves)

  • 홍종선;김지훈;최진수
    • 응용통계연구
    • /
    • 제22권1호
    • /
    • pp.29-39
    • /
    • 2009
  • 신용평가 연구에서 부도율분포를 기반으로 부도기업과 정상기업의 판별력을 탐색하는 방법 중의 하나로 ROC와 CAP 곡선을 사용한다. 부도와 정상기업을 분류하는 절단점의 변동에 따라 구한 여러 부도비율을 통해 ROC와 CAP 곡선을 작성하는데 곡선의 각 좌표에 대응하는 절단점을 탐색하기 어렵다. 본 연구에서는 ROC와 CAP 곡선을 나타내는 부도비율들의 함수를 이용하여 조정된 ROC와 CAP곡선을 제안한다. 조정된 ROC와 CAP 곡선을 통해 절단점과의 관계를 파악할 수 있으며, 최적의 절단점을 식별할 수 있다. 또한 부도와 정상기업에 관한 분포함수의 동일성을 검정하는 Kolmogorov - Smirnov 통계량과 조정된 ROC와 CAP 곡선을 통해 얻은 최적 절단점의 관계를 토론한다.

ROC와 CAP 곡선에서의 최적 분류점 (Optimal Threshold from ROC and CAP Curves)

  • 홍종선;최진수
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.911-921
    • /
    • 2009
  • 신용평가 연구에서 부도와 정상차주에 대한 판별력을 평가하는 방법으로 Receiver Operating Characteristic(ROC)와 Cumulative Accuracy Profile(CAP) 곡선을 사용한다. ROC 곡선에서 최적의 분류정확도를 갖는 분류점과 CAP 곡선에서 최대의 이익을 나타내는 분류점은 일반적인 정확도의 개념으로 정의된 동일한 성과를 가진 접선을 사용하여 구한다. 본 연구에서는 정확도의 대안적인 측도로 진실율을 제안하고, 이 진실율을 이용하여 ROC와 CAP 곡선에서 대안적인 최적의 분류점을 구한다. 대부분 실제 차주의 모집단에서 부도차주는 정상차주보다 훨씬 수가 적다. 이러한 경우에 진실율은 정확도보다 비용함수의 측면에서 더욱 효율적일 수 있다. 진실율을 이용하여 최적의 분류정확도를 나타내는 분류점과 최대의 이익을 의미하는 분류점에 대응하는 스코어는 동일하다는 것을 보였으며, 이 스코어는 부도와 정상 차주의 분포함수의 동일성을 검정하는 Kolmogorov-Smirnov 통계량에 대응하는 스코어와도 일치하는 것을 발견하였다.

목표변수의 형태에 따른 신용평점 모형 구축 (Building credit scoring models with various types of target variables)

  • 우현석;이석형;조형준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.85-94
    • /
    • 2013
  • 금융시장의 규모가 점점 더 커짐에 따라 고객정보 관리 미숙 또는 부실한 의사결정, 즉 신용 리스크 관리 실패로 인한 손실이 막대하게 증가하고 있다. 따라서 신용 리스크 관리가 점차 더 중요해지고, 이런 신용 리스크를 최소화하는 기본적인 도구인 신용 평점 모형이 절실히 요구된다. 신용평점 모형은 주로 이항형 목표변수만 이용하여 개발 연구되었다. 본 논문에서는 순서형 다항 자료 또는 경시적 이항 자료 같은 다른 형태의 목표 변수를 고려한 신용평점 모형구축 방법을 제시한다. 그 개발된 모형을 실제 자료와 랜덤화한 자료에 적용하여 Kolmogorov-Smirnov 통계량으로 비교 분석한다.

Two optimal threshold criteria for ROC analysis

  • Cho, Min Ho;Hong, Chong Sun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.255-260
    • /
    • 2015
  • Among many optimal threshold criteria from ROC curve, the closest-to-(0,1) and amended closest-to-(0,1) criteria are considered. An ROC curve that passes close to the (0,1) point indicates that two models are well classified. In this case, the ROC curve is located far from the (1,0) point. Hence we propose two criteria: the farthest-to-(1,0) and amended farthest-to-(1,0) criteria. These criteria are found to have a relationship with the KolmogorovSmirnov statistic as well as some optimal threshold criteria. Moreover, we derive that a definition for the proposed criteria with more than two dimensions and with relations to multi-dimensional optimal threshold criteria.

손등의 정맥패턴 인식을 위한 원형정합방법의 비교 연구 (A Study on the Template Matching Methods for Hand Vein Pattern Recognition)

  • 최환수;박성혁;정동철
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1998년도 하계학술대회 논문집 G
    • /
    • pp.2231-2233
    • /
    • 1998
  • 본 논문은 손등의 정맥패턴을 이용한 개인식별을 위해 개발된 3가지의 알고리즘에 관해 각각의 성능을 비교한 결과를 제시한다. 세가지 방법은 각각 Unsharp Masking을 이용한 이치화 후 정맥과 손등 배경의 면적을 이용한 가중치를 적용한 원형정합 알고리즘[1]과 Kolmogorov Smirnov(KS) statistic[2]을 이용한 매칭 알고리즘을 개선한 방식, 그리고 정맥의 세선화 처리 후 분기점의 좌표, 정맥의 길이, 정맥 가지 사이의 분기각도 등의 특징벡터를 이용한 방법 등이다. 본 연구에서는 전처리 과정에 있어서, 원시영상의 혈관부위와 배경부위의 gray scale 분포가 겹친 상태에서 Unsharp Masking 필터링을 적용한 결과가 기타 다른 전처리 방식보다 우수하게 영상을 강화시킬 수 있음을 확인하였고, 가중치를 이용한 매칭방식이 다른 매칭방식보다 우수함을 확인하였다.

  • PDF

Length-biased Rayleigh distribution: reliability analysis, estimation of the parameter, and applications

  • Kayid, M.;Alshingiti, Arwa M.;Aldossary, H.
    • International Journal of Reliability and Applications
    • /
    • 제14권1호
    • /
    • pp.27-39
    • /
    • 2013
  • In this article, a new model based on the Rayleigh distribution is introduced. This model is useful and practical in physics, reliability, and life testing. The statistical and reliability properties of this model are presented, including moments, the hazard rate, the reversed hazard rate, and mean residual life functions, among others. In addition, it is shown that the distributions of the new model are ordered regarding the strongest likelihood ratio ordering. Four estimating methods, namely, method of moment, maximum likelihood method, Bayes estimation, and uniformly minimum variance unbiased, are used to estimate the parameters of this model. Simulation is used to calculate the estimates and to study their properties. Finally, the appropriateness of this model for real data sets is shown by using the chi-square goodness of fit test and the Kolmogorov-Smirnov statistic.

  • PDF

신용평가모형에서 타당성검증 통계량들의 판단기준 (Criterion of Test Statistics for Validation in Credit Rating Model)

  • 박용석;홍종선;임한승
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.239-347
    • /
    • 2009
  • 신용평가모형의 판별력에 대한 검정방법으로 콜모고로프-스미르노프, 평균차이, AUROC, AR등과 같은 통계량이 널리 사용되고 있다. 이러한 통계량들의 판단기준은 정규분포 가정 하에서 평균차이를 기준으로 설정되었다. 본 연구에서는 모의 실험을 통해서 표본크기, 불량률 그리고 제II종 오류율을 고려하는 대안적인 판단기준을 제 안하고 현재 적용되고 있는 판단기준과 비교해본다. 또한 판별력 정도에 따른 각 통계량들의 의미를 10단계로 정의하고 모의 실험 결과와 현재 적용되고 있는 판단기준을 비교해 본다.