• 제목/요약/키워드: ROC 곡선 분석

검색결과 93건 처리시간 0.021초

정규혼합분포를 이용한 ROC 분석 (ROC Curve Fitting with Normal Mixtures)

  • 홍종선;이원용
    • 응용통계연구
    • /
    • 제24권2호
    • /
    • pp.269-278
    • /
    • 2011
  • 스코어 변수의 민감도와 특이도와의 관계로 표현한 ROC 곡선을 더욱 정확한 진단을 위하여 분포함수와 공변량을 고려한 연구가 많이 진행되었다. 공변량을 고려하는 회귀분석 방법을 사용하였으며 이때 분포함수를 정규분포로 가정하거나 잔차의 분포함수를 추정하여 ROC 분석을 하였다. 본 연구는 분포함수가 주어지지 않으며 진단에 영향을 주는 공변량을 모르는 일반적인 상황에서 논의하였다. 확률변수인 스코어와 두 개의 보모집단으로 구성된 신용평가 자료에 적합한 분포함수를 추정하기 위하여 여러 개의 정규분포가 혼합된 정규혼합분포를 사용하여 ROC 분석을 한다. 고전적인 비모수적이고 경험적인 ROC 곡선에 적합한지를 파악하기 위하여 AUC 통계량을 사용하여 비교하며, 본 연구에서 제안한 정규혼합분포를 이용한 ROC 곡선이 다른 방법으로 구한 ROC 곡선보다 적합함을 보였다.

생존 분석 자료에서 적용되는 시간 가변 ROC 분석에 대한 리뷰 (Review for time-dependent ROC analysis under diverse survival models)

  • 김양진
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.35-47
    • /
    • 2022
  • Receiver operating characteristic (ROC) 곡선은 이항 반응 자료에 대한 마커의 분류 예측력을 측정하기 위해 널리 적용되어왔으며 최근에는 생존 분석에서도 매우 중요한 역할을 하고 있다. 여러 가지 유형의 중도 절단과 원인 불명 등 다양한 종류의 결측 자료를 포함한 생존 자료 분석에서 마커의 사건 발생 여부에 대한 예측력을 판단하기 위해 기존의 통계량을 확장하였다. 생존 분석 자료는 각 시점에서의 사건 발생 여부로 이해할 수 있으며, 따라서 시점마다 ROC 곡선과 AUC를 구할 수 있다. 본 논문에서는 우중도 절단과 경쟁 위험 모형하에서 사용되는 다양한 방법론과 관련 R 패키지를 소개하고 각 방법의 특성을 설명하고 비교하였으며 이를 검토하기 위해 간단한 모의실험을 시행하였다. 또한, 프랑스에서 수집된 치매 자료의 마커 분석을 시행하였다.

이변량 ROC곡선 (Bivariate ROC Curve)

  • 홍종선;김강천;정진아
    • Communications for Statistical Applications and Methods
    • /
    • 제19권2호
    • /
    • pp.277-286
    • /
    • 2012
  • 신용평가모형에서 부도로 잘못 예측된 정상 차주의 비율과 정확하게 평가된 부도차주의 비율인 일변량 누적분포함수로 표현된 ROC 곡선을 이용하여 분류성과를 평가한다. 본 연구에서는 스코어 확률변수를 이변량으로 확장하여 부도와 정상 차주의 결합누적분포함수를 이용하여 표현할 수 있는 ROC 곡선을 제안한다. 이변량 평균벡터를 통과하는 확률변수의 선형 관계를 이용하여 이변량 ROC 곡선을 구현한다. 그리고 다양한 이변량 정규분포에 대한 ROC 곡선으로부터 분류성과를 탐색하고, 이에 대응하는 AUROC 통계량과 비교분석한다. 본 연구에서 제안한 이변량 ROC 곡선으로부터 분류기준에 적합한 최적분류점을 구하고 이를 통해 이변량 혼합분포함수의 최적 분류기준을 설정할 수 있음을 보인다.

갑상샘 악성결절의 초음파영상에서 GLCM 알고리즘을 이용한 세포병리 진단의 후향적 분석 (Retrospective Analysis of Cytopathology using Gray Level Co-occurrence Matrix Algorithm for Thyroid Malignant Nodules in the Ultrasound Imaging)

  • 김영주;이진수;강세식;김창수
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제40권2호
    • /
    • pp.237-243
    • /
    • 2017
  • 본 연구는 갑상샘 초음파 영상에서 정상 및 악성결절의 세포병리 진단결과를 바탕으로 GLCM 알고리즘분석을 통한 후향적 연구를 시행하여 컴퓨터보조진단의 적용 가능성을 평가하였다. GLCM 알고리즘의 6가지 파라미터를 이용한 갑상샘 악성결절의 인식률 평가와 ROC 곡선을 분석하였다. 실험 결과는 에너지 97%, 대조도 93%, 상관관계 92%, 동질성 92%, 엔트로피 100%, 분산 100%의 높은 질환인식률을 나타내었다. ROC 곡선 분석에서 각 파라미터의 곡선아래면적이 0.947(p=0.001) 이상을 나타내어 갑상샘 악성결절의 인식에 의미가 있는 결과로 나타났다. 또한 GLCM에서 각 파라미터의 cut-off값 결정으로 정량적인 컴퓨터보조진단의 분석을 통한 질환예측이 가능할 것으로 판단된다.

AROC 곡선과 최적분류점 (AROC Curve and Optimal Threshold)

  • 홍종선;이희정
    • 응용통계연구
    • /
    • 제24권1호
    • /
    • pp.185-191
    • /
    • 2011
  • 혼합분포를 가정한 신용평가 연구에서 ROC 곡선은 부도와 정상 차주의 판별력을 탐색하는데 유용한 그림이다. ROC 곡선을 개선하여 스코어를 파악할 수 있는 AROC 곡선을 수리적으로 분석하고, 정규분포를 적용하여 다양한 곡선의 형태를 파악한다. 최적분류점을 발견하는 다양한 분류정확도 통계량과 AROC 곡선의 관계를 발견하고, 두 분포의 분산이 동일한 경우에 AROC 곡선의 극소점으로 최적의 분류점을 추정할 수 있음을 발견한다.

ROC 기법을 이용한 침수유발 한계강우량 정확도 산정 (Accuracy Evaluation of Critical Rainfall for Inundation Using ROC Method)

  • 추경수;이석호;강동호;김병식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.367-367
    • /
    • 2019
  • 최근 기후변화로 인해 국지성 호우 및 태풍의 빈도가 빈발하고 및 규모가 커지고 있으며 그로 인한 홍수피해규모는 증가하고 있다. 본 논문에서는 도시 지역의 호우로 인한 침수유발 강우량을 산정하는 기법의 정확도를 산정하는데 목적이 있으며 이를 위해 ROC(Receiver Operation Characteristic Curve) 분석을 이용하였다. 본 논문에서는 분포형 홍수해석 모형인 S-RAT 모형과 2차원 침수해석 모형 FLO-2D을 커플링하여 호우로 인한 침수해석을 실시하였으며 강우시나리오는 설계 강우 200mm의 강우를 10% 간격으로 증가시켜 강우량 대비 침수심 자료를 모의하였다. 모의한 침수심 자료를 이용하여 유역 격자를 $1km{\times}1km$ 별 강우량-침수심 관계곡선식을 제시하였으며 개발된 곡선식을 이용하여 특정 침수심(20cm)을 유발시키는 강우량(한계강우량)을 산정하였다. 정확도 산정은 ROC(Receiver Operation Characteristic Curve) 분석 방법을 이용하여 침수 유무의 적중률에 따른 민감도와 특이도를 이용하여 AUC(Area Under the Curve)의 점수로 정확도를 판단하였다. 본 논문에서는 본 논문에서 제시한 한계강우량의 정확도를 판단하기 위하여 2011년 7월의 사당역 일대 침수사례를 이용하였다. 실제 침수정보가 없어 실제 호우사상과 실제 하수관망을 고려할 수 있는 SWMM 모형을 이용하여 침수분석을 실시하였다. 분석 결과 평균 ROC는 약 0.7로 나타났으며 5 단계의 구분에서 Fair 단계로 적정 수준의 정확도를 확보한 것으로 나타났다.

  • PDF

인공치아 우식병소 진단의 ROC 분석 (ROC Analysis of Acid Demineralized Artificial Caries)

  • 강병철
    • 치과방사선
    • /
    • 제27권2호
    • /
    • pp.7-13
    • /
    • 1997
  • 조직학적으로 유용성이 입증된 산탈회법을 이용한 인접면 비교적 초기 치아 우식의 병소를 형성하여 진단율을 조사하였다. 산 용액을 이용하여 20개 인접면 치아우식을 20개 소구치에 형성하였고, 37개 인접면 치아우식을 30개 대구치에 형성하였다. 건전한 소구치 20개, 대구치 30개를 포함하여 총 96개 치아를 4개씩 나누어 24개의 블록을 형성하였고, 각각 2개 블록의 교합면을 교합시켜서, 교익촬영을 하였다. 촬영 결과를 36명의 치과의사들이인접면 치아우식의 유무를 기록하고, 동시에 및 ROC 분석을 위한 5 개 범주의 판독 기준으로 판독하여 기록하였다. 인접면 치아우식증 유, 무만으로 판독한 결과 진단의 sensitivity는 0.71, specificity는 0.78 이였다. ROC 분석 한 결과의 곡선도표 아래부분의 평균 면적은 약 0.806 이였다. 치아우식증 유무만으로 진단한 결과는 특정한 sensitivity와 specificity 만을 나타내지만, ROC 분석 결과는 주관적 진단 기준과 구별되는 고유의 진단 능력을 표시하는 1-specificity(False Positive)의 변화에 따른 sensitivity(True Positive)의 변화를 연속적으로 나타내어 주었다.

  • PDF

선형성장모형에 대한 ROC 곡선과 AUC (ROC curve and AUC for linear growth models)

  • 홍종선;양대순
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1367-1375
    • /
    • 2015
  • 경시적자료의 분석으로 선형성장모형을 고려한다. 시간효과를 고려하는 모형과 임의효과를 추가하는 모형 그리고 가변수가 추가된 모형을 설정한다. 본 연구는 정규분포로 가정한 다양한 자료를 생성하고, 다양한 선형성장모형에 대하여 binormal ROC 곡선과 AUC 통계량을 여러 시점에서 구하여 비교 분석하였다. 공분산의 크기가 증가할수록 그리고 시간이 경과할수록 ROC 곡선은 다른 형태로 나타나며 AUC 값은 서서히 증가한다. 반대로 공분산이 작아질수록 시간이 경과함에 따라 AUC의 증가폭이 커진다. 임의효과모형에서 공분산이 양인 경우에 시간이 경과할수록 임의효과모형의 분산이 증가하며 AUC의 증가량은 시간효과모형의 AUC의 증가량보다 작다. 그리고 시간효과모형의 AUC의 증가량보다 임의효과모형의 증가량이 더 크다는 것을 탐색하였다.

대안적인 분류기준: 오분류율곱 (Alternative Optimal Threshold Criteria: MFR)

  • 홍종선;김효민;김동규
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.773-786
    • /
    • 2014
  • 본 연구는 ROC 곡선에서 형성되는 면적 형태로 나타나는 분류정확도기준인 오분류율곱(multiplication of false rates; MFR)를 제안한다. MFR 기준과 다른 기준로부터 구한 최적분류점의 분류성과에 대하여 비교 분석한다. 다양한 분포함수에 대하여 최적분류점을 구하고 이에 대응하는 FNR과 FPR을 비교하면서 MFR의 특징과 장점을 유도한다. 일반적인 비용함수를 바탕으로 분류점에 대한 비용비율을 다양한 분류기준을 이용하여 구한다. 비용곡선에 대한 비용비율의 관계를 정리하여 MFR 기준의 장점을 탐색한다. MFR 기준의 정의를 다차원 ROC 분석으로 확장하고 다차원의 다른 분류기준과의 관계를 설명하면서 토론한다.

수문학적 가뭄감시를 위한 하천유량 기반 가뭄지수 개발 (Development of Drought Index based on Streamflow for Monitoring Hydrological Drought)

  • 유지영;김태웅;김정엽;문장원
    • 대한토목학회논문집
    • /
    • 제37권4호
    • /
    • pp.669-680
    • /
    • 2017
  • 본 연구에서는 하천의 갈수관리를 위한 기준유량과 가뭄지수와의 일관성 분석을 수행하기 위해서, 국토교통부 홍수통제소에서 고시한 37개 갈수예보 관리지점 중 섬진강 수계의 구례2지점과 형산강 수계의 안강지점을 대상으로 하여 관측된 일별 유량 자료를 구축하였으며, 더불어 인근 기상관측소 남원지점과 포항지점의 강우량 자료를 활용하였다. 본 연구에서는 하천 유량자료를 기반으로 한 수문학적 가뭄상황을 재현해줄 수 있는 유량누가가뭄지수(SADI)를 개발하였다. SADI는 유량패턴의 변동시점(Change-Point) 분석을 통해 가뭄절단수준을 결정하였고, 또한 감소계수 추정을 위해 핵밀도함수를 이용하였다. 이처럼 계산된 SADI는 표준유출지수(SRI), 표준강수지수(SPI)와 비교되었으며, 이 중 SRI와 SPI는 30일, 90일, 180일, 270일 시간단위에 대한 가뭄지수를 모두 산정한 후, ROC 곡선 분석을 이용하여 갈수예보 기준유량과 일관성이 가장 높은 시간단위를 최종 결정하였다. 갈수예보 지점의 관심단계 예보기준유량을 기반으로 하여 다양한 가뭄지수와의 ROC 곡선 분석을 실시한 결과, 섬진강 수계의 구례2지점은 SADI_C3, SRI30, SADI_C1, SADI_C2, SPI90의 순으로 갈수예보의 정확도가 높은 것으로 나타났다. 또한, 형산강 수계의 안강지점은 SADI_C3, SADI_C1, SPI270, SRI30, SADI_C2의 순으로 갈수예보의 정확도가 높은 것으로 나타났다.