• 제목/요약/키워드: ROC Curve Analysis

검색결과 360건 처리시간 0.034초

Analysis of SEER Adenosquamous Carcinoma Data to Identify Cause Specific Survival Predictors and Socioeconomic Disparities

  • Cheung, Rex
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권1호
    • /
    • pp.347-352
    • /
    • 2016
  • Background: This study used receiver operating characteristic curve to analyze Surveillance, Epidemiology and End Results (SEER) adenosquamous carcinoma data to identify predictive models and potential disparities in outcome. Materials and Methods: This study analyzed socio-economic, staging and treatment factors available in the SEER database for adenosquamous carcinoma. For the risk modeling, each factor was fitted by a generalized linear model to predict the cause specific survival. An area under the receiver operating characteristic curve (ROC) was computed. Similar strata were combined to construct the most parsimonious models. Results: A total of 20,712 patients diagnosed from 1973 to 2009 were included in this study. The mean follow up time (S.D.) was 54.2 (78.4) months. Some 2/3 of the patients were female. The mean (S.D.) age was 63 (13.8) years. SEER stage was the most predictive factor of outcome (ROC area of 0.71). 13.9% of the patients were un-staged and had risk of cause specific death of 61.3% that was higher than the 45.3% risk for the regional disease and lower than the 70.3% for metastatic disease. Sex, site, radiotherapy, and surgery had ROC areas of about 0.55-0.65. Rural residence and race contributed to socioeconomic disparity for treatment outcome. Radiotherapy was underused even with localized and regional stages when the intent was curative. This under use was most pronounced in older patients. Conclusions: Anatomic stage was predictive and useful in treatment selection. Under-staging may have contributed to poor outcome.

클래스 불균형 문제에서 베이지안 알고리즘의 학습 행위 분석 (Learning Behavior Analysis of Bayesian Algorithm Under Class Imbalance Problems)

  • 황두성
    • 전자공학회논문지CI
    • /
    • 제45권6호
    • /
    • pp.179-186
    • /
    • 2008
  • 본 논문에서는 베이지안 알고리즘이 불균형 데이터의 학습 시 나타나는 현상을 분석하고 성능 평가 방법을 비교하였다. 사전 데이터 분포를 가정하고 불균형 데이터 비율과 분류 복잡도에 따라 발생된 분류 문제에 대해 베이지안 학습을 수행하였다. 실험 결과는 ROC(Receiver Operator Characteristic)와 PR(Precision-Recall) 평가 방법의 AUC(Area Under the Curve)를 계사하여 불균형 데이터 비율과 분류 복잡도에 따라 분석되었다. 비교 분석에서 불균형 비율은 기 수행된 연구 결과와 같이 베이지안 학습에 영향을 주었으며, 높은 분류 복잡도로부터 나타나는 데이터 중복은 학습 성능을 방해하는 요인으로 확인되었다. PR 평가의 AUC는 높은 분류 복잡도와 높은 불균형 데이터 비율에서 ROC 평가의 AUC보다 학습 성능의 차이가 크게 나타났다. 그러나 낮은 분류 복잡도와 낮은 불균형 데이터 비율의 문제에서 두 측정 방법의 학습 성능의 차이는 미비하거나 비슷하였다. 이러한 결과로부터 PR 평가의 AUC는 클래스 불균형 문제의 학습 모델의 설계와 오분류 비용을 고려한 최적의 학습기를 결정하는데 도움을 줄 수 있다.

Cox 비례위험모형을 이용한 우측 대장암 3기 자료 분석 (Analysis of stage III proximal colon cancer using the Cox proportional hazards model)

  • 이태섭;이민정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.349-359
    • /
    • 2017
  • 본 논문에서는 미국 국립암연구소의 SEER 프로그램에서 제공하는 우측 대장암 3기 자료에 Cox 비례위험모형을 적합하여 생존분석을 하였다. 우측 대장암 3기 환자의 사망률에 유의한 영향을 미치는 공변량들을 파악하고, 관심있는 공변량들을 가진 환자의 생존율을 추정하였다. Schoenfeld 잔차를 기반한 검정과 Schoenfeld 잔차 도표, $log[-log\{{\hat{S}}(t)\}]$ 도표를 이용하여 분석에 사용된 공변량들이 비례위험 가정을 만족함을 확인하였다. 적합된 Cox 비례위험모형의 타당성을 검증하기 위해 10-fold 교차 검증을 이용하여 calibration 도표와 시간에 의존하는 ROC 곡선 아래 면적을 계산하였다. 이를 통해 적합된 Cox 비례위험모형의 타당성을 확인하였다.

생체 간이식 공여자에서 비알코올성 지방간 질환의 진단에 있어서 초음파검사의 타당도 연구 (Validity of Ultrasonography in the Diagnosis of Non-alcoholic Fatty Liver Disease in Living Liver Donors)

  • 김연민;한동균
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.342-348
    • /
    • 2011
  • 생체 간이식 공여자를 대상으로 시행되는 간생검 조직소견의 지방변성 정도와 복부초음파검사 결과를 분석하여, 지방간 질환의 진단에 있어서 초음파검사의 타당성을 알아보고자 하였다. 총 지방 함유량 10% 기준으로 범주화 하여 10% 이하를 음성, 10% 이상을 양성으로 하였을 때 초음파검사의 민감도는 64.6%이었고, 특이도는 68% 이었으며, 양성 예측도와 음성 예측도는 각각 76.8%, 54% 이었다. 초음파검사 결과 정상과 경증을 음성으로, 중등도를 양성으로 조작하였을 때 초음파검사의 민감도는 26.8% 이었고, 특이도는 100% 이었으며, 양성 예측도와 음성 예측도는 각각 100%, 45.5% 이었다. 총 지방 함유량 10% 이상을 상태변수(State variable)로 ROC curve 분석을 시행 하였을 때. 간/신장 명도비의 곡선하면적(Area under curve, AUC)은 0.859로 지방간을 예측하는데 좋은 지표로 나타났으며, 95% 신뢰구간(CI: 0.795~0.922)이 통계적으로 유의한 값을 보였다(p<0.001). 지방간진단에 있어서 복부초음파검사는 간생검 병리학적 결과를 예측하는데 높은 타당도를 보였다.

다수준 로지스틱 모형을 이용한 흡연 여부에 미치는 영향 분석 (A Study of Effect on the Smoking Status using Multilevel Logistic Model)

  • 이지혜;허태영
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.89-102
    • /
    • 2014
  • 본 연구에서는 질병관리본부에서 매년 조사하고 있는 지역사회 건강조사 자료를 이용하여 서울시 지역을 대상으로 개인의 흡연 여부에 대한 영향 요인을 확인하고 지역간 차이를 모형에 반영시키는 다수준 로지스틱 모형을 이용하여 분석하였다. 다수준 모형에서의 적합한 분석 모형의 수준을 결정하기 위해 ICC(intraclass correlation coefficient)와 프로파일링 분석, 수준별 모형의 예측정확도를 이용하였다. 제안된 모형들의 성능을 평가하기 위해 민감도, 특이도, 정확도를 구하고 ROC curve를 작성하였다. 결과적으로 지역사회 건강조사 자료와 같이 개인과 집단 변수를 동시에 고려할 수 있다면 다양한 다수준 모형의 적용이 가능하며 활용성이 높다는 것을 알 수 있었다.

고속도로 이용자의 승차감 평가특성 및 만족도 분석과 ROC 곡선을 이용한 평탄성 관리기준 적정성 검토 (Analysis of Riding Quality Acceptability and Characteristics of Expressway Users and Evaluation of MRI Thresholds using Receiver Operating Characteristic curves)

  • 이재훈;손덕수;류성우;김용원;박준영
    • 한국도로학회논문집
    • /
    • 제20권2호
    • /
    • pp.35-44
    • /
    • 2018
  • PURPOSES : The purpose of this research is to analyze the characteristics of panels that affect the evaluating results of riding quality and to evaluate the appropriateness of roughness management criteria based on ride comfort satisfaction. METHODS : In order to analyze the influence of panel characteristics of riding quality, 33 panels, consisting of civilians and experts, were selected. Also, considering the roughness distribution of the expressway, 35 sections with MRI ranging from 1.17 m/km to 4.65 m/km were selected. Each panel boarded a passenger car and evaluated the riding quality with grades from 0 to 10, and assessed whether it was satisfied or not. After removing outlier results using a box plot technique, 964 results were analyzed. An ANOVA was conducted to evaluate the effects of panel expertise, age, driving experience, vehicle ownership, and gender on the evaluation results. In addition, by using the receiver operating characteristics (ROC) curve, the MRI value, which can most accurately evaluate the satisfaction with riding quality, was derived. Then, the compatibility of MRI was evaluated using AUC as a criterion to assess whether the riding quality was satisfactory. RESULTS : Only the age of the panel participants were found to have an effect on the riding quality satisfaction. It was found that satisfaction with riding quality and MRI are strongly correlated. The satisfaction rate of roughness management criteria on new (MRI 1.6 m/km) and maintenance (MRI 3.0 m/km) expressways were 95% and 53%, respectively. As a result of evaluating the roughness management criteria by using the ROC curve, it was found that the accuracy of satisfaction was the highest at MRI 3.1-3.2 m/km. In addition, the AUC of the MRI was about 0.8, indicating that the MRI was an appropriate index for evaluating the riding quality satisfaction. CONCLUSIONS : Based on the results, the distribution of the panels' age should be considered when panel rating is conducted. From the results of the ROC curve, MRI of 3.0 m/km, which is a criterion of roughness management on maintenance expressways, is considered as appropriate.

Diagnostic performance of enzyme-linked immnosorbent assays for diagnosing paratuberculosis in cattle: a meta-analysis

  • Pak, Son-Il
    • 대한수의학회지
    • /
    • 제44권4호
    • /
    • pp.669-676
    • /
    • 2004
  • To evaluate the diagnostic accuracy of two commercial ELISA tests (Allied- and CSL-ELISA) for the diagnosis of Mycobacterium paratuberculosis in cattle, Meta-analysis using English language papers published during 1990-2001 was performed. Diagnostic odds ratios (DOR) were analyzed using regression analysis together with summary receiver operating characteristic (ROC) curves. The difference in diagnostic performance between the two ELISA systems was evaluated by using linear regression. Publication bias was assessed by funnel plot and linear regression. The pooled sensitivity and specificity were 44% (95% CI, 38 to 51) and 98% (95% CI, 96 to 99) for the random-effect model. The DOR between studies was heterogeneous. The area under the fitted ROC curve (AUC) was 0.72 for the unweighted and 0.77 for the weighted model. Maximum joint sensitivity and specificity for the unweighted and weighted model from their summary ROC curve were 70% and 75%, respectively. Based on the fitted model, at a specificity of 95%, sensitivity was estimated to be 52% for the unweighted and 57% for the weighted model. From the final multivariable model study characteristic, the country was the only significant variable with an explained component variance of 13.3%. There were no significant differences in discriminatory power, sensitivity, and specificity between the two ELISA tests. The overall diagnostic accuracy of two commercial ELISA tests was moderate, as judged by the AUC, maximum joint sensitivity and specificity, and estimates from the fitted model and clinical usefulness of the tests for screening program is limited because of low sensitivity and heterogeneous of DOR. It is, therefore, recommended to use ELISA tests as a parallel testing with other diagnostic tests together to increase test sensitivity in the screening program.

AI 기반의 주조 공정 파라미터 최적화를 통한 알고리즘 개선 (Algorithm Improvement Through AI-Based Casting Process Parameter Optimization)

  • 심현;최서영;김현욱
    • 한국전자통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.441-448
    • /
    • 2023
  • 제조 공정 데이터에 있어 주조 공정은 가장 중요한 공정이면서 높은 불량률의 원인을 발생시키는 공정이다. 주조 공정의 품질관리는 생산성과 품질평가의 핵심 요소라 할 수 있다. 본 연구에서는 공정 데이터를 통한 요인 분석, 상관 분석, 회귀 분석 결과를 기반으로 최적화 된 머신러닝 모델 알고리즘을 개발한다. 이를 적용한 주조공정을 통해서 불량률을 줄이고 스마트 팩토리의 데이터 적합성을 검증하고자 한다.

제 2형 당뇨병을 이용한 로지스틱과 베이지안 노모그램 구축 및 비교 (Nomogram comparison conducted by logistic regression and naïve Bayesian classifier using type 2 diabetes mellitus (T2D))

  • 박재철;김민호;이제영
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.573-585
    • /
    • 2018
  • 본 연구에서는 제 2형 당뇨(type 2 diabetes mellitus)의 발병 확률을 예측하기 위해 11가지 위험요인을 가지고 로지스틱 회귀모형과 순수 베이지안 분류기 모형에 적합시킨다. 그런 다음 이를 시각적으로 쉽게 이해하는데 도움을 주는 노모그램 구축 방법을 소개한다. 분석은 2013-2015년 6기 국민건강영양조사 데이터를 가지고 분석하였다. 또 로지스틱 회귀모형에 세 가지 상호작용 항을 넣어 분석의 질을 높이고자 하였고 베이지안 노모그램에 left-aligned 방법을 사용하여 비교하기 쉽게 만들었다. 최종적으로 두 노모그램을 비교하고 효용성을 알아보았다. 마지막으로 ROC 곡선을 이용하여 노모그램이 적절한지 검증하였다.