• 제목/요약/키워드: Markov chain Monte Carlo sampling

검색결과 63건 처리시간 0.018초

Survival Analysis for White Non-Hispanic Female Breast Cancer Patients

  • Khan, Hafiz Mohammad Rafiqullah;Saxena, Anshul;Gabbidon, Kemesha;Stewart, Tiffanie Shauna-Jeanne;Bhatt, Chintan
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권9호
    • /
    • pp.4049-4054
    • /
    • 2014
  • Background: Race and ethnicity are significant factors in predicting survival time of breast cancer patients. In this study, we applied advanced statistical methods to predict the survival of White non-Hispanic female breast cancer patients, who were diagnosed between the years 1973 and 2009 in the United States (U.S.). Materials and Methods: Demographic data from the Surveillance Epidemiology and End Results (SEER) database were used for the purpose of this study. Nine states were randomly selected from 12 U.S. cancer registries. A stratified random sampling method was used to select 2,000 female breast cancer patients from these nine states. We compared four types of advanced statistical probability models to identify the best-fit model for the White non-Hispanic female breast cancer survival data. Three model building criterion were used to measure and compare goodness of fit of the models. These include Akaike Information Criteria (AIC), Bayesian Information Criteria (BIC), and Deviance Information Criteria (DIC). In addition, we used a novel Bayesian method and the Markov Chain Monte Carlo technique to determine the posterior density function of the parameters. After evaluating the model parameters, we selected the model having the lowest DIC value. Using this Bayesian method, we derived the predictive survival density for future survival time and its related inferences. Results: The analytical sample of White non-Hispanic women included 2,000 breast cancer cases from the SEER database (1973-2009). The majority of cases were married (55.2%), the mean age of diagnosis was 63.61 years (SD = 14.24) and the mean survival time was 84 months (SD = 35.01). After comparing the four statistical models, results suggested that the exponentiated Weibull model (DIC= 19818.220) was a better fit for White non-Hispanic females' breast cancer survival data. This model predicted the survival times (in months) for White non-Hispanic women after implementation of precise estimates of the model parameters. Conclusions: By using modern model building criteria, we determined that the data best fit the exponentiated Weibull model. We incorporated precise estimates of the parameter into the predictive model and evaluated the survival inference for the White non-Hispanic female population. This method of analysis will assist researchers in making scientific and clinical conclusions when assessing survival time of breast cancer patients.

베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석 (Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake)

  • 이다솜;이은지;조성일;최태련
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.25-46
    • /
    • 2020
  • 본 논문에서는 Bayesian spectral analysis regression (BSAR) 방법론을 이용한 베이지안 순서형 프로빗 준모수 회귀모형에 대해서 고찰한다. 순서형 프로빗 회귀모형은 순서가 있는 범주형 자료를 모형화하는 방법으로, 정규 분포의 분포함수의 역함수인 프로빗 연결함수를 이용해 각 범주의 확률과 설명변수을 연결함으로써 반응변수의 확률을 모형화한다. 베이지안 프로빗 회귀 모형은 정규 분포를 따르는 잠재변수를 도입함으로써 사후 분포 도출을 용이하게 하고, 절단점에 따라 나뉘어지는 잠재변수들의 값에 따라서 반응 변수들이 범주화된다. 본 논문에서는 이러한 잠재 변수 방법을 확장해 BSAR 방법론에 기반하여 단조증가/감소와 같은 형태제약을 반영할 수 있는 베이지안 이항형 및 순서형 프로빗 준모수 회귀모형에 대해 연구한다. 모의실험을 통하여 이항형 프로빗 준모수 회귀모형과 기존의 다른 모형들 간의 적합결과를 비교하고, 형태 제약에 따른 순서형 프로빗 준모수 회귀모형의 적합결과를 비교 분석하도록 한다. 아울러, 국민건강영양조사 제 7기 1차년도 (2016) 자료(Korean National Health and Nutrition Examination Survey (KNHANES), 2016)를 바탕으로, 본 논문에서 고찰한 이항형 및 순서형 프로빗 준모수 회귀모형을 적용하여, 흡연양태와 커피섭취 간의 관계에 대한 실증적 분석을 수행한다.

건전성 예측을 위한 모델변수 추정방법의 비교 (A Comparison Study of Model Parameter Estimation Methods for Prognostics)

  • 안다운;김남호;최주호
    • 한국전산구조공학회논문집
    • /
    • 제25권4호
    • /
    • pp.355-362
    • /
    • 2012
  • 건전성 예측은 구조물의 고장이 발생될 때까지 남은 시간인 잔존유효수명을 예측하는 것으로, 이는 안전 및 정비 계획과 직접적으로 연관되기 때문에 매우 중요하다. 건전성 예측방법에는 물리모델 기반방법, 데이터 기반방법과 두 방법의 장점을 통합하는 방법이 있으며, 본 연구에서는 잔존수명 예측의 정확도가 모델변수 추정과 직접적으로 관련되는 물리모델 기반 건전성 예측에 초점을 맞춘다. 물리모델기반 건전성 예측에서는 모델변수 추정을 통해 시스템 상태의 장기 예측이 가능하지만, 대부분의 실제 구조물들의 상태모델은 여러 개의 모델변수를 포함함은 물론이고, 그 변수들이 서로 상관되어 있기 때문에 모델변수를 추정하는 일은 간단한 문제가 아니다. 본 연구에서는 물리모델 기반 건전성 예측을 위한 세 가지 변수 추정방법들의 차이를 논한다. 이 세 가지 방법들은 파티클 필터, 전반적인 베이지안 접근법, 그리고 순차적인 베이지안 접근법으로 모두 베이지안 추론이라는 하나의 이론적 바탕에 기반하지만, 샘플링 방법이나 갱신 절차 등에서 차이가 있다. 균열성장을 표현하는 Paris 모델의 변수 추정을 통해 세 가지 방법의 차이점이 논해지고, 건전성 예측 메트릭을 이용하여 정량적 차이를 표현한다. 파티클 필터방법이 건전성 예측 메트릭 측면에서 가장 높은 성능을 나타내었지만, 전반적인 베이지안 방법은 파티클 필터방법과 근소한 차이를 보이면서도 데이터가 집단으로 존재할 때에는 가장 효율적인 방법으로 나타났다.