DOI QR코드

DOI QR Code

Analysis of the cause-specific proportional hazards model with missing covariates

누락된 공변량을 가진 원인별 비례위험모형의 분석

  • Minjung Lee (Department of Statistics, Kangwon National University)
  • Received : 2023.08.22
  • Accepted : 2023.10.25
  • Published : 2024.04.30

Abstract

In the analysis of competing risks data, some of covariates may not be fully observed for some subjects. In such cases, excluding subjects with missing covariate values from the analysis may result in biased estimates and loss of efficiency. In this paper, we studied multiple imputation and the augmented inverse probability weighting method for regression parameter estimation in the cause-specific proportional hazards model with missing covariates. The performance of estimators obtained from multiple imputation and the augmented inverse probability weighting method is evaluated by simulation studies, which show that those methods perform well. Multiple imputation and the augmented inverse probability weighting method were applied to investigate significant risk factors for the risk of death from breast cancer and from other causes for breast cancer data with missing values for tumor size obtained from the Prostate, Lung, Colorectal, and Ovarian Cancer Screen Trial Study. Under the cause-specific proportional hazards model, the methods show that race, marital status, stage, grade, and tumor size are significant risk factors for breast cancer mortality, and stage has the greatest effect on increasing the risk of breast cancer death. Age at diagnosis and tumor size have significant effects on increasing the risk of other-cause death.

경쟁위험자료에서 일부 공변량들이 연구대상들의 일부분에 대해 관측되지 않을 수 있다. 그런 경우 결측된 공변량 값을 가진 연구대상들을 분석에서 제외하는 것은 편향된 추정치와 효율성 손실이 발생할 수 있다. 본 논문에서는 누락된 공변량을 가진 원인별 비례위험모형의 회귀모수 추정을 위해 다중대체 방법과 증대된 역 확률 가중 방법을 연구하였다. 모의실험을 통해 다중대체 방법과 증대된 역 확률 가중 방법에 의해 구해진 추정량의 성능을 평가한 결과, 이 방법들이 잘 수행됨을 확인하였다. 미국 국립암연구소의 전립선, 폐, 대장, 난소 암 선별 시험 연구에서 제공하는 종양 크기의 값이 누락된 유방암 자료에 대해 암 사망 위험률과 다른 원인 사망 위험률에 유의한 영향을 미치는 요인을 파악하기 위해 다중대체 방법과 증대된 역 확률 가중 방법을 적용하였다. 다중대체 방법과 증대된 역 확률 가중 방법에 의해 원인별 비례위험모형을 적합한 결과, 인종, 기혼여부, 병기, 분화도, 종양의 크기는 유방암 사망 위험률에 유의한 영향을 미치는 요인들이였으며, 병기가 유방암 사망 위험률을 높이는데 가장 큰 영향을 미치는 요인임을 확인하였다. 진단시 연령과 종양의 크기는 다른 원인 사망 위험률을 높이는데 유의한 영향을 미치는 요인이였다.

Keywords

Acknowledgement

이 논문은 2022년도 강원대학교 대학회계의 지원을 받아 수행한 연구임. 전립선, 폐, 대장, 난소(PLCO) 암 선별 시험에서 수집한 미국 국립암연구소의 자료에 접근할 수 있도록 승인해 준 미국 국립암연구소에 감사를 표함 (PLCO-1248).

References

  1. Andersen PK and Gill RD. (1982). Cox's regression model for counting processes: A large sample study, Annals of Statistics, 10, 1100-1120. https://doi.org/10.1214/aos/1176345976
  2. Bartlett JW and Taylor JM. (2016). Missing covariates in competing risks analysis, Biostatistics, 17, 751-763. https://doi.org/10.1093/biostatistics/kxw019
  3. Cox DR. (1972). Regression models and life-tables (with discussion), Journal of Royal Statistical Society, Series A, 34, 187-220. https://doi.org/10.1111/j.2517-6161.1972.tb00899.x
  4. Fine JP and Gray RJ. (1999). A proportional hazards model for the subdistribution of a competing risk, Journal of the American Statistical Association, 94, 496-508. https://doi.org/10.2307/2670170
  5. Nadaraya EA. (1964). On estimating regression, Theory of Probability and Its Applications, 9, 141-142. https://doi.org/10.1137/1109020
  6. Prentice RL, Kalbeisch JD, Peterson AV, Flournoy N, Farewell VT, and Breslow NE. (1978). The analysis of failure times in the presence of competing risks, Biometrics, 34, 541-554. https://doi.org/10.2307/2530374
  7. Qi L, Wang CY, and Prentice RL. (2005). Weighted estimators for proportional hazards regression with missing covariates, Journal of the American Statistical Association, 472, 1250-1263. https://doi.org/10.1198/016214505000000295
  8. Qi L, Y-F Wang, and Y He. (2010). A comparison of multiple imputation and fully augmented weighted estimators for Cox regression with missing covariates, Statistics in Medicine, 29, 2592-2604. https://doi.org/10.1002/sim.4016
  9. Robins JM, Rotnitzky A, and Zhao LP. (1994). Estimation of regression coefficients when some regressors are not always observed, Journal of the American Statistical Association, 89, 846-866. https://doi.org/10.1080/01621459.1994.10476818
  10. Rubin DB. (1976). Inference and missing data, Biometrika, 63, 581-592. https://doi.org/10.1093/biomet/63.3.581
  11. Rubin DB. (1987). Multiple Imputation for Nonresponse in Surveys, Wiley, New York.
  12. Wang CY and Chen HY. (2001). Augmented inverse probability weighted estimator for Cox missing covariate regression, Biometrics, 57, 414-419. https://doi.org/10.1111/j.0006-341X.2001.00414.x
  13. Wang S and Wang CY. (2001). A note on kernel assisted estimators in missing covariate regression, Statistics & Probability Letters, 55, 439-449.
  14. Watson GS. (1964). Smooth regression analysis, Sankhya A, 26, 359-372.