DOI QR코드

DOI QR Code

Comparison study of modeling covariance matrix for multivariate longitudinal data

다변량 경시적 자료 분석을 위한 공분산 행렬의 모형화 비교 연구

  • Received : 2020.03.05
  • Accepted : 2020.04.09
  • Published : 2020.06.30

Abstract

Repeated outcomes from the same subjects are referred to as longitudinal data. Analysis of the data requires different methods unlike cross-sectional data analysis. It is important to model the covariance matrix because the correlation between the repeated outcomes must be considered when estimating the effects of covariates on the mean response. However, the modeling of the covariance matrix is tricky because there are many parameters to be estimated, and the estimated covariance matrix should be positive definite. In this paper, we consider analysis of multivariate longitudinal data via two modeling methodologies for the covariance matrix for multivariate longitudinal data. Both methods describe serial correlations of multivariate longitudinal outcomes using a modified Cholesky decomposition. However, the two methods consider different decompositions to explain the correlation between simultaneous responses. The first method uses enhanced linear covariance models so that the covariance matrix satisfies a positive definiteness condition; in addition, and principal component analysis and maximization-minimization algorithm (MM algorithm) were used to estimate model parameters. The second method considers variance-correlation decomposition and hypersphere decomposition to model covariance matrix. Simulations are used to compare the performance of the two methodologies.

같은 개체로부터 반복 측정한 자료를 경시적 자료(longitudinal data)라고 한다. 이러한 자료를 분석하려면 흔히 사용되는 횡단 자료 분석과는 다른 분석 방법이 필요하다. 즉, 경시적 자료에서 공변량의 효과를 추정할 때에는 반복 측정된 결과 간의 상관성을 고려해야 하며, 따라서 공분산행렬을 모형화 하는 것이 매우 중요하다. 그러나 추정해야 할 모수가 많고, 추정된 공분산행렬이 양정치성을 만족해야 하므로 공분산 행렬의 모형화는 쉽지 않다. 특히 다변량 경시적 자료분석을 위한 공분산행렬의 모형화는 더욱더 심층적인 방법론을 사용해야 한다. 본 논문은 다변량 경시적 자료분석을 위한 공분산행렬을 모형화하기 위해 두 가지 방법론을 고찰한다. 두 방법 모두 수정된 콜레스키 분해(modified Cholesky decomposition)를 이용하여 시간에 따른 응답변수들의 상관관계를 설명하고 있다. 하지만 같은 시간에서 관측된 응답변수들간의 상관관계를 설명하는 방법이 다르다. 첫 번째 방법론에서는 향상된 선형 공분산 모형(enhanced linear covariance models)을 사용하여 공분산행렬이 양정치성을 만족하도록 한다. 두 번째 방법론에서는 분산-공분산 분해(variance-correlation decomposition)와 초구분해(hypersphere decomposition)을 이용하여 공분산 행렬을 모형화 한다. 이 두 방법론의 성능을 비교하고자 모의실험을 진행한다.

Keywords

References

  1. Kim, C. and Zimmerman, D. L. (2012). Unconstrained models for the covariance structure of multivariate longitudinal data, Journal of Multivariate Analysis, 107, 104-118. https://doi.org/10.1016/j.jmva.2012.01.004
  2. Kohli, P., Garcia, T. P., and Pourahmadi, M. (2016). Modeling the Cholesky factors of covariance matrices of multivariate longitudinal data, Journal of Multivariate Analysis, 145, 87-100. https://doi.org/10.1016/j.jmva.2015.11.014
  3. Lee, K., Cho, H., Kwak, M. S. and Jang, E. J. (2019). Estimation of covariance matrix of multivariate longitudinal data using modified Choleksky and hypersphere decompositions, Biometrics, 76, 75-86. https://doi.org/10.1111/biom.13113
  4. Pourahmadi, M. (1999). Joint mean-covariance models with applications to longitudinal data: Unconstrained parameterisation, Biometrika, 86, 677-690. https://doi.org/10.1093/biomet/86.3.677
  5. Qu, A., Lindsay, B. G., and Li, B. (2000). Improving generalised estimating equations using quadratic inference functions, Biometrika, 87, 823-836. https://doi.org/10.1093/biomet/87.4.823
  6. Xu, J. and Mackenzie, G. (2012). Modelling covariance structure in bivariate marginal models for longitudinal data, Biometrika, 99, 649-662. https://doi.org/10.1093/biomet/ass031
  7. Zhou, J. and Qu, A. (2012). Informative estimation and selection of correlation structure for longitudinal data, Journal of the American Statistical Association, 107, 701-710. https://doi.org/10.1080/01621459.2012.682534