DOI QR코드

DOI QR Code

Spatial Clustering Method Via Generalized Lasso

Generalized Lasso를 이용한 공간 군집 기법

  • Song, Eunjung (Department of Statistics, Inha University) ;
  • Choi, Hosik (Department of Applied Information Statistics, Kyonggi University) ;
  • Hwang, Seungsik (College of Medicine, Inha University) ;
  • Lee, Woojoo (Department of Statistics, Inha University)
  • 송은정 (인하대학교 통계학과) ;
  • 최호식 (경기대학교 응용정보 통계학과) ;
  • 황승식 (인하대학교 의과대학) ;
  • 이우주 (인하대학교 통계학과)
  • Received : 2014.04.15
  • Accepted : 2014.07.08
  • Published : 2014.08.31

Abstract

In this paper, we propose a penalized likelihood method to detect local spatial clusters associated with disease. The key computational algorithm is based on genlasso by Tibshirani and Taylor (2011). The proposed method has two main advantages over Kulldorff's method which is popoular to detect local spatial clusters. First, it is not needed to specify a proper cluster size a priori. Second, any type of covariate can be incorporated and, it is possible to find local spatial clusters adjusted for some demographic variables. We illustrate our proposed method using tuberculosis data from Seoul.

본 논문에서는 질병과 연관성을 갖는 국소 공간 군집을 검출할 수 있는 벌칙 가능도 방법을 제안한다. 핵심적인 계산 알고리즘은 Tibshirani와 Taylor (2011)에 의해 제안된 일반화된 라소(generalized lasso)에 기반한다. 제안된 방법은 현재 널리 사용되고 있는 국소 공간 군집 방법인 Kulldorff의 기법에 비해 두가지 주요 장점을 가지고 있다. 첫째로, 제안된 방법은 사전에 군집의 크기를 미리 결정해 줄 필요가 없다. 둘째로, 임의의 설명변수를 공간 군집 탐색 기법에 고려할 수 있기 때문에 인구학적인 변수를 보정하였을 때 나타나는 국소 공간 군집을 찾는 것이 가능하다. 우리는 제안된 방법을 서울시 결핵 자료를 사용하여 설명한다.

Keywords

References

  1. Duczmal, L. and Assuncao, R. (2004). A simulated annealing strategy for the detection of arbitrarily shaped spatial clusters, Computational Statistics & Data Analysis, 45, 269-286. https://doi.org/10.1016/S0167-9473(02)00302-X
  2. Hoh, J. and Ott, J. (2000). Scan statistics to scan markers for susceptibility genes, Proceedings of the National Academy of Sciences, 97, 9615-9617. https://doi.org/10.1073/pnas.170179197
  3. Kulldorff, M. (1997). A spatial scan statistic, Communications in Statistics-Theory and Methods, 26, 1481-1496. https://doi.org/10.1080/03610929708831995
  4. Sherman, G., Sutton, T., Blazek, R. and Mitchell, T. (2007). Quantum GIS Software User Guide, Quantum GIS documentation website http://gisalaska.com/qgis/doc.
  5. Spence, D. P., Hotchkiss, J., Williams, C. S. and Davies, P. D. (1993). Tuberculosis and poverty, BMJ, 307, 759-761. https://doi.org/10.1136/bmj.307.6907.759
  6. Tibshirani, R. (1996). Regression shrinkage and selection via the lasso, Journal of the Royal Statistical Society, Series B, 58, 267-588.
  7. Tibshirani, R., Saunders, M., Rosset, S., Zhu, J. and Knight, K. (2005). Sparsity and smoothness via the fused lasso, Journal of the Royal Statistical Society, Series B, 67, 91-108. https://doi.org/10.1111/j.1467-9868.2005.00490.x
  8. Tibshirani, R. J. and Taylor, J. (2011). The solution path of the generalized lasso, The Annals of Statistics 39, 1335-1371. https://doi.org/10.1214/11-AOS878
  9. Townsend, P. (1987). Deprivation, Journal of Social Policy, 16, 125-146. https://doi.org/10.1017/S0047279400020341
  10. Wang, H., Li, R. and Tsai, C. L. (2007). Tuning parameter selectors for the smoothly clipped absolute deviation method, Biometrika, 94, 553-568. https://doi.org/10.1093/biomet/asm053