Effects of Multicollinearity in Logit Model

로짓모형에 있어서 다중공선성의 영향에 관한 연구

  • Published : 2008.02.28

Abstract

This research aims to explore the effects of multicollinearity on the reliability and goodness of fit of logit model. To investigate the effects of multicollinearity on the multinominal logit model, numerical experiments are performed. The exploratory variables(attributes of utility functions) which have a certain degree of correlations from (rho=) 0.0 to (rho=) 0.9 are generated and rho-squares and t-statistics which are the indices of goodness of fit and reliability of logit model are traced. From the well designed numerical experiments, following findings are validated : 1) When a new exploratory variable is added, some of rho-squares increase while the others decrease. 2) The higher relations between generic variables lead a logit model worse with respect to goodness of fit. 3) Multicollinearity has a tendency to produce over-evaluated parameters. 4) The reliability of the estimated parameter has a tendency to decrease when the correlations between attributes are high. These results suggest that we have to examine the existence of multicollinearity and perform the proper treatments to diminish multicollinearity when we develop logit model.

비확률변수간 선형관계로 정의되는 다중공선성은 설명변수간 선형방정식으로 표현되는 회귀모형의 신뢰도를 저하시키기 때문에 회귀모형의 구축과정에서는 세심한 검토와 대응이 이루어진다. 본 연구에서는 구조화된 수치실험을 통해서 로짓모형에 대한 다중공선성의 영향을 규명하였다. 효용함수를 구성하는 설명변수들간 상관관계의 정도에 따라서 추정된 모형의 적합도 지표와 계수의 신뢰도 지표가 어떻게 변동하는 지를 추적함으로써 다음과 같은 시사점을 확인할 수 있었다. 첫째, 설명변수의 추가를 통해서 모델의 적합도 개선이 가능한 회귀모형과 달리, 로짓모형에서는 효용함수에 설명변수를 추가하는 경우 로짓모형의 적합도가 개선될 수도, 역으로 저하될 수도 있음이 확인되었다. 둘째, 공통의 계수를 갖도록 모델을 구성하면 제네릭 변수간 상관관계가 높아짐에 따라 모델의 적합도가 저하됨을 확인하였다. 셋째, 설명 변수간 상관관계가 높은 경우 선택행동에 대한 설명변수의 기여도가 과대평가될 가능성을 확인하였다. 넷째, 설명변수간 상관관계가 높으면 추정된 계수의 신뢰도가 저하됨을 확인하였다. 결론적으로 본 연구를 통해서 그동안 로짓모형의 구축과정에서는 주목받지 못했던 다중공선성이 실제로는 세심한 배려와 적절한 대응을 통해서 제어되어야 함이 규명되었다.

Keywords

References

  1. 김강수(2002), "SP 화물수단선택을 위한 Inherent Random Heterogeneity 로짓 모형 연구", 대한교통학회지, 제20권 제3호, 대한교통학회, pp.83-92
  2. 김강수.조혜진(2004), "SP 순위 자료별 오차를 고려하는 순위로짓 모형 추정에 관한 연구", 대한교통학회지, 제22권 제6호, 대한교통학회, pp.197-206
  3. 박규영.이수범(2006), "보행자사고확률모형을 이용한 도로안전시설물의 효과도 추정 (4차로 일반국도를 대상으로)", 대한교통학회지, 제24권 제4호, 대한교통학회, pp.55-65
  4. 박상준.김성수(2007), "승용차 보유대수와 차종선택에 대한 네스티드로짓모형의 추정", 대한교통학회지, 제25권 제1호, 대한교통학회, pp.133-141
  5. 서상언.정진혁.김순관(2006), "활동 스케줄 분석을 통한 고령자의 통행특성과 통행행태에 관한 연구", 대한교통학회지, 제24권5호, 대한교통학회, pp.89-108
  6. 유지성, 오창수(2004), "현대통계학", 박영사
  7. 이성우, 민성희, 박지영, 윤성도(2005), "로짓.프로빗모형 응용", 박영사
  8. 土木學會(1995), "非集計モデルの理論と実際,丸善(株)
  9. Ben-Akiva, M., Steven R. Lerman(1987), Discrete Schoice Analysis : "Theory and application to travel demand", MIT Press
  10. Ben-Akiva, M., Watanatada(1981), "Application of a Continuous Choice Logit Model. In Structural Analysis of Discrete Data with Econometric Applications", MIT Press
  11. Cardell, N.S., F.C. Dunbar(1980), " Measuring the Societal Impacts of Automobile Sownsizing", Transportation Research A 14
  12. Frank S. Koppelman, Vaneet Sethi(2005), "Incorporating variance and covariance heterogeneity in the Generalized Nested Logit model: an application to modeling long distance travel choice behavior", Transportation Research Part B 39
  13. Juan de Dios Ortuzar, David Hensher, Sergio Jara-Diaz(1998), "Travel Behaviour Research : Updating the State of Play", Pergamon
  14. Karthik K. Srinivasan, Sudhakar R. Athuru (2005), "Analysis of within- household effects and between-household differences in maintenance activity allocation", Transportation, Volume 32, Number 5
  15. Karthik K. Srinivasan, Hani S. Mahmassani (2003), "Analyzing heterogeneity and unobserved structural effects in route-switching behavior under ATIS: a dynamic kernel logit formulation", Transportation Research Part B 37
  16. Norbert Oppenheim(1994), "Urban Travel Demand Modeling from individual choice to general Equilibrium", John Willy & Sons, Inc
  17. Simon P. Washington, Matthew G. Karlaftis, Fred L. Mannering(2003), Statistical and Econometric Methods for Transportation Data Analysis, Chapman & Hall/CRC
  18. Tommy Gärling, Tomas Laitila, Kerstin Westin (1998), "Theoretical Foundations of Travel Choice Modeling", Pergamon
  19. William H. Greene, David A. Hensher, John Rose(2006), "Accounting for heterogeneity in the variance of unobserved effects in mixed logit models", Transportation Research Part B 40