Missing Data Imputation Using Permanent Traffic Counts on National Highways

일반국토 상시 교통량자료를 이용한 교통량 결측자료 추정

  • Published : 2007.02.28

Abstract

Up to now Permanent traffic volumes have been counted by Automatic Vehicle Classification (AVC) on National Highways. When counted data have missing items or errors, the data must be revised to stay statistically reliable This study was carried out to estimate correct data based on outoregression and seasonal AutoRegressive Integrated Moving Average (ARIMA). As a result of verification through seasonal ARIMA, the longer the missed period is, the greater the error. Autoregression results in better verification results than seasonal ARIMA. Traffic data is affected by the present state mote than past patterns. However. autoregression can be applied only to the cases where data include similar neighborhood patterns and even in this case. the data cannot be corrected when data are missing due to low qualify or errors Therefore, these data shoo)d be corrected using past patterns and seasonal ARIMA when the missing data occurs in short periods.

일반국도의 상시조사 자료는 교통량 조사 장비를 통해 수집되며, 수집된 자료가 누락되거나 불량일 경우 통계자료의 객관성을 유지하기 위해서 보정을 해야 한다. 교통량 결측 자료의 보정을 통계적인 방법으로 접근하여 신뢰성을 높이고자 본 연구에서는 보정 대상 시간과 동일시간의 자료를 적용할 수 있는 자기회귀분석과 보정 대상 지점과 동일 지점의 자료를 적용할 수 있는 계절 시계열 분석을 이용하여 보정하는 방안을 제시하였다. 계절 시계열 분석을 적용하여 결측 자료를 보정한 결과, 결측 기간이 길어질수록 오차가 커지는 것으로 분석되었다. 이것은 단기예측의 경우 실제자료를 이용하여 예측 값을 제시하지만, 장기예측의 경우 예측된 자료를 이용하여 예측값을 제시하기 때문에 신뢰성이 떨어지기 때문이라 판단된다. 자기회귀분석을 적용하여 결측 자료를 보정한 결과, 시계열분석에 비해서 오차가 적은 것으로 분석되었다. 이것은 교통량자료는 과거 패턴보다 현재 시점의 영향을 더 많이 받는 것이기 때문이라 판단된다 하지만 자기회귀분석은 인근에 패턴이 유사한 지점이 있어야 가능하며, 인근에 유사한 지점이 있더라도 그 지점의 자료가 불량일 경우 보정이 불가능하다는 단점이 있다. 이러한 경우에는 과거자료를 이용해서 보정할 수밖에 없으며, 단기 결측의 경우에는 시계열분석을 이용할 수 있다.

Keywords

References

  1. 건설교통부(2001), 도로 교통량 조사 지침
  2. 건설교통부(2006), 2005 도로 교통량 통계연보
  3. 한국건설기술연구원(2001), 통행시간 추정과 통계 자료 보정을 위한 결측 데이터 보정 모형 제작
  4. 장진환 외 1인(2005), '교통량 결측 자료 대체기법 연구', 대한토목학회 정기학술대회
  5. 임성한 외 2인(2005), '요인분석을 활용한 일반국도 유형분류', 한국도로학회 논문집.
  6. 김동희 외 6인(2001), '통계학 -이론과 응용-', 자유아카데미
  7. 이덕기(1999), '예측모형의 이해', SPSS아카데미
  8. 정동빈 외 1인(2001), 'SPSS를 활용한 시계열자 료와 단순화분석', SPSS아카데미.
  9. 강근석 외 1인(1999), '회귀분석', 교우사.
  10. 박우창 외 4인(2003), '데이터마이닝 개념 및 기법', 자유아카데미
  11. 도철웅(1998), '교통공학원론', 청문각
  12. Statish C. Sharma Birj M, Gulati Samantha N. Rizak(2006), 'Statewide Traffic Volume studies and precision of AADT estimates', Journal of Transportation engineering Vol. 122 No. 6, pp.430-439 https://doi.org/10.1061/(ASCE)0733-947X(1996)122:6(430)
  13. Yiannis Kamarianakis, Poulicos Prastacos (2003), 'Forecasting Traffic Flow Conditions In an Urban Network : Comparison of Multivariate And Univariate Approaches', Transportation Research Record No. 1857 Transportation Network Modeling, pp.74-84
  14. Williams, B M, Durvasula, P K, Brown, D E (1997), 'Urban Freeway Traffic Flow Prediction : Application of Seasonal Autoregressive Integrated Moving Average and Exponential Smoothing models' Transportation Research Record No.1644 Traffic Flow Theory, pp.132-141
  15. Satish Sharma, Pawan Lingras, Ming Zhong(2001), 'Effect of Missing Value Imputation on Traffic Parameters Estimations from Permanent Traffic Counts', Transportation Research Board 80th Annual meeting, Washington, D.C