Abstract
This study evaluates potential sources of errors in k-NN(k-nearest neighbor) algorithm such as procedures, variables, and input data. Previous research has been thoroughly reviewed for understanding fundamentals of k-NN algorithm that has been widely used for short-term traffic states prediction. The framework of this algorithm commonly includes historical data smoothing, pattern database, similarity measure, k-value, and prediction horizon. The outcomes of this study suggests that: i) historical data smoothing is recommended to reduce random noise of measured traffic data; ii) the historical database should contain traffic state information on both normal and event conditions; and iii) trial and error method can improve the prediction accuracy by better searching for the optimum input time series and k-value. The study results also demonstrates that predicted error increases with the duration of prediction horizon and rapidly changing traffic states.
본 연구는 실시간 자료를 기반으로 k-NN을 활용한 단기 교통상황 예측 시 각 단계별 세부절차 및 변수결정, 입력자료 구축 등의 각 단계별 잠재적 예측오차에 대한 원인분석 및 시사점 도출을 목적으로 한다. 다양한 단기 예측모형에 대한 선행연구 검토를 통하여 k-NN 모형의 유용성을 검토하였고 이에 대한 적용가능성을 분석하였다. 본 연구의 k-NN 모형은 이력자료 평활화 및 패턴DB 구축의 입력자료 부분, 실시간 자료와 과거 이력자료와의 유사성 측정 및 k 근접이웃 결정 등의 k-NN 알고리즘 부분, 그리고 예측 시간간격에 따른 출력결과 부분 등으로 구성되며 올림픽대로 김포방향 한강대교 남단~여의상류IC 구간을 대상으로 분석을 실시하였다. 교통자료의 불규칙 잡음으로 인하여 정확한 패턴매칭을 위해서 이력자료의 평활화를 실시하였으며, 이력자료 패턴 DB는 일반 및 이벤트 상황으로 구분하여 활용하였다. 최적의 시계열 자료 및 k 근접이웃 결정을 위해서 시행착오 방법을 적용하였으며, 단기 교통상황 예측 시 예측 시간간격이 증가할수록 예측오차가 증가하는 패턴, 그리고 교통상태가 급변하는 시점에서도 예측오차가 증가함을 알 수 있었다. 본 연구의 k-NN 모형에 대한 각 단계별 예측오차에 대한 원인을 분석하여 개선방향을 제시함으로써 향후 신뢰성 있는 단기 교통상황예측 정보제공 및 시스템에 활용이 가능할 것으로 판단된다.