Abstract
Purpose: This study proposes a method for developing a model that predicts the probability of traffic accidents in advance to prevent the most frequent traffic accidents in the military. Method: For this purpose, CRISP-DM (Cross Industry Standard Process for Data Mining) was applied in this study. The CRISP-DM process consists of 6 stages, and each stage is not unidirectional like the Waterfall Model, but improves the level of completeness through feedback between stages. Results: As a result of modeling the same data set as the previously constructed accident investigation data for the entire group, when the classification criterion was 0.5, Significant results were derived from the accuracy, specificity, sensitivity, and AUC of the model for predicting traffic accidents. Conclusion: In the process of designing the prediction model, it was confirmed that it was difficult to obtain a meaningful prediction value due to the lack of data. The methodology for designing a predictive model using the data set was proposed by reorganizing and expanding a data set capable of rational inference to solve the data shortage.
연구목적: 본 연구는 군에서 가장 많이 발생하는 교통사고의 예방을 위해 부대별로 교통사고가 발생할 확률을 사전에 예측하는 모형의 개발 방안을 제시하는 것이다. 연구방법: 이를 위해 CRISP-DM(Cross Industry Standard Process for Data Mining) 방법론을 적용하였다. CRISP-DM 프로세스는 6단계로 구성되어 있고, 각 단계는 Waterfall Model처럼 일방향으로 구성되어 있지 않고 단계 간 피드백을 통하여 단계별 완성도를 높이게 되어 있다. 연구결과:전체 집단을 대상으로 기 구축된 사고조사 데이터와 동일한 데이터 세트(data set)를 구축하여 모델링한 결과 분류기준 0.5로 했을 때, 교통사고예측을 위한 모형의 정확도, 특이도, 민감도, AUC에서 의미있는 결과치를 도출하였다. 결론: 예측모형을 설계하는 과정에서 데이터의 부족으로 인해 의미 있는 예측값을 얻기 어려운 문제점이 확인되었다. 이를 해결하기 위해 합리적 추론이 가능한 데이터 세트(data set)를 재구성 및 확대하여 데이터 부족을 해소하고, 이를 활용한 예측모형을 설계할 수 있는 방법론을 제시하였다.