Data Preprocessing and ML Analysis Method for Abnormal Situation Detection during Approach using Domestic Aircraft Safety Data

국내 항공기 위치 데이터를 활용한 이착륙 접근 단계에서의 항공 위험상황 탐지를 위한 데이터 전처리 및 머신 러닝 분석 기법

  • 이상호 (주식회사 애나) ;
  • 손일락 (주식회사 애나, AI 연구센터) ;
  • 정규호 (주식회사 애나, AI 연구센터) ;
  • 박노삼 (한국전자통신연구원 지능형휴먼트윈연구센터)
  • Received : 2023.07.23
  • Accepted : 2023.09.09
  • Published : 2023.10.30

Abstract

In this paper, we utilize time-series aircraft location data measured based on 2019 domestic airports to analyze Go-Around and UOC_D situations during the approach phase of domestic airports. Various clustering-based machine learning techniques are applied to determine the most appropriate analysis method for domestic aviation data through experimentation. The ADS-B sensor is solely employed to measure aircraft positions. We designed a model using clustering algorithms such as K-Means, GMM, and DBSCAN to classify abnormal situations. Among them, the RF model showed the best performance overseas, but through experiments, it was confirmed that the GMM showed the highest classification performance for domestic aviation data by reflecting the aspects specialized in domestic terrain.

본 논문에서는 2019년 국내 공항을 기준으로 측정된 시계열 항공기 위치 데이터를 활용하여 국내 공항에 이착륙 시 접근 단계에서의 항공 위험상황 중 Go-Around 및 UOC_D 를 분석하고, 다양한 클러스터링 기반 머신 러닝 기법을 적용하여 국내 항공 데이터에서 가장 알맞은 분석 기법이 무엇인지를 실험을 통해 제시한다. 항공기 위치를 측정하기 위한 센서는 ADS-B를 단일로 사용하였으며, 클러스터링 기법들 중 K-Means, GMM, DBSCAN 등의 알고리즘을 사용하여 이상상황을 분류하기 위한 모델을 설계하였다. 그 중 해외에서는 RF 모델이 가장 나은 성능을 보였으나, 국내 항공 데이터에 대해서는 국내 지형에 특화된 부분을 반영한 GMM이 가장 높은 분류 성능을 보이는 것으로 실험을 통해 확인하였다.

Keywords

Acknowledgement

본 연구는 국토교통부 항공선진화사업의 일환으로, "빅데이터 기반 항공안전관리 기술개발 및 플랫폼 구축"사업의 4 단계(2023 년도) 연구를 통해 수행되었습니다.

References

  1. X. Zhao, Y. Rao, J. Cai, W. Ma, "Abnormal trajectory detection based on a sparse subgraph", IEEE Access, Vol. 8, 2020, pp. 29987-30000 https://doi.org/10.1109/ACCESS.2020.2972299
  2. Z. Shi, M. Xu, Q. Pan, B. Yan, and H. Zhang, "LSTM-based Flight Trajectory Prediction", 2018 International Joint Conference on Neural Networks, 2018, pp. 1-8
  3. L. Dai, Y, Liu, and M. Hansen. "Predicting Go-around Occurrence with Input-Output Hidden Markov Model." International Conference on Research in Air Transportation, 2020
  4. S.R. Proud, "Go-around detection using crowd-sourced ADS-B position data." Aerospace, Vol. 7, No. 2, 2020, pp. 16
  5. J.H.Cho, H.J.Baik, "A Study on the Characteristics of Low-Level Wind Shear at Jeju International Airport from Go-Around Flight Perspective", Journal of the Korean Society for Aviation and Aeronautics, Vol. 29, No.1, 2021, pp. 1-8 https://doi.org/10.12985/ksaa.2021.29.1.001
  6. J.Zhang, L.I.U.Wei, Z.H.U.Yanbo, "Study of ADS-B data evaluation.", Chinese Journal of Aeronautics, Vol. 24, No. 4, 2011, pp. 461-466 https://doi.org/10.1016/S1000-9361(11)60053-8
  7. M.Schafer, M.Strohmeier, V.Lenders, "Bringing up OpenSky: A large-scale ADS-B sensor network for research.", IPSN-14 Proceedings of the 13th International Symposium on Information Processing in Sensor Networks. IEEE, 2014, pp. 83-94
  8. Rigatti, Steven J. "Random forest.", Journal of Insurance Medicine, Vol. 47, No.1, 2017, pp. 31-39 https://doi.org/10.17849/insm-47-01-31-39.1
  9. W.S. Noble, "What is a support vector machine?", Nature biotechnology, Vol. 24, No. 12, 2006, pp. 1565-1567 https://doi.org/10.1038/nbt1206-1565
  10. H.H. Bock, "Clustering Methods: A History of k-Means Algorithms", Selected Contributions in data analysis and classification, 2007, pp. 161-172
  11. E. Alpayd, "Soft vector quantization and the EM Algorithm", neural Network, Vol. 11, Issue. 3, 1998, pp. 467-477 https://doi.org/10.1016/S0893-6080(97)00147-0
  12. M. Ester, H.P. Kriegel, J. Sander, and X. Xu, "A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise," in Proceeding of the ACM International Conference on Knowledge Discovery and Data Mining, 1996, pp. 226-231,