DOI QR코드

DOI QR Code

객체 인식 모델과 지면 투영기법을 활용한 영상 내 다중 객체의 위치 보정 알고리즘 구현

Implementation of AI-based Object Recognition Model for Improving Driving Safety of Electric Mobility Aids

  • 박동석 ((주)경성테크놀러지) ;
  • 홍순기 ((주)경성테크놀러지) ;
  • 박준모 (연세대학교 디지털헬스케어학부)
  • 투고 : 2023.06.01
  • 심사 : 2023.06.29
  • 발행 : 2023.06.30

초록

본 연구에서는 전동 이동 보조기를 이용하는 교통약자의 이동을 저해하거나 불편을 초래하는 횡단 보도, 측구, 맨홀, 점자블록, 부분 경사로, 임시안전 방호벽, 계단, 경사형 연석과 같은 주행 장애물 객체를 촬영한 뒤 객체를 분류하고 이를 자동 인식하는 최적의 AI 모델을 개발하여 주행 중인 전동 이동 보조기 전방에 나타난 장애물을 효율적으로 판단할 수 있는 알고리즘을 구현하고자 한다. 객체 검출을 높은 확률로 AI 학습이 될 수 있도록 데이터 셋 구축 시 라벨링 형태를 폴리곤 형태로 라벨링 하며, 폴리곤 형태로 라벨링 된 객체를 탐지할 수 있는 Detectron2 프레임워크를 활용하여 Mask R-CNN 모델을 활용하여 개발을 진행하였다. 영상 획득은 일반인과 교통약자의 두 개 그룹으로 구분하여 진행하였고 테스트베드 2개 지역에서 얻어진 영상정보를 확보하였다. Mask R-CNN 학습 결과 파라미터 설정은 IMAGES_PER _BATCH : 2, BASE_LEARNING_RATE 0.001, MAX_ITERATION : 10,000으로 학습한 모델이 68.532로 가장 높은 성능을 보인 것이 확인되어 주행 위험, 장애 요소를 빠르고 정확하게 사용자가 인지할 수 있도록 하는 딥러닝 모델을 구축이 가능한 것을 확인할 수 있었다.

In this study, we photograph driving obstacle objects such as crosswalks, side spheres, manholes, braille blocks, partial ramps, temporary safety barriers, stairs, and inclined curb that hinder or cause inconvenience to the movement of the vulnerable using electric mobility aids. We develop an optimal AI model that classifies photographed objects and automatically recognizes them, and implement an algorithm that can efficiently determine obstacles in front of electric mobility aids. In order to enable object detection to be AI learning with high probability, the labeling form is labeled as a polygon form when building a dataset. It was developed using a Mask R-CNN model in Detectron2 framework that can detect objects labeled in the form of polygons. Image acquisition was conducted by dividing it into two groups: the general public and the transportation weak, and image information obtained in two areas of the test bed was secured. As for the parameter setting of the Mask R-CNN learning result, it was confirmed that the model learned with IMAGES_PER_BATCH: 2, BASE_LEARNING_RATE 0.001, MAX_ITERATION: 10,000 showed the highest performance at 68.532, so that the user can quickly and accurately recognize driving risks and obstacles.

키워드

참고문헌

  1. J. S. Chong, D. S. Kim, H. J. Lee,"A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github", Journal of intelligence and information systems, v.25 no.1, pp. 1-19, 2019. https://doi.org/10.13088/JIIS.2019.25.1.001
  2. J. S. Lee, S.K. Lee, D.W. Kim, S. J. Hong, S. I. Yang,"Trends on Object Detection Techniques Based on Deep Learning", Electronics and telecommunications trends v.33 no.4, pp.23-32, 2018. https://doi.org/10.22648/ETRI.2018.J.330403
  3. S. C. Yang, W. H. Lee, K. Y. Yu,"A Study on Road Extraction for Improving the Quality in Conflation between Aerial Image and Road Map", Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography v.29 no.6, pp.593-599, 2011. https://doi.org/10.7848/ksgpc.2011.29.6.593
  4. S. D. Park, B. S. Seong, "A study on the factors influencing the social adoption diffusion of innovative technology: Focuse on smart molility," Management & information systems review, vol. 36 no.2, pp. 239-260, 2017. https://doi.org/10.29214/damis.2017.36.2.013
  5. "A study on revision of the law to improve the right to move of mobility disadvantaged persons and their convenience of movement", Law Review (korlaw), vol.20, no.3, pp. 163-195, 2020.
  6. J. H. Park, K. W. Nam,"A Study on the Low-Floor Bus Route Selection Considering a Residential Distribution and Traffic Characteristics of the Transportation Vulnerable - A Case of Busan", Journal of the Korean Association of Geographic Information Studies v.18 no.2 , pp.161-173, 2015. https://doi.org/10.11108/kagis.2015.18.2.161
  7. M. H. Choi, J. S. Woo, S. G. Hong, J. M. Park. Nam,"Development of an abnormal road object recognition model based on deep learning", The Journal of Korea Institute of Convergence Signal Processing, v.22 no.4 , pp.149-155, 2021.
  8. Kaiming He, Georgia Gkioxari, Piotr Dollar, Ross Girshick, Facebook AI Research (FAIR), "Mask R-CNN", arXiv:1703.06870v3 [cs.CV] 24 Jan 2018