강화학습 기반 피난 알고리즘 개발과 성능평가에 관한 기초연구

A Basic Research on the Development and Performance Evaluation of Evacuation Algorithm Based on Reinforcement Learning

  • 황광일 (한국해양대학교 기계공학부) ;
  • 김별 (한국해양대학교 대학원)
  • Kwang-il Hwang (Div. of Mechanical Engineering, National Korea Maritime and Ocean University) ;
  • Byeol Kim (National Korea Maritime and Ocean University)
  • 발행 : 2023.05.02

초록

재난 상황에서 사람을 안전하게 피난시키는 것은 매우 중요하다. 인명 안전을 위한 다양한 피난 시뮬레이션 툴이 개발되어 사용되고 있지만, 대부분의 툴에 적용된 방식은 Map을 분석하여 최단 경로를 추출해 Agent를 결정된 경로를 따라 이동시키는 알고리즘으로 구현되었다. 이 방법은 재난 환경에 변화가 없는 조건에서 피난경로를 빠른 시간에 예측하기에 적합하다. 그러나 재난상황은 시시각각으로 변화하기 때문에 피난알고리즘은 이에 대응할 수 있어야 하지만 기존 알고리즘으로는 대응이 곤란한 실정이다. 강화학습을 기반으로 한 인공지능 기술을 활용하면 변화하는 재난에 대응 가능한 피난경로 알고리즘의 개발 가능할 것으로 예상된다. 이에 본 연구에서는 알고리즘 개발의 기초단계로서, 강화학습 기법으로 개발된 피난 알고리즘이 IMO MSC.1/Circ1533에서 요구하는 피난시뮬레이션 툴의 성능조건을 만족하는지 여부를 평가하였다.

The safe evacuation of people during disasters is of utmost importance. Various life safety evacuation simulation tools have been developed and implemented, with most relying on algorithms that analyze maps to extract the shortest path and guide agents along predetermined routes. While effective in predicting evacuation routes in stable disaster conditions and short timeframes, this approach falls short in dynamic situations where disaster scenarios constantly change. Existing algorithms struggle to respond to such scenarios, prompting the need for a more adaptive evacuation route algorithm that can respond to changing disasters. Artificial intelligence technology based on reinforcement learning holds the potential to develop such an algorithm. As a fundamental step in algorithm development, this study aims to evaluate whether an evacuation algorithm developed by reinforcement learning satisfies the performance conditions of the evacuation simulation tool required by IMO MSC.1/Circ1533.

키워드