Optimal route generation method for ships using reinforcement learning

강화학습을 이용한 선박의 최적항로 생성기법

  • Min-Kyu Kim (Ocean Science and Technology School, Korea Maritime and Ocean University) ;
  • Jong-Hwa Kim (Ocean Science and Technology School, Korea Maritime and Ocean University) ;
  • Ik-Soon Choi (Division of Maritime AI & Cyber Security, Korea Maritime and Ocean University) ;
  • Hyeong-Tak Lee (Korea Ocean Satellite Center, Korea Institute of Ocean Science & Technology) ;
  • Hyun Yang (Division of Maritime AI & Cyber Security, Korea Maritime and Ocean University)
  • 김민규 (한국해양대학교 해양과학기술전문대학원 ) ;
  • 김종화 (한국해양대학교 해양과학기술전문대학원 ) ;
  • 조익순 (한국해양대학교 해사인공지능.보안학부) ;
  • 이형탁 (한국해양과학기술원 해양위성센터 ) ;
  • 양현 (한국해양대학교 해사인공지능.보안학부)
  • Published : 2022.06.02

Abstract

선박을 운항함에 있어 최적항로를 결정하는 것은 항해시간과 연료 소모를 줄이는 중요한 요인 중의 하나이다. 기존에는 항로를 결정하기 위해 항해사의 전문적인 지식이 요구되지만 이러한 방법은 최적의 항로라고 판단하기 어렵다. 따라서 연료비 절감과 선박의 안전을 고려한 최적의 항로를 생성할 필요가 있다. 연료 소모량 혹은 항해시간을 최소화하기 위해서 에이스타 알고리즘, Dijkstra 알고리즘을 적용한 연구가 있다. 하지만 이러한 연구들은 최단거리만 구할 뿐 선박의 안전, 해상상태 등을 고려하지 못한다. 이를 보완하기 위해 본 연구에서는 강화학습 알고리즘을 적용하고자한다. 강화학습 알고리즘은 앞으로 누적 될 보상을 최대화 하는 행동으로 정책을 찾는 방법으로, 본 연구에서는 강화학습 알고리즘의 하나인 Q-learning을 사용하여 선박의 안전을 고려한 최적의 항로를 생성하는 기법을 제안 하고자 한다.

Keywords

Acknowledgement

본 연구는 과학기술정보통신부의 재원으로 한국연구재단의 지원을 받아 수행된 연구(NRF-2021R1F1A1049246)이며, 또한 해양수산부 재원으로 해양수산과학기술진흥원의 지원을 받은 연구(다종위성 기반 해양 현안대응 실용화 기술 개발)임.