Reinforcement Learning Algorithm using Domain Knowledge for MAV

초소형 비행체 운항방법에 대한 환경 지식을 이용한 강화학습 방법

  • Kim, Bong-Oh (School of Electrical Engineering and Computer Science, Hanyang University) ;
  • Kong, Sung-Hak (School of Electrical Engineering and Computer Science, Hanyang University) ;
  • Jang, Si-Young (School of Electrical Engineering and Computer Science, Hanyang University) ;
  • Suh, Il-Hong (School of Electrical Engineering and Computer Science, Hanyang University) ;
  • Oh, Sang-Rok (Korea Institute of Science and Technology)
  • 김봉오 (한양대학교 전자전기계측공학과) ;
  • 공성학 (한양대학교 전자전기계측공학과) ;
  • 장시영 (한양대학교 전자전기계측공학과) ;
  • 서일홍 (한양대학교 전자전기계측공학과) ;
  • 오상록 (한국과학기술연구원)
  • Published : 2002.07.10

Abstract

강화학습이란 에이전트가 알려지지 않은 미지의 환경에서 행위와 보답을 주고받으며, 임의의 상태에서 가장 적절한 행위를 학습하는 방법이다. 만약 강화학습 중에 에이전트가 과거 문제들을 해결하면서 학습한 환경에 대한 지식을 이용할 수 있는 능력이 있다면 새로운 문제를 빠르게 해결할 수 있다. 이런 문제를 풀기 위한 방법으로 에이전트가 과거에 학습한 여러 문제들에 대한 환경 지식(Domain Knowledge)을 Local state feature라는 기억공간에 학습한 후 행위함수론 학습할 때 지식을 활용하는 방법이 연구되었다. 그러나 기존의 연구들은 주로 2차원 공간에 대한 연구가 진행되어 왔다. 본 논문에서는 환경 지식을 이용한 강화학습 알고리즘을 3차원 공간에 대해서도 수행 할 수 있도록하는 개선된 알고리즘을 제안하였으며, 제안된 알고리즘의 유효성을 검증하기 위해 초소형 비행체의 항공운항 학습에 대해 모의실험을 수행하였다.

Keywords