DOI QR코드

DOI QR Code

Design of Rotary Inverted Pendulum System Using Distributed A3C Algorithm

분산 A3C를 활용한 회전식 도립 진자 시스템 설계

  • 권도형 (한국기술교육대학교 창의융합공학협동과정) ;
  • 임현교 (한국기술교육대학교 창의융합공학협동과정) ;
  • 김주봉 (한국기술교육대학교 컴퓨터공학과) ;
  • 한연희 (한국기술교육대학교 컴퓨터공학과)
  • Published : 2019.05.10

Abstract

제어 분야의 가장 기초적인 시스템인 Rotary Inverted Pendulum 을 제어하기 위하여, 본 논문에서는 강화학습에서 Deep Q-Network 과 함께 대표적인 알고리즘으로 알려진 Asynchronous Advantage Actor-Critic 을 활용하여 다중 디바이스 제어를 설계한다. Deep Q-Network 알고리즘을 활용한 기존 연구와 동일한 방식으로 실 세계의 물리 에이전트와 가상 환경을 맵핑시키며, 스위치를 통하여 로컬 에이전트와 글로벌 네트워크 간 통신을 구성한다. 본 논문에서는 분산 Asynchronous Advantage Actor-Critic 을 이용함으로써 실 세계의 다중 에이전트 제어를 위한 강화 학습의 활용 가능성을 조명한다.

Keywords