DOI QR코드

DOI QR Code

Design of Rotary Inverted Pendulum System Using Reinforcement Learning

강화학습을 이용한 회전식 도립진자 시스템 설계

  • 김주봉 (한국기술교육대학교 컴퓨터공학과) ;
  • 권도형 (한국기술교육대학교 컴퓨터공학과) ;
  • 홍용근 (한국전자통신연구원) ;
  • 김민석 (한국전자통신연구원) ;
  • 한연희 (한국기술교육대학교 컴퓨터공학과)
  • Published : 2018.10.31

Abstract

Rotary Inverted Pendulum 은 제어분야에서 비선형 제어 시스템을 설명하기 위해 자주 사용되어왔다. 본 논문은 강화학습 에이전트의 환경으로써 Rotary Inverted Pendulum 을 도입하였다. 이를 통해서 강화학습이 실제 세계에서의 복합적인 문제를 해결할 수 있음을 보인다. 강화학습 에이전트의 가상 환경과 실제 환경을 맵핑시키기 위해서 Ethernet 연결 위에 MQTT 프로토콜을 사용하였으며 이를 통해서 경량화된 IoT 분야에서의 강화학습의 활용도를 조명한다.

Keywords