DQN Reinforcement Learning for Acrobot in OpenAI Gym Environment

OpenAI Gym 환경의 Acrobot에 대한 DQN 강화학습

  • Myung-Ju Kang (School of Game, Chungkang College of Cultural Industries)
  • 강명주 (청강문화산업대학교 게임콘텐츠스쿨)
  • Published : 2023.07.12

Abstract

본 논문에서는 OpenAI Gym 환경에서 제공하는 Acrobot-v1에 대해 DQN(Deep Q-Networks) 강화학습으로 학습시키고, 이 때 적용되는 활성화함수의 성능을 비교분석하였다. DQN 강화학습에 적용한 활성화함수는 ReLU, ReakyReLU, ELU, SELU 그리고 softplus 함수이다. 실험 결과 평균적으로 Leaky_ReLU 활성화함수를 적용했을 때의 보상 값이 높았고, 최대 보상 값은 SELU 활성화 함수를 적용할 때로 나타났다.

Keywords