한국정보처리학회:학술대회논문집 (Annual Conference of KIPS)
- 한국정보처리학회 2020년도 춘계학술발표대회
- /
- Pages.512-515
- /
- 2020
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
사전 지식에 의한 강화학습 에이전트의 학습 속도와 경향성 변화
How the Learning Speed and Tendency of Reinforcement Learning Agents Change with Prior Knowledge
- Kim, Jisoo (Dept. of Computer Science and Engineering, Korea University) ;
- Lee, Eun Hun (Dept. of Computer Science and Engineering, Korea University) ;
- Kim, Hyeoncheol (Dept. of Computer Science and Engineering, Korea University)
- 발행 : 2020.05.29
초록
학습 속도가 느린 강화학습을 범용적으로 활용할 수 있도록 연구가 활발하게 이루어지고 있다. 사전 지식을 제공해서 학습 속도를 높일 수 있지만, 잘못된 사전 지식을 제공했을 위험이 존재한다. 본 연구는 불확실하거나 잘못된 사전 지식이 학습에 어떤 영향을 미치는지 살펴본다. OpenAI Gym 라이브러리를 이용해서 만든 Gamble 환경, Cliff 환경, 그리고 Maze 환경에서 실험을 진행했다. 그 결과 사전 지식을 통해 에이전트의 행동에 경향성을 부여할 수 있다는 것을 확인했다. 또한, 경로탐색에 있어서 잘못된 사전 지식이 얼마나 학습을 방해하는지 알아보았다.