Performance Comparison of Crawling Robots Trained by Reinforcement Learning Methods

Park, Ju-Yeong;Jeong, Gyu-Baek;Mun, Yeong-Jun;

한국지능시스템학회:학술대회논문집 (Proceedings of the Korean Institute of Intelligent Systems Conference)

한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
/
Pages.33-36
/
2007

한국지능시스템학회 (Korean Institute of Intelligent Systems)

강화학습에 의해 학습된 기는 로봇의 성능 비교

Performance Comparison of Crawling Robots Trained by Reinforcement Learning Methods

박주영 (고려대 제어계측공학과) ;
정규백 (고려대 제어계측공학과) ;
문영준 (고려대 제어계측공학과)

발행 : 2007.04.20

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근에 인공지능 분야에서는, 국내외적으로 강화학습(reinforcement learning)에 관한 관심이 크게 증폭되고 있다. 강화학습의 최근 경향을 살펴보면, 크게 가치함수를 직접 활용하는 방법(value function-based methods), 제어 전략에 대한 탐색을 활용하는 방법(policy search methods), 그리고 액터-크리틱 방법(actor-critic methods)의 세가지 방향으로 발전하고 있음을 알 수 있다. 본 논문에서는 이중 세 번째 부류인 액터-크리틱 방법 중 NAC(natural actor-critic) 기법의 한 종류인 RLS-NAC(recursive least-squares based natural actor-critic) 알고리즘을 다양한 트레이스 감쇠계수를 사용하여 연속제어입력(real-valued control inputs)으로 제어되는 Kimura의 기는 로봇에 대해 적용해보고, 그 성능을 기존의 SGA(stochastic gradient ascent) 알고리즘을 이용하여 학습한 경우와 비교해보도록 한다.

키워드

RLS;
NAC;
SGA;

한국지능시스템학회:학술대회논문집 (Proceedings of the Korean Institute of Intelligent Systems Conference)

강화학습에 의해 학습된 기는 로봇의 성능 비교

Performance Comparison of Crawling Robots Trained by Reinforcement Learning Methods

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)