네트워크 기반의 강화학습 알고리즘과 시스템의 정보공유화를 통한 최단경로 검색과 갱신

Search of Optimal Path and Renewal via network based Reinforcement Learning Algorithm and sharing of System Imformation

  • 민성준 (고려대학교 제어계측공학과) ;
  • 장종수 (고려대학교 제어계측공학과) ;
  • 김홍윤 (고려대학교 제어계측공학과) ;
  • 허훈 (고려대학교 제어계측공학과)
  • Min, Seong-Joon (Dept. of Control & Instrument Engineering, Korea univ.) ;
  • Chang, Jong-Soo (Dept. of Control & Instrument Engineering, Korea univ.) ;
  • Kim, Hong-Yoon (Dept. of Control & Instrument Engineering, Korea univ.) ;
  • Heo, Hoon (Dept. of Control & Instrument Engineering, Korea univ.)
  • 발행 : 2005.07.18

초록

본 논문에서는 환경과 시스템의 상호작용을 통한 경험에 의해 습득된 정보를 개체간 네트워크를 통하여 갱신하는 과정을 구성하는 연구를 하였다. 기존의 연구에서는 강화학습 알고리즘을 이용하여 임의의 구역에 대한 지도 정보를 습득하고 이를 바탕으로 개체들 각각의 최적의 행동 정책을 구성하는 바 이 때 각각의 체개체가 가지고 있는 최단경로에 대한 정보의 우위를 결정하는 과정을 추가하였다. 이를 바탕으로 최종적으로 선택된 경로에 대한 정보를 업데이트하여 구성 된 네트워크를 통한 개체간 데이터를 동시에 공유하는 과정을 거쳐서 각각의 시스템이 스스로 정보를 갱신하는 방법을 제안하였다 또한 이 제안한 개념의 적합성을 입증하기 위하여 개체간의 정보를 통합하고 비교하는 실험을 수행하여 성공적인 결과를 얻었다.

키워드