DOI QR코드

DOI QR Code

Behavior Learning and Evolution of Individual Robot for Cooperative Behavior of Swarm Robot System

군집 로봇의 협조 행동을 위한 로봇 개체의 행동학습과 진화

  • 심귀보 (중앙대학교 전자전기공학부) ;
  • 이동욱 (한국생산기술연구원 로봇기술본부)
  • Published : 2006.04.01

Abstract

In swarm robot systems, each robot must behaves by itself according to the its states and environments, and if necessary, must cooperates with other robots in order to carry out a given task. Therefore it is essential that each robot has both learning and evolution ability to adapt the dynamic environments. In this paper, the new learning and evolution method based on reinforcement learning having delayed reward ability and distributed genetic algorithms is proposed for behavior learning and evolution of collective autonomous mobile robots. Reinforcement learning having delayed reward is still useful even though when there is no immediate reward. And by distributed genetic algorithm exchanging the chromosome acquired under different environments by communication each robot can improve its behavior ability. Specially, in order to improve the performance of evolution, selective crossover using the characteristic of reinforcement learning is adopted in this paper. we verify the effectiveness of the proposed method by applying it to cooperative search problem.

군집 로봇시스템에서 개개의 로봇은 스스로 주위의 환경과 자신의 상태를 스스로 판단하여 행동하고, 필요에 따라서는 다른 로봇과 협조를 통하여 어떤 주어진 일을 수행할 수 있어야 한다. 따라서 개개의 로봇은 동적으로 변화하는 환경에 잘 적응할 수 있는 학습과 진화능력을 갖는 것이 필수적이다. 이를 위하여 본 논문에서는 지연된 보상능력이 있는 강화학습과 분산유전알고리즘을 이용한 새로운 자율이동로봇의 행동학습 및 진화방법을 제안한다. 지연 보상능력이 있는 강화학습은 로봇이 취한 행동에 대하여 즉각적인 보상을 가할 수 없는 경우에도 학습이 가능한 방법이다. 또한 개개의 로봇이 통신을 통하여 염색체를 교환하는 분산유전알고리즘은 각기 다른 환경에서 학습한 우수한 염색체로부터 자신의 능력을 향상시킨다. 특히 본 논문에서는 진화의 성능을 향상시키기 위하여 강화학습의 특성을 이용한 선택 교배방법을 채택하였다. 제안된 방법은 협조탐색 문제에 적용하여 컴퓨터 시뮬레이션을 통하여 그 유효성을 검증한다.

Keywords

References

  1. 이동욱, 심귀보, '자율이동로봇군의 협조행동을 위한 통신시스템의 개발,' 대한전자공학회 논문지, 제34권, S편, 제3호, pp. 33-45, 1997. 3
  2. 이동욱 심귀보, '강화학습과 분산유전알고리즘을 이용한 자율이동로봇군의 행동학습 및 진화,' 대한전자공학회 논문지, 제34권, S편, 제8호, pp. 56-64, 1997. 8
  3. 이동욱, 심귀보, '인공면역계 기반의 자율이동로봇군의 협조행동전략 결정,' 대한전자공학회 논문지, 제 35권 S편 제3호, pp. 102-109, 1998. 3
  4. H.B. Jun, K.B. Sim, 'Emergence of Cooperative Behavior based on Learning and Evolution in Collective Autonomous Mobile Robots,' Journal of Electrical Engineering and Information Science, vol. 3, 1998
  5. 심귀보, 이동욱, 선상준, '인공면역계 기반 자율분산 로봇 시스템의 협조 전략과 군행동', 제어자동화시스템 공학회 논문지, 제6권, 제12호, pp. 1079-1085, 2000. 12
  6. I. Roitt, J. Brostoff, D. Male, Immunology, 4th edition, Mosby, 1996
  7. R.A. Wallace, G.P. Sanders, R. J. Ferl, BIOLOGY: The Science of Life, 3rd eds., HarperCollins Publishers Inc., 1991
  8. N.K. Jerne, 'Idiotopic Network and Other Preconceived Ideas,' Immunological Rev., vol. 79, pp. 5-24, 1984 https://doi.org/10.1111/j.1600-065X.1984.tb00484.x
  9. Y. Ishida, N. Adachi, 'An Immune Algorithm for Multiagent : Application to Adaptive Noise Neutralization,' Proc. of IROS 96, pp. 1739-1746, 1996 https://doi.org/10.1109/IROS.1996.569045
  10. S. Forrest, B Javornik, R.E. Smith, A.S. Perelson, 'Using Genetic Algorithms to Explore Pattern Recognition in the Immune System,' Evolutionary Computation, vol. 1, no. 3, pp. 191-211, 1993 https://doi.org/10.1162/evco.1993.1.3.191
  11. A. Ishiguro, Y. Watanabe, Y. Uchikawa, 'An Immunological Approach to Dynamic Behavior Control for Autonomous Mobile Robots,' Proc, of IROS 95, pp. 495-500, 1995 https://doi.org/10.1109/IROS.1995.525842
  12. A. Ishiguro, Y. Shirai, T. Kendo, Y. Uchikawa, 'Immunoid : An Architecture for Behavior Arbitration Based on the Immune Networks,' Proc. of IROS 96, pp. 1730-1738, 1996 https://doi.org/10.1109/IROS.1996.569044
  13. H. Bersini, F.J, Varela, 'The Immune Recruitment Mechanism: A Selective Evolutionary Strategy,' Proc, of 4th Int. Conf. on Genetic Algorithms, pp. 520-526, 1991
  14. N. Mitsumoto et al., 'Micro Autonomous Robotic System and Biologically Inspired Immune Swarm Strategy as a Multi-Agent Robotic System,' Proc. of Int. Conf. on Robotics and Automation, pp. 2187-2192, 1995 https://doi.org/10.1109/ROBOT.1995.525584
  15. P. D'haeseleer, S. Forrest, P. Helman, 'An Immunological Approach to Change Detection : Algorithms, Analysis and Implications,' Proc. of IEEE Symp. on Security and Privacy, 1996 https://doi.org/10.1109/SECPRI.1996.502674
  16. J.D. Farmer, N.H. Packard, and A.S. Perelson, 'The Immune System, Adaptation, and Machine Learning,' Physica 22-D, pp. 184-204, 1986 https://doi.org/10.1016/0167-2789(86)90240-X

Cited by

  1. An Advanced Path Planning of Clustered Multiple Robots Based on Flexible Formation vol.29, pp.12, 2012, https://doi.org/10.7736/KSPE.2012.29.12.1321
  2. Evolution of Behavioral Logic of Artificial Individuals Using Cell-level Evolution Framework vol.25, pp.1, 2015, https://doi.org/10.5391/JKIIS.2015.25.1.022