• 제목/요약/키워드: 딥강화학습

검색결과 2건 처리시간 0.017초

표정 피드백을 이용한 딥강화학습 기반 협력로봇 개발 (Deep Reinforcement Learning-Based Cooperative Robot Using Facial Feedback)

  • 전해인;강정훈;강보영
    • 로봇학회논문지
    • /
    • 제17권3호
    • /
    • pp.264-272
    • /
    • 2022
  • Human-robot cooperative tasks are increasingly required in our daily life with the development of robotics and artificial intelligence technology. Interactive reinforcement learning strategies suggest that robots learn task by receiving feedback from an experienced human trainer during a training process. However, most of the previous studies on Interactive reinforcement learning have required an extra feedback input device such as a mouse or keyboard in addition to robot itself, and the scenario where a robot can interactively learn a task with human have been also limited to virtual environment. To solve these limitations, this paper studies training strategies of robot that learn table balancing tasks interactively using deep reinforcement learning with human's facial expression feedback. In the proposed system, the robot learns a cooperative table balancing task using Deep Q-Network (DQN), which is a deep reinforcement learning technique, with human facial emotion expression feedback. As a result of the experiment, the proposed system achieved a high optimal policy convergence rate of up to 83.3% in training and successful assumption rate of up to 91.6% in testing, showing improved performance compared to the model without human facial expression feedback.

딥러닝 객체인식을 통한 경로보정 자율 주행 로봇의 구현 (Implementation of Autonomous Mobile Wheeled Robot for Path Correction through Deep Learning Object Recognition)

  • 이형일;김진명;이재원
    • 한국콘텐츠학회논문지
    • /
    • 제19권12호
    • /
    • pp.164-172
    • /
    • 2019
  • 본 논문에서는 실내 환경에서 시각정보를 기반으로 출발지점에서 경유지를 거쳐 목표지점으로 최적의 경로를 찾아 자율 주행하는 바퀴달린 로봇을 구현한다. 로봇은 출발지점에서 경유지를 거쳐 목표지점으로의 최적의 경로를 딥강화학습으로 얻을 수 있다. 그러나 로봇이 구해진 경로로 자율 주행을 할 때 표면의 굴곡과 이물질 등의 외부적 요인으로 목적지까지 정확하게 주행하지 못하는 경우가 발생한다. 이에 본 연구는 카메라만 장착한 로봇이 외부 요인으로 인해 최적의 경로를 이탈할 경우 이를 인지하도록 한다. 이 인지를 토대로 로봇이 스스로 경로를 보정하고 계획된 경유지와 최종 목적지점에 도달할 수 있게 하는 알고리즘을 제안한다. 본 연구를 위해 파이캠을 탑재한 라즈베리파이와 아두이노로 제어하는 바퀴식 자율 주행 로봇이 제작되었다. 로봇은 실내환경에서 OSX 환경의 서버와 실시간 연동하면서 계획된 최적의 경로로 시험주행을 완료하였다.