Search | Korea Science

Multi-agent Coordination Strategy Using Reinforcement Learning (강화 학습을 이용한 다중 에이전트 조정 전략)

Kim, Su-Hyun;Kim, Byung-Cheon;Yoon, Byung-Joo
- Proceedings of the Korea Information Processing Society Conference
- /
- 2000.10a
- /
- pp.285-288
- /
- 2000
본 논문에서는 다중 에이전트(multi-agent) 환경에서 에이전트들의 행동을 효율적으로 조정 (coordination)하기 위해 강화 학습(reinforcement learning)을 이용하였다. 제안된 방법은 각 에이전트가 목표(goal)와의 거리 관계(distance relationship)와 인접 에이전트들과의 공간 관계(spatial relationship)를 이용하였다. 그러므로 각 에이전트는 다른 에이전트와 충돌(collision) 현상이 발생하지 않으면서, 최적의 다음 상태를 선택할 수 있다. 또한, 상태 공간으로부터 입력되는 강화 값이 0과 1 사이의 값을 갖기 때문에 각 에이전트가 선택한 (상태, 행동) 쌍이 얼마나 좋은가를 나타낼 수 있다. 제안된 방법을 먹이 포획 문제(prey pursuit problem)에 적용한 결과 지역 제어(local control)나. 분산 제어(distributed control) 전략을 이용한 방법보다 여러 에이전트들의 행동을 효율적으로 조정할 수 있었으며, 매우 빠르게 먹이를 포획할 수 있음을 알 수 있었다.
PDF

거울 뉴런 시스템의 모방적 동기화 및 학습 기능 기반 HRI 응용 기술 개발

Go, Gwang-Eun;Sim, Gwi-Bo
- ICROS
- /
- v.20 no.2
- /
- pp.31-38
- /
- 2014
인간의 행동을 통해 내재된 의도를 인식하고 그 의도에 대응하는 서비스를 제공할 수 있는 능력을 로봇에게 부여하기 위한 연구의 일환으로 모방적 동기화 및 학습에 의한 인간-로봇 상호작용(Human-Robot Interaction, HRI) 시스템의 개발이 주목받고 있다. 하지만 인간이 관찰과 모방을 통해 목적을 가진 행동을 학습하는 과정은 감각 정보를 대응하는 운동 정보로 연계하고 모방 주체와 모방 대상 간의 물리적 상태의 차이를 보정하고 관측된 행동에 내재된 의도 또는 목표를 이해하는 복잡한 메커니즘 단계의 연속이기 때문에 이를 수행하기 위한 기술개발이 필요하다. 본고에서는 실제 인간이 수행하는 모방적 동기화 및 학습에 관여하는 것으로 추정되는 거울뉴런 시스템에 대하여 소개하고 이를 HRI 시스템에 활용하기 위해 개발된 선행 기술 동향을 논하고자 한다. 또한, 본 연구실에서 관련하여 진행해온 관련 연구를 통해 현재 거울 뉴런 시스템의 발전 정도와 향후 활용 방안 및 가능성을 고찰해보도록 한다.
PDF KSCI

VR-simulated Sailor Training Platform for Emergency (긴급상황에 대한 가상현실 선원 훈련 플랫폼)

Park, Chur-Woong;Jung, Jinki;Yang, Hyun-Seung
- Proceedings of the Korean Institute of Navigation and Port Research Conference
- /
- 2015.10a
- /
- pp.175-178
- /
- 2015
This paper presents a VR-simulated sailor training platform for emergency in order to prevent a human error that causes 60~80% of domestic/ abroad marine accidents. Through virtual reality technology, the proposed platform provides an interaction method for proficiency of procedures in emergency, and a crowd control method for controlling crowd agents in a virtual ship environment. The interaction method uses speech recognition and gesture recognition to enhance the immersiveness and efficiency of the training. The crowd control method provides natural simulations of crowd agents by applying a behavior model that reflects the social behavior model of human. To examine the efficiency of the proposed platform, a prototype whose virtual training scenario describes the outbreak of fire in a ship was implemented as a standalone system.
PDF

A method of human error management in chemical process industries (화학공정산업의 인적오류 제어 방법)

Jo Young-Do;Park Kyo-Shik;Park Heui-Joon
- Journal of the Korean Institute of Gas
- /
- v.7 no.2 s.19
- /
- pp.42-47
- /
- 2003
To prevent major accident from toxic gas release, explosion, or fire in chemical processes, it needs dynamic control of human error with mechanical failure. Although most of major accidents occur with a coupling of human error and mechanical failure, numbers of researches have studied human error and mechanical reliability independently, but no where cross each other, to reduce the risk in the process. This work focuses on the coincidence of human error and mechanical failure for management of human error, and on some important performance shaping factors to propose a method for improving safety effectively of the process industries.
PDF

Safe Driving Evaluation System based on Drivers' Behaviors (운전 행동정보 기반 안전운전 평가시스템)

Yoon, Daesub;Hwang, Yoonsook;Kim, Hyunsuk;Kim, Kyungho
- Proceedings of the Korea Information Processing Society Conference
- /
- 2010.04a
- /
- pp.1115-1117
- /
- 2010
안전운전 지원 시스템 개발을 위해서 고려되어야 할 요소는 차량정보, 운전자정보, 외부 환경정보가 있다. 기존의 안전운전 지원 시스템 개발은 주로 차량의 종방향 제어, 횡방향 제어, 조향각 제어 등 차량으로부터 직접 추출한 주행정보를 이용하여 운전자의 안전유무를 평가하였다. 그러나 최근의 조사결과에 따르면 교통사고의 90%이상이 운전자 실수에 의해서 발생한다는 것을 알 수 있다. 이와 관련하여 차량의 주행 정보뿐만 아니라 실제 운전자가 주행 중에 행하게 되는 행동정보기반의 안전운전지원시스템 개발이 활발히 연구되어 지고 있다. 본 논문에서는 운전자의 행동정보를 이용한 안전운전 평가시스템의 설계 개념과 안전운전 평가시스템의 핵심 요소인 표준모델 구축 방법에 대해서 논의하고자 한다.
https://doi.org/10.3745/PKIPS.y2010m04a.1115 인용 PDF

Behavior Strategies of Robot Soccer Agent by Reinforcement Learning (강화 학습에 의한 로봇축구 에이전트 행동 전략)

Choe, So-Ra;Lee, Seung-Gwan;Lee, Young-Ah;Chung, Tae-Choong
- Proceedings of the Korea Information Processing Society Conference
- /
- 2005.11a
- /
- pp.465-468
- /
- 2005
강화 학습이란 개체가 동적인 환경에서 시행착오를 통해 자신의 최적 행동을 찾아내는 기법이다. 특히 Q-learning과 같은 비(非)모델 기반의 강화학습은 사전에 환경에 대한 모델을 필요로 하지 않으며, 다양한 상태와 행동들을 충분히 경험한다면 최적의 행동 전략에 도달할 수 있으므로 여러 분야에 적용되고 있다. 본 논문에서는 로봇의 행동을 효율적으로 제어하기 위하여 Q-learning을 이용하였다. 로봇 축구 시스템은 공과 여러 대의 로봇이 시시각각 움직이는 시변 환경이므로 모델링이 상당히 복잡하다. 공을 골대 가까이 보내는 것이 로봇 축구의 목표지만 때로는 공을 무조건 골대 방향으로 보내는 것보다 더 효율적인 전략이 있을 수도 있다. 어떤 상황에서 어떤 행동을 하여야 장기적으로 보았을 때 더 우수한지 학습을 통해 로봇 스스로가 판단해가도록 시스템을 구현하고, 학습된 결과를 분석한다.
PDF

Strategy of Reinforcement Learning in Artificial Life (인공생명의 연구에 있어서 강화학습의 전략)

심귀보;박창현
- Proceedings of the Korean Institute of Intelligent Systems Conference
- /
- 2001.05a
- /
- pp.257-260
- /
- 2001
일반적으로 기계학습은 교사신호의 유무에 따라 교사학습과 비교사학습, 그리고 간접교사에 의한 강화학습으로 분류할 수 있다. 강화학습이란 용어는 원래 실험 심리학에서 동물의 학습방법 연구에서 비롯되었으나, 최근에는 공학 특히 인공생명분야에서 뉴럴 네트워크의 학습 알고리즘으로 많은 관심을 끌고 있다. 강화학습은 제어기 또는 에이전트의 행동에 대한 보상을 최대화하는 상태-행동 규칙이나 행동발생 전략을 찾아내는 것이다. 본 논문에서는 최근 많이 연구되고 있는 강화학습의 방법과 연구동향을 소개하고, 특히 인공생명 연구에 있어서 강하학습의 중요성을 역설한다.
PDF

이동 로봇의 군집 제어 리뷰

Park, Bong-Seok;Kim, Hong-Geun
- ICROS
- /
- v.19 no.2
- /
- pp.34-38
- /
- 2013
자연계에서 빈번히 목격되는 군집 현상과 그 효용성의 고찰에 기인하여, 최근 다중 이동 로봇의 협업에 대한 연구가 활발히 수행되고 있다. 그 중, 본 논문에서는 다중 이동 로봇의 군집 제어 방법론들을 설명하고, 그와 관련된 최신 결과들도 소개한다. 특히 군집 제어 문제를 해결하기 위한 대표적인 방식인 행동 기반 접근법, 가상 구조 접근법, 선도-추종 접근법, 그래프 이론 기반 접근법 위주로 소개한다.
PDF KSCI

A Plan-Based Control Structure for Autonomous Robots (자율로봇을 위한 계획기반의 제어 구조)

Kim Ha-Bin;Kim In-Chul
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.06b
- /
- pp.142-144
- /
- 2006
본 논문에서는 주문형 작업계획 생성기와 실행기의 연동을 통해 Sony사에서 개발된 AIBO로봇의 행동을 제어하는 계획기반의 제어구조를 개발하였다. 그리고 이 제어구조의 효과를 알아보기 위해, 미로 속에서 경로를 계획하고 이동하는 작업에 이 제어 구조를 적용하고 실험하였다.
PDF

Path Following Behavior of Crowd (군중의 경로 추적 행동)

Yi, Ji-hyeon
- Proceedings of the Korea Contents Association Conference
- /
- 2008.05a
- /
- pp.10-14
- /
- 2008
Computer-animated crowd scenes are often observed in computer games and feature films. The common way to model locomotion of large human crowds is to employ agent based methods where the behavior of each person is independently modeled. But for large crowds, it is difficult for a user to control all the individuals using individual behavior model. Instead, crowd behaviors can be controlled more intuitively at the group level than at the individual level. In this paper, we present the group force field model to simulate path following behavior for groups. A group is a set of characters who have the same goals, i.e. the same path to follow. We also define three characteristics of grouping behavior: alignment, cohesion, and distribution. Our group force field model preserves these characteristics while avoiding collisions. By using our model, user can generate desired group behaviors from line-up behavior to lumped one.
PDF

Search Result 385, Processing Time 0.026 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)