• Title/Summary/Keyword: 학습제어

Search Result 1,238, Processing Time 0.033 seconds

Luxo character control using deep reinforcement learning (심층 강화 학습을 이용한 Luxo 캐릭터의 제어)

  • Lee, Jeongmin;Lee, Yoonsang
    • Journal of the Korea Computer Graphics Society
    • /
    • v.26 no.4
    • /
    • pp.1-8
    • /
    • 2020
  • Motion synthesis using physics-based controllers can generate a character animation that interacts naturally with the given environment and other characters. Recently, various methods using deep neural networks have improved the quality of motions generated by physics-based controllers. In this paper, we present a control policy learned by deep reinforcement learning (DRL) that enables Luxo, the mascot character of Pixar animation studio, to run towards a random goal location while imitating a reference motion and maintaining its balance. Instead of directly training our DRL network to make Luxo reach a goal location, we use a reference motion that is generated to keep Luxo animation's jumping style. The reference motion is generated by linearly interpolating predetermined poses, which are defined with Luxo character's each joint angle. By applying our method, we could confirm a better Luxo policy compared to the one without any reference motions.

A Study on the Steering Control of an Autonomous Robot Using SOM Algorithms (SOM을 이용한 자율주행로봇의 횡 방향 제어에 관한 연구)

  • 김영욱;김종철;이경복;한민홍
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.4 no.4
    • /
    • pp.58-65
    • /
    • 2003
  • This paper studies a steering control method using a neural network algorithm for an intelligent autonomous driving robot. Previous horizontal steering control methods were made by various possible situation on the road. However, it isn't possible to make out algorithms that consider all sudden variances on the road. In this paper, an intelligent steering control algorithm for an autonomous driving robot system is presented. The algorithm is based on Self Organizing Maps(SOM) and the feature points on the road are used as training datum. In a simulation test, it is available to handle a steering control using SOM for an autonomous steering control. The algorithm is evaluated on an autonomous driving robot. The algorithm is available to control a steering for an autonomous driving robot with better performance at the experiments.

  • PDF

A Study on the Design of Home Network Controlling System using Active Action Pattern Analysis Algorithm (능동적 행동 패턴 분석 알고리즘을 이용한 홈 네트워크 제어 시스템 구축에 관한 연구)

  • Sung, Kyung-Sang;Oh, Hae-Seok
    • KSCI Review
    • /
    • v.15 no.1
    • /
    • pp.125-129
    • /
    • 2007
  • 지능형 홈 네트워크 서비스의 일반적 보급화로 사용자의 필요와 욕구에 밀착한 개인화 서비스를 위한 사용자의 프로파일 및 다양한 상태 정보, 센서 및 기타 환경정보를 통한 동적 상황인지가 가능토록 하는 상황인지(context-aware) 서비스에 대한 필요성이 증대되고 있다. 사용자 행위 학습에 따른 지능적 자동 제어 시스템 구축에서 먼저 고려해야 할 사항은 사용자 행위 학습에 따른 지능적 자동 제어에 대한 기준을 마련하는 것이다. 홈 네트워크 내의 정보가전기기들 환경에 대한 정보를 지속적으로 수집하고 학습 알고리즘을 통하여 분석하며, 분석되어진 정보를 바탕으로 사용자의 성향을 파악하는 것을 주요인으로 간주해야 할 것이다. 이에 따라 본 논문에서는 사용자 능동적 행위에 따른 지능형 홈 제어 시스템을 제안하였다. 또한 지속적인 모니터링을 통하여 사용자의 성향이 파악되면 상황에 따른 최적의 환경을 제공할 수 있도록 홈 네트워크 제어 시스템을 구축하는 것으로 목적으로 하였다. 사용자의 행동 패턴을 분석하고 이를 기반으로 지능적인 서비스를 제공함으로써 사용자 중심의 능동적 서비스 효과들을 얻을 수 있을 것으로 기대한다.

  • PDF

Study on Vibration Suppression of 2-Mass Resonant System Using Iterative Learning Control (반복 학습 제어를 이용한 2관성 공진계의 진동 억제에 관한 연구)

  • 이학성
    • Proceedings of the IEEK Conference
    • /
    • 2003.07c
    • /
    • pp.2585-2588
    • /
    • 2003
  • 2 관성 공진계는 마른 응답을 위해 제어이득을 크게 하면 공진에 의해 축비틀림 진동이 일어나는 경우가 많다. 본 논문에서는 반복 학습 제어기법을 활용하여 불확실한 모델 계수를 포함하는 2 관성 공진계의 진동억제를 시도한다. 2관성 공진계의 경우 제어 대상이 되는 부하측 속도는 학습 제어로 직접 적용하기가 힘들고 또한 측정 또한 어렵다. 본 논문에서는 부하측 속도와 전동기측 속도간의 관계를 이용하여 직접 부하측 속도를 제어하는 대신 전동기측 속도를 제어하여 간접적으로 부하측 속도를 제어하였다. 제안된 방식은 전형적인 2 관성 공진계에 모의 실험을 통해 적용되었고, 정확한 모델이 없이도 진동 없는 마른 응답특성을 보여준다.

  • PDF

The Symmetry of Cart-Pole System and A Table Look-Up Control Technique (운반차-막대 시스템의 대칭성과 Table Look-Up 제어 기법)

  • Kwon, Sunggyu
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.3
    • /
    • pp.290-297
    • /
    • 2004
  • The control laws for cart-pole system are studied to see the schemes on which the control laws are made. Also, the odd symmetry of the relation between the output of the control laws and the system state vector is observed. Utilizing the symmetry in quantizing the system state variables and implementing the control laws into look-up table is discussed. Then, a CMAC is trained for a nonlinear control law for a cart-pole system such that the symmetry is conserved and its learning performance is evaluated. It is found that utilizing the symmetry is to reduce the memory requirement as well as the training period while improving the learning quality in terms of preserving the symmetry.

A Study on the Direct Neural Network Controller of Boiler Turbine (직접신경회로망 제어기를 사용한 보일러 터빈시스템의 제어에 관한 연구)

  • Woo, Joo-Hee;Kim, Jong-An
    • Proceedings of the KIEE Conference
    • /
    • 1997.07b
    • /
    • pp.654-656
    • /
    • 1997
  • 본 논문에서는 직접신경회로망제어기(DNNC)를 사용하여 결합된 PI제어기의 이득을 구하여 보일러 터빈시스템을 제어하고자 한다. 직접신경회로망제어기는 플랜트의 동특성을 학습시키는 에뮬레이터 없이 제어입력에 대한 플랜트의 동작방향에 대한 정보만을 사용하여 신경회로망을 학습시키고, 이 신경회로망을 사용하여 제어대상 플랜트인 다중입출력플랜트를 제어하기 위하여 결합된 PI 제어기의 이득을 구한다. 컴퓨터 시뮬레이션을 통하여 제안한 알고리즘의 타당성을 입증하고자 한다.

  • PDF

A study on the PID adaptive position controller using GMDP Neural Network (GMDP 신경망을 이용한 PID 적응 위치 제어기에 관한연구)

  • 추연규;임영도
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1995.10b
    • /
    • pp.258-263
    • /
    • 1995
  • 본 논문은 일반화된 다중 수상돌기 적 (GMDP : Generalized Multi Dendrite Product) 유닛트 신경망을 이용한 PID 적응 위치제어기를 구성하여 직류 서어보 전동기의 위치제어를 실시간 처리 하였다. 제안한 제어기를 위치제어에 적용시켜 실험한 결과 기존의 MLP 신경망 제어기를 이용한 것 보다도 샘플시간을 줄일 수 있다는 장점으로 정밀한 제어 가 가능하다는 것을 확인할 수 있었다. 학습규칙은 기존의 역전파 학습방법이 GMDP 신경 회로망에 적용되었다.

  • PDF

A Web-based Virtual Education System for Embedded System (임베디드시스템 활용 교육을 위한 가상교육 시스템)

  • Yang Won-Seok;Kim Hyun-Geu;Choi Kwan-Sun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.505-508
    • /
    • 2006
  • 본 연구에서는 실험 실습 가상교육 또는 원격 교육 콘텐츠가 학습 효과를 향상할 수 있는 효과적인 교육 수단으로 인정되고 있으나 원격에서 실험 실습을 하기위한 환경구성의 어려움을 극복을 위한 방안으로 웹 기반의 하드웨어 원격제어 기술을 이용하여, 임베디드 시스템 활용 교육을 위한 가상교육 시스템을 구현 하였다. 본 가상교육 시스템의 구성은 서버 시스템과 학습 시스템으로 되어 있다. 서버 시스템은 컴파일 서버, 원격 실습 서버, 웹 서버, Telnet 서버, 웹 카메라 서버 등으로 구성한다. 학습 시스템은 이론 강의, 가상 실습, 원격 실습의 세 부분으로 구성한다. 본 연구에서 구현한 시스템은 원격지에서의 프로세서 실습 환경을 제공하기 위해 웹에서 동작하는 Telnet 클라이언트를 제작하여 임베디드 하드웨어를 제어한다. 또한 이론학습 과정을 별도로 구성하고, 원격제어가 불가능한 개발환경 구축 과정은 가상 실습으로 학습하게 하였다. 이러한 점을 활용하여 임베디드 시스템의 효율적인 학습이 가능하다.

  • PDF

Design of Wavelet Neural Network Based Indirect Adaptive Controller Using EKF Training Method (확장 칼만 학습 알고리듬을 이용한 웨이블릿 신경 회로망 기반 간접 적응 제어기 설계)

  • Kim, Kyung-Ju;Oh, Joon-Seop;Choi, Yoon-Ho;Park, Jin-Bae
    • Proceedings of the KIEE Conference
    • /
    • 2004.11c
    • /
    • pp.361-363
    • /
    • 2004
  • 시간 및 주파수 특성 분석이 용이한 웨이블릿을 신경회로망에 적용시킨 웨이블릿 신경 회로망의 파라미터 학습 방법에는 오차 역전파 알고리듬 및 유선 알고리듬 등 여러 가지 방법이 있으나 이러한 학습 방법들은 수렴 시간이 오래 걸리는 단점을 가진다. 따라서 본 논문에서는 웨이블릿 신경 회로망의 최적 파라미터를 결정하기 위한 학습 방법으로 일반적으로 비선형 시스템 추정에 주로 사용되는 확장 칼만 필터 알고리듬을 적용한 신경회로망을 제안한다. 또한 제안된 학습 알고리듬을 이용한 웨이블릿 신경 회로망으로 간접 적응 제어기를 설계하여 연속 시간 혼돈 시스템인 Duffing 시스템의 제어에 적용함으로써 확장 칼만 필터 학습 알고리듬을 적용한 웨이블릿 신경 회로망 모델의 우수성을 보인다.

  • PDF

Performance Comparison of Crawling Robots Trained by Reinforcement Learning Methods (강화학습에 의해 학습된 기는 로봇의 성능 비교)

  • Park, Ju-Yeong;Jeong, Gyu-Baek;Mun, Yeong-Jun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.33-36
    • /
    • 2007
  • 최근에 인공지능 분야에서는, 국내외적으로 강화학습(reinforcement learning)에 관한 관심이 크게 증폭되고 있다. 강화학습의 최근 경향을 살펴보면, 크게 가치함수를 직접 활용하는 방법(value function-based methods), 제어 전략에 대한 탐색을 활용하는 방법(policy search methods), 그리고 액터-크리틱 방법(actor-critic methods)의 세가지 방향으로 발전하고 있음을 알 수 있다. 본 논문에서는 이중 세 번째 부류인 액터-크리틱 방법 중 NAC(natural actor-critic) 기법의 한 종류인 RLS-NAC(recursive least-squares based natural actor-critic) 알고리즘을 다양한 트레이스 감쇠계수를 사용하여 연속제어입력(real-valued control inputs)으로 제어되는 Kimura의 기는 로봇에 대해 적용해보고, 그 성능을 기존의 SGA(stochastic gradient ascent) 알고리즘을 이용하여 학습한 경우와 비교해보도록 한다.

  • PDF