• 제목/요약/키워드: 반복 학습 제어

검색결과 135건 처리시간 0.022초

일정 학습계수와 이진 강화함수를 가진 SOFM 신경회로망의 디지털 하드웨어 구현에 관한 연구 (A Study on the Digital Hardware Implementation of Self-Organizing feature Map Neural Network with Constant Adaptation Gain and Binary Reinforcement Function)

  • 조성원;석진욱;홍성룡
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 추계학술대회 학술발표 논문집
    • /
    • pp.402-408
    • /
    • 1997
  • 일정 학습계수와 이진 강화함수를 지닌 자기조직화 형상지도(Self-Organizing Feature Map)신경회로망을 FPGA위에 하드웨어로 구현하였다. 원래의 SOFM 알고리즘에서 학습계수가 시간 종속형인데 반하여, 본 논문에서 하드웨어로 구현한 알고리즘에서는 학습계수가 일정인 값으로 고정되며 이로 인한 성능저하를 보상하기 위하여 이진 강화함수를 부가하였다. 제안한 알고리즘은 복잡한 곱셈 연산을 필요로 하지 않으므로 하드웨어 구현시 보다 쉽게 구현 가능한 특징이 있다. 1개의 덧셈/뺄셈기와 2개의 덧셈기로 구성된 단위 뉴런은 형대가 단순하면서 반복적이므로 하나의 FPGA위에서도 다수의 뉴런을 구현 할 수 있으며 비교적 소수의 제어 신호로서 이들을 모두 제어 가능할 수 있도록 설계하였다. 실험결과 각 구성부분은 모두 이상 없이 올바로 동작하였으며 각 부분이 모두 종합된 전체 시스템도 이상 없이 동작함을 알 수 있었다.

  • PDF

이산시간 비선형 시스템에 대한 반복학습제어 (Iterative learning control for a class of discrete-time nonlinear systems)

  • 안현식;최종호;김도현
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1993년도 한국자동제어학술회의논문집(국내학술편); Seoul National University, Seoul; 20-22 Oct. 1993
    • /
    • pp.836-841
    • /
    • 1993
  • For a class of discrete-time nonlinear systems, an iterative learning control method is proposed and a sufficient condition is derived for the convergence of the output error. The proposed method is shown to be less sensitive to modelling errors and the uniform boundedness of the output error is guaranteed even in the presence of initial state errors. It is illustrated by simulations that the actual output converges to a desired output within the tolerance bound and convergence performance is improved by the presented method.

  • PDF

초기 오차와 시간 지연을 고려한 선형 플랜트에 대한 강인한 반복 학습 제어기의 설계 (Design of robust iterative learning controller for linear plant with initial error and time-delay)

  • 박광현;변증남;황동환
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1996년도 한국자동제어학술회의논문집(국내학술편); 포항공과대학교, 포항; 24-26 Oct. 1996
    • /
    • pp.335-338
    • /
    • 1996
  • In this paper, we are going to design an iterative learning controller with the robust properties for initial error. For this purpose, the PID-type learning law will be considered and the design guide-line will be presented for the selection of the learning gain. Also, we are going to suggest a condition for the convergence of control input for a plant with input delay. Several simulation results are presented, which shows the effectiveness of the proposed algorithms.

  • PDF

반복학습을 이용한 회분식 반응기의 제어 (Control of a batch reactor using iterative learning)

  • 조문기;방성호;조진원;이광순
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1991년도 한국자동제어학술회의논문집(국내학술편); KOEX, Seoul; 22-24 Oct. 1991
    • /
    • pp.81-86
    • /
    • 1991
  • The iterative learning operation has been utilized in the temperature Control of a batch reactor. A generic form of feedback-assisted first-order learning control scheme was constructed and then various design and operation modes were derived through convergence and robustness analysis in the frequency domain. The proposed learning control scheme was then implemented on a bench scale batch reactor with the heat of reaction simulated by an electric heater. The results show a great improvement in the performance of control as the number of batch operations progressed.

  • PDF

RLS 기반 Actor-Critic 학습을 이용한 로봇이동 (Robot Locomotion via RLS-based Actor-Critic Learning)

  • 김종호;강대성;박주영
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.234-237
    • /
    • 2005
  • 강화학습을 위한 많은 방법 중 정책 반복을 이용한 actor-critic 학습 방법이 많은 적용 사례를 통해서 그 가능성을 인정받고 있다. Actor-critic 학습 방법은 제어입력 선택 전략을 위한 actor 학습과 가치 함수 근사를 위한 critic 학습이 필요하다. 본 논문은 critic의 학습을 위해 빠른 수렴성을 보장하는 RLS(recursive least square)를 사용하고, actor의 학습을 위해 정책의 기울기(policy gradient)를 이용하는 새로운 알고리즘을 제안하였다. 그리고 이를 실험적으로 확인하여 제안한 논문의 성능을 확인해 보았다.

  • PDF

한국어 학습을 위한 마르코프 체인 기반 한국어 문장 생성 (Korean Text Generation using Markov Chain for Korean Language Learning)

  • 문경득;김정원;김소희;김병만;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.623-626
    • /
    • 2018
  • 한국어 학습에 대한 관심이 전 세계적으로 높아짐에 따라 한국어 학습을 위한 다양한 프로그램들이 등장하고 있다. 한국어가 모국어가 아닌 외국인들의 한국어 학습을 위해서는 단어 학습이 기초가 되어야 하며, 단어 학습에서는 다양한 예문들이 필수적이다. 기존의 학습 시스템에서는 말뭉치에 있는 문장들을 예문으로 제시하는 기능을 제공하지만, 이 경우 한정적이고 반복된 문장만을 제공하는 문제를 가진다. 본 논문에서는 사용자가 학습하고자 하는 단어를 입력하면 해당 단어 단어를 포함하는 한국어 문장을 자동 생성하여 제공하는 시스템을 제안한다. 시스템에서는 언어 모델의 제어가 비교적 쉬운 마르코프체인을 활용한다.

  • PDF

신경회로망을 이용한 유도전동기의 속도 센서리스 방식에 대한 비교 (Comparison of Different Schemes for Speed Sensorless Control of Induction Motor Drives by Neural Network)

  • 국윤상;김윤호;최원범
    • 전력전자학회논문지
    • /
    • 제5권2호
    • /
    • pp.131-139
    • /
    • 2000
  • 일반적으로 시스템 인식과 제어에 이용하는 다층 신경회로망은 기존의 역전파 알고리즘을 이용한다. 그러나 결선강도에 대한 오차의 기울기를 구하는 방법이기 때문에 국부적 최소점에 빠지기 쉽고, 수렴속도가 매우 늦으며 초기 결선강도 값들이나 학습계수에 민감하게 반응한다. 이와 같은 단점을 개선하기 위하여 확장된 칼만 필터링 기법을 역전파 알고리즘에 결합하였으나 계산상의 복잡성 때문에 망의 크기가 증가하면 실제 적용할 수 없다. 최근 신경회로망을 선형과 비선형 구간으로 구분하고 칼만 필터링 기법을 도입하여 수렴속도를 빠르게 하고 초기 결선강도 값에 크게 영향을 받지 않도록 개선하였으나, 여전히 은닉층의 선형 오차값을 역전파 알고리즘에 의해서 계산하기 때문에 학습계수에 민감하다는 단점이 있다. 본 논문에서는 위에서 언급한 기존의 신경회로망 알고리즘의 문제점을 개선하기 위하여 은닉층의 목표값을 최적기법에 의하여 직접계산하고 각각의 결선강도 값은 반복최소 자승법으로 온라인 학습하는 알고리즘을 제안하고 이들 신경회로망 알고리즘과 비교하고자 한다. 여러 가지 시뮬레이션과 실험을 통하여 제안된 방법이 초기 결선강도에 크게 영향을 받지 않으며, 기존의 학습계수 선정에 따른 문제점을 해결함으로써 신경회로망 모델에 기초한 실시간 제어기 설계에 응용할 수 있도록 하였다. 또한, 유도전동기의 속도추정과 제어에 적용하여 좋은 결과를 보였다.

  • PDF

비선형 구동기의 변수추정을 통한 학습입력성형제어기 (Learning Input Shaping Control with Parameter Estimation for Nonlinear Actuators)

  • 김득현;성윤경;장완식
    • 대한기계학회논문집A
    • /
    • 제35권11호
    • /
    • pp.1423-1428
    • /
    • 2011
  • 본 논문은 비선형 구동기를 포함한 유연시스템의 잔류변위저감을 위한 학습입력성형제어기를 제시한다. 제시되는 제어기는 비선형 구동기에 대한 입력성형제어기, 반복최소자승법 및 설계변수 updating rule 을 통합하여 개발된다. 비선형 구동기에 대응한 입력성형제어기 설계변수의 updating mechanism 을 개선하기 위한 잔류변위 측정함수가 제시된다. 제시된 제어방법을 pendulum system 에 적용하여 변수추정의 수렴성과 변위저감제어성능의 평가를 통해 수치해석적으로 실용성이 검증된다.

자율 이동이 가능한 LM신경망 로봇 제어기 (LM Neural network robot controller for self-navigation)

  • 유성구;정길도;김영철
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.255-256
    • /
    • 2008
  • 미래의 로봇 산업은 기존 자동화 산업 뿐만 아니라 안내, 보안 등의 가정, 공공기관 또는 우주, 심해 등에서 인간을 대신할 대안으로 활용되어질 전망이다. 이는 기존의 단순반복에서 벗어나 자율이동, 자기학습 등이 가능하도록 개발되어야 한다. 본 논문에서는 로봇을 공공기관에서의 안내, 보안 또는 위험현장, 군사용으로 적용하기 위해 필요한 기술인 자율이동시스템을 개발하였다. 로봇이 자율이동하기 위해서는 자기위치추적, 장애물 탐지 및 회피 기술이 필요하다. 이를 위해 초음파센서를 이용해 로봇을 탐지 시스템을 구성하였으며 LM신경회로망 제어기를 사용하여 로봇의 이동을 제어하였다. 또한 시뮬레이션을 통해 장애물 회피능력과 이동성능 결과를 검증하였다.

  • PDF

수직다물체시스템의 반복정밀도 향상에 관한 연구 (Research for Improvement of Iterative Precision of the Vertical Multiple Dynamic System)

  • 이수철;박석순
    • 한국정밀공학회지
    • /
    • 제21권5호
    • /
    • pp.64-72
    • /
    • 2004
  • An extension of interaction matrix formulation to the problem of system and disturbance identification for a plant that is corrupted by both process and output disturbances is presented. The teaming control develops controllers that learn to improve their performance at executing a given task, based on experience performing this task. The simplest forms of loaming control are based on the same concept as integral control, but operating in the domain of the repetitions of the task. This paper studies the use of such controllers in a decentralized system, such as a robot moving on the vertical plane with the controller for each link acting independently. The basic result of the paper is to show that stability and iterative precision of the learning controllers for all subsystems when the coupling between subsystems is turned off, assures stability of the decentralized teaming in the coupled system, provided that the sample time in the digital teaming controller is sufficiently short. The methods of teaming system are shown up for the iterative precision of each link.