• 제목/요약/키워드: Learning Control Algorithm

검색결과 947건 처리시간 0.024초

헬리콥터 자세제어를 위한 뉴로 퍼지 제어기의 설계에 관한 연구 (A Study on Design of Neuro- Fuzzy Controller for Attitude Control of Helicopter)

  • 최용선;임태우;장경원;안태천
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 D
    • /
    • pp.2283-2285
    • /
    • 2001
  • This paper proposed to a neural network based fuzzy control (neuro-fuzzy control) technique for attitude control of helicopter with strongly dynamic nonlinearities and derived a helicopter aerodynamic torque equation of helicopter and the force balance equation. A neuro-fuzzy system is a feedforward network that employs a back-propagation algorithm for learning purpose. A neuro-fuzzy system is used to identify nonlinear dynamic systems. Hence, this paper presents methods for the design of a neural network(NN) based fuzzy controller(that is, neuro-fuzzy control) for a helicopter of nonlinear MIMO systems. The proposed neuro-fuzzy control determined to a input-output membership function in fuzzy control and neural networks constructed to improve through learning of input-output membership functions determined in fuzzy control.

  • PDF

기계학습 알고리즘을 이용한 UAS 제어계수 실시간 자동 조정 시스템 (UAS Automatic Control Parameter Tuning System using Machine Learning Module)

  • 문미선;송강;송동호
    • 한국항행학회논문지
    • /
    • 제14권6호
    • /
    • pp.874-881
    • /
    • 2010
  • 무인기의 자동 비행 제어 시스템은 기체의 형태, 크기, 무게 등의 정적 및 동적 변화에 따라 스스로 비행계수를 조정하여 목표 비행궤적을 정확히 따라가도록 제어할 필요가 있다. 본 논문에서는 PID 제어 기법을 이용하는 비행제어시스템에 기계학습모듈(MLM)을 추가하여 기체의 특성 변화에 따라 제어계수를 비행중 실시간 자동으로 조정하는 시스템을 제안한다. MLM은 선형회귀분석과 보정학습을 이용하여 설계되었으며 MLM을 통해 학습된 제어계수의 적합성을 평가하는 평가모듈(EvM)을 함께 모델링 하였다. 이 시스템은 FDC 비버 시뮬레이터를 기반으로 실험하였으며 그 결과를 분석 제시하였다.

RLS 기반 Actor-Critic 학습을 이용한 로봇이동 (Robot Locomotion via RLS-based Actor-Critic Learning)

  • 김종호;강대성;박주영
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.893-898
    • /
    • 2005
  • 강화학습 방법론 중 하나의 부류인 액터-크리틱 알고리즘은 제어압력 선택 문제에 있어서 최소한의 계산만을 필요로 하고, 확률적 정책을 명시정으로 다룰 수 있는 장점 때문에 최근에 인공지능 분야에서 많은 관심을 끌고 있다. 액터-크리틱 네트워크는 제어압력 선택 전략을 위한 액터 네트워크와 가치 함수 근사를 위한 크리틱 네트워크로 구성되며, 우수한 제어입력의 서택과 정화한 가치 함수 관사를 최대한 신속하게 달성하기 위하여, 학습 과정 동안 액터와 크리틱은 자신들의 파라미터 백터를 적응적으로 변화시키는 전략을 구사한다. 본 논문은 크리틱의 학습을 위해 빠른 수렴성을 보장하는 RLS (Recursive Least Square)를 사용하고, 액터의 학습을 위해 정책의 기울기(Policy Gradient)를 이용하는 새로운 종류의 알고리즘을 고려한다. 고려된 알고리즘의 적용 가능성은 두개의 링크를 갖는 로봇에 대한 실험을 통하여 예시된다.

혼합형 학습규칙 신경 회로망을 이용한 제어 방식 (Control Method using Neural Network of Hybrid Learning Rule)

  • 임중규;이현관;권성훈;엄기환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 춘계종합학술대회
    • /
    • pp.370-374
    • /
    • 1999
  • 본 논문에서는 역전파 알고리즘과 헵 학습규칙의 장점을 최대한 살려 이용하고, 역전파 알고리즘의 문제점인 지역 최소점에 빠지는 경우와 학습시간이 느린 단점과 헵 학습규칙의 문제점인 학습 패턴의 저장능력이 매우 제한되고 선형적 분리가 되지 않는 복잡한 문제에는 적용할 수 없다는 단점등을 개선하기 위하여 혼합형 학습규칙을 제안한다. 제안하는 학습규칙은 입력층과 은닉층에 흔합형 학습규칙과 은닉층과 출력층에 역전파(Back-Propagation) 학습규칙을 적용한 혼합형이다. 제안한 혼합형 학습규칙을 이용한 신경회로망의 유용성을 확인하기 위하여 단일관절 매니플레이터를 이용하여 추종제어에 대한 시뮬레이션을 하여 기존의 역전파 알고리즘을 이용한 직접적응 제어 방식과 제어성능을 비교 검토한 결과 다음과 같은 특성을 확인하였다.

  • PDF

오이수확로봇의 영상처리를 위한 형상인식 알고리즘에 관한 연구 (The Research of Shape Recognition Algorithm for Image Processing of Cucumber Harvest Robot)

  • 민병로;임기택;이대원
    • 생물환경조절학회지
    • /
    • 제20권2호
    • /
    • pp.63-71
    • /
    • 2011
  • 영상처리는 정확한 오이의 형상 및 위치를 인식하기 위하여 형상인식 알고리즘에 대한 연구를 수행하였다. 다양한 오이형상을 인식하기 위한 방법으로는 신경회로망의 연상 메모리 알고리즘을 이용하여 오이의 특정형상을 인식하였다. 형상인식은 실제영상에서 오이의 형상과 위치를 판정할 수 있도록 알고리즘을 개발한 결과, 다음과 같은 결론을 얻었다. 본 알고리즘에서는 일정한 학습패턴의 수를 2개, 3개, 4개를 각각 기억시켜 샘플패턴 20개를 실험하여 연상시킨 결과, 학습패턴으로 복원된 출력패턴의 비율은 각각 65.0%, 45.0%, 12.5%로 나타났다. 이는 학습패턴의 수가 많을수록 수렴할 때, 다른 출력패턴으로 많이 검출되었다. 오이의 특정형상 검출은 $30{\times}30$간격으로 자동검출 되도록 처리하였다. 실제영상에서 자동 검출로 처리한 결과, 오이인식의 처리시간은 약 0.5~1초/1개(패턴) 빠르게 검출되었다. 또한, 다섯 개의 실제 영상에서 실험한 결과, 학습패턴에 대한 다른 출력패턴은 96~99%의 제거율을 나타내었다. 오이로 인식된 출력패턴 중에서, 오검출된 출력패턴의 비율은 0.1~4.2%를 나타내었다. 본 연구에서는 신경회로망을 이용하여 오이의 형상 및 위치를 인식할 수 있도록 알고리즘을 개발하였다. 오이의 위치측정은 실제영상에서 학습패턴과 유사한 출력패턴의 좌표를 가지고, 오이의 위치좌표를 추정할 수 있었다.

12각형 기반의 Q-learning과 SVM을 이용한 군집로봇의 목표물 추적 알고리즘 (Object tracking algorithm of Swarm Robot System for using SVM and Dodecagon based Q-learning)

  • 서상욱;양현창;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.291-296
    • /
    • 2008
  • 본 논문에서는 군집로봇시스템에서 목표물 추적을 위하여 SVM을 이용한 12각형 기반의 Q-learning 알고리즘을 제안한다. 제안한 알고리즘의 유효성을 보이기 위해 본 논문에서는 여러 대의 로봇과 장애물 그리고 하나의 목표물로 정하고, 각각의 로봇이 숨겨진 목표물을 찾아내는 실험을 가정하여 무작위, DBAM과 AMAB의 융합 모델, 마지막으로는 본 논문에서 제안한 SVM과 12각형 기반의 Q-learning 알고리즘을 이용하여 실험을 수행하고, 이 3가지 방법을 비교하여 본 논문의 유효성을 검증하였다.

커리큘럼 기반 심층 강화학습을 이용한 좁은 틈을 통과하는 무인기 군집 내비게이션 (Collective Navigation Through a Narrow Gap for a Swarm of UAVs Using Curriculum-Based Deep Reinforcement Learning)

  • 최명열;신우재;김민우;박휘성;유영빈;이민;오현동
    • 로봇학회논문지
    • /
    • 제19권1호
    • /
    • pp.117-129
    • /
    • 2024
  • This paper introduces collective navigation through a narrow gap using a curriculum-based deep reinforcement learning algorithm for a swarm of unmanned aerial vehicles (UAVs). Collective navigation in complex environments is essential for various applications such as search and rescue, environment monitoring and military tasks operations. Conventional methods, which are easily interpretable from an engineering perspective, divide the navigation tasks into mapping, planning, and control; however, they struggle with increased latency and unmodeled environmental factors. Recently, learning-based methods have addressed these problems by employing the end-to-end framework with neural networks. Nonetheless, most existing learning-based approaches face challenges in complex scenarios particularly for navigating through a narrow gap or when a leader or informed UAV is unavailable. Our approach uses the information of a certain number of nearest neighboring UAVs and incorporates a task-specific curriculum to reduce learning time and train a robust model. The effectiveness of the proposed algorithm is verified through an ablation study and quantitative metrics. Simulation results demonstrate that our approach outperforms existing methods.

신경회로망을 이용한 SRM 센서리스 제어연구 (Sensorless Control of SRM Using Neural Network)

  • 최재동;안재황;성세진
    • 대한전기학회논문지:전기기기및에너지변환시스템부문B
    • /
    • 제50권1호
    • /
    • pp.30-36
    • /
    • 2001
  • This paper introduces a new indirect rotor position estimation algorithm for the SRM sensorless control, based on the magnetizing curves of aligned and unaligned rotor positions. Through the basic test method, the complete SRM magnetizing characterization is first constructed using a neural network training, and then used to estimate the rotor position. And also, the optimal phase is selected by the phase selector. In order to verify this approach, the proposed rotor position estimation algorithm using a neural network learning data is investigated. The experimental results show that the proposed control algorithm can be effectively applied to SRM sensorless control.

  • PDF

An Improvement of AdaBoost using Boundary Classifier

  • 이원주;천민규;현창호;박민용
    • 한국지능시스템학회논문지
    • /
    • 제23권2호
    • /
    • pp.166-171
    • /
    • 2013
  • The method proposed in this paper can improve the performance of the Boosting algorithm in machine learning. The proposed Boundary AdaBoost algorithm can make up for the weak points of Normal binary classifier using threshold boundary concepts. The new proposed boundary can be located near the threshold of the binary classifier. The proposed algorithm improves classification in areas where Normal binary classifier is weak. Thus, the optimal boundary final classifier can decrease error rates classified with more reasonable features. Finally, this paper derives the new algorithm's optimal solution, and it demonstrates how classifier accuracy can be improved using the proposed Boundary AdaBoost in a simulation experiment of pedestrian detection using 10-fold cross validation.

시스템 특성함수 기반 평균보상 TD(${\lambda}$) 학습을 통한 유한용량 Fab 스케줄링 근사화 (Capacitated Fab Scheduling Approximation using Average Reward TD(${\lambda}$) Learning based on System Feature Functions)

  • 최진영
    • 산업경영시스템학회지
    • /
    • 제34권4호
    • /
    • pp.189-196
    • /
    • 2011
  • In this paper, we propose a logical control-based actor-critic algorithm as an efficient approach for the approximation of the capacitated fab scheduling problem. We apply the average reward temporal-difference learning method for estimating the relative value functions of system states, while avoiding deadlock situation by Banker's algorithm. We consider the Intel mini-fab re-entrant line for the evaluation of the suggested algorithm and perform a numerical experiment by generating some sample system configurations randomly. We show that the suggested method has a prominent performance compared to other well-known heuristics.