• 제목/요약/키워드: 분산학습제어

검색결과 42건 처리시간 0.05초

분산 A3C를 활용한 회전식 도립 진자 시스템 설계 (Design of Rotary Inverted Pendulum System Using Distributed A3C Algorithm)

  • 권도형;임현교;김주봉;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.493-495
    • /
    • 2019
  • 제어 분야의 가장 기초적인 시스템인 Rotary Inverted Pendulum 을 제어하기 위하여, 본 논문에서는 강화학습에서 Deep Q-Network 과 함께 대표적인 알고리즘으로 알려진 Asynchronous Advantage Actor-Critic 을 활용하여 다중 디바이스 제어를 설계한다. Deep Q-Network 알고리즘을 활용한 기존 연구와 동일한 방식으로 실 세계의 물리 에이전트와 가상 환경을 맵핑시키며, 스위치를 통하여 로컬 에이전트와 글로벌 네트워크 간 통신을 구성한다. 본 논문에서는 분산 Asynchronous Advantage Actor-Critic 을 이용함으로써 실 세계의 다중 에이전트 제어를 위한 강화 학습의 활용 가능성을 조명한다.

방향 벡터를 이용한 다중에이전트 휴리스틱 (The multi agent control heuristic using direction vector)

  • 김현;이승관;정태충
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.525-528
    • /
    • 2004
  • 먹이추적문제(prey pursuit problem)는 가상 격자로 이루어진 공간 내에 다중의 에이전트를 이용하여 먹이를 포획하는 것이다. 에이전트들은 먹이를 포획하기 위해 $30{\times}30$으로 이루어진 격자공간 (gride)안에서 기존 제안된 지역 제어, 분산 제어, 강화학습을 이용한 분산 제어 전략들을 적용하여 먹이를 포획하는 전략을 구현하였다. 제한된 격자 공간은 현실세계를 표현하기에는 너무도 역부족이어서 본 논문에서는 제한된 격자공간이 아닌 현실 세계와 흡사한 무한 공간 환경을 표현하고자 하였다. 표현된 환경의 모델은 순환구조(circular)형 격자 공간이라는 새로운 실험 공간이며, 새로운 공간에 맞는 전략은 에이전트와 먹이와의 추적 관계를 방향 벡터를 고려한 모델로 구현하였다. 기존 실험과는 차별화 된 환경에서 에이전트들은 휴리스틱을 통한 학습을 할 수 있다는 가정과 먹이의 효율적 포획, 충돌문제 해결이라는 결과를 얻었다.

  • PDF

선박의 제어 입력과 속도 출력 학습에 의한 단순 운동학 모델 생성 (Simple Kinematic Model Generation by Learning Control Inputs and Velocity Outputs of a Ship)

  • 김동진;윤근항
    • 한국항해항만학회지
    • /
    • 제45권6호
    • /
    • pp.284-297
    • /
    • 2021
  • 본 연구에서는 선박의 운항 데이터를 기반으로 조종성능을 모사할 수 있는 단순 운동학 모델을 제안하였다. 수평면 3자유도 각 방향의 속도 성분을 1차 미분방정식의 해 형태의 단순모델로 두고, 계수에 대한 운항데이터 학습을 수행하였다. 실제 선박의 충분한 운항 데이터의 확보는 어렵거나 제한적이므로, 본 연구에서는 실 운항 데이터 대신 공개된 동역학 모델을 활용하여 임의의 제어입력에 대한 시뮬레이션 결과를 얻고, 이를 운항데이터 학습에 활용하였다. 제어입력인 프로펠러 회전수 및 타각을 임의로 부가하여 동역학 시뮬레이션을 수행하고 각 속도 성분 출력을 얻었다. 충분한 시간 동안 동역학 시뮬레이션의 제어 입력과 속도 출력을 학습하여 각 제어 입력에 대한 운동학 모델 내 계수인 시정수 3개, 수렴속도성분 3개의 분포를 도출하였다. 추가로 임의의 제어 입력에 의한 선회 시뮬레이션 결과들과 비교함으로써 단순 운동학 모델의 성능을 검증하였다. 도출된 시정수들의 분포에는 다소 분산이 있으며, 제어 입력 이외의 관련 변수를 더 추가하여 정확도를 높이는 추후 연구가 필요하다.

수직다물체시스템의 반복정밀도 향상에 관한 연구 (Research for Improvement of Iterative Precision of the Vertical Multiple Dynamic System)

  • 이수철;박석순
    • 한국정밀공학회지
    • /
    • 제21권5호
    • /
    • pp.64-72
    • /
    • 2004
  • An extension of interaction matrix formulation to the problem of system and disturbance identification for a plant that is corrupted by both process and output disturbances is presented. The teaming control develops controllers that learn to improve their performance at executing a given task, based on experience performing this task. The simplest forms of loaming control are based on the same concept as integral control, but operating in the domain of the repetitions of the task. This paper studies the use of such controllers in a decentralized system, such as a robot moving on the vertical plane with the controller for each link acting independently. The basic result of the paper is to show that stability and iterative precision of the learning controllers for all subsystems when the coupling between subsystems is turned off, assures stability of the decentralized teaming in the coupled system, provided that the sample time in the digital teaming controller is sufficiently short. The methods of teaming system are shown up for the iterative precision of each link.

Device Driver Hooking을 응용한 상호 원격 제어 교육 시스템 (Collaborative remote control education system using Device Driver Hooking)

  • 이희득
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.281-284
    • /
    • 2002
  • 현재 많은 사용자들이 정보 교육과 전달을 위하여 CD-ROM 이나 인터넷 환경과 그것의 응용을 이용 한다. 하지만, 현재 상황에서의 정보는 한 방향으로만 전달되며 사용자간 정보 공유와 공유된 정보에 대한 설명 수단은 극히 제한되어 있다. 본 논문에서 제안하는 시스템은 공유된 미디어 객체에 대하여 Mouse Recording 및 Player를 통하여 공동작업에 참여한 사용자들이 동일 View를 통해 참조하고 고가의 어플리케이션을 직접 실습 및 참조할 수 있도록 설계, 구현되었다. 또 피교육자들의 컴퓨터를 제어함으로 분산 시스템 환경 하에서 원격교육 등에서 정보 교환 및 학습 수단으로 사용될 수 있다.

  • PDF

강화 학습을 이용한 다중 에이전트 조정 전략 (Multi-agent Coordination Strategy Using Reinforcement Learning)

  • 김수현;김병천;윤병주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.285-288
    • /
    • 2000
  • 본 논문에서는 다중 에이전트(multi-agent) 환경에서 에이전트들의 행동을 효율적으로 조정 (coordination)하기 위해 강화 학습(reinforcement learning)을 이용하였다. 제안된 방법은 각 에이전트가 목표(goal)와의 거리 관계(distance relationship)와 인접 에이전트들과의 공간 관계(spatial relationship)를 이용하였다. 그러므로 각 에이전트는 다른 에이전트와 충돌(collision) 현상이 발생하지 않으면서, 최적의 다음 상태를 선택할 수 있다. 또한, 상태 공간으로부터 입력되는 강화 값이 0과 1 사이의 값을 갖기 때문에 각 에이전트가 선택한 (상태, 행동) 쌍이 얼마나 좋은가를 나타낼 수 있다. 제안된 방법을 먹이 포획 문제(prey pursuit problem)에 적용한 결과 지역 제어(local control)나. 분산 제어(distributed control) 전략을 이용한 방법보다 여러 에이전트들의 행동을 효율적으로 조정할 수 있었으며, 매우 빠르게 먹이를 포획할 수 있음을 알 수 있었다.

  • PDF

신경회로망의 광학적 구현 (Optical Implementation of Neural Neworks)

  • 김흥만;정재우
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 1991년도 광학 및 양자전자학 워크샵
    • /
    • pp.55-59
    • /
    • 1991
  • 신경회로망은 뒤뇌의 신경조직이 갖는 병렬적이며 분산적인 정보처리 능력을 흉내낸 인공적인 회로망이다. 이러한 신경회로망을 영상인식, 음성인식, 적응제어 및 최적화등에 응용할 경우 지금까지 얻지 못하였던 우수한 여러 가지 특성을 얻을수 있음을 알려짐에 따라 신경회로망을 구체적으로 구현하고자 하는 연구가 활발히 이루어지고 있다. 본 고에서는 신경소자간의 연결세기의 변조에 의한 학습 원리를 설명하고 광전기적인 그현방법에 대해서 몇 개의 예를 들어 설명하고 그 발전 가능성에 대하여 기술하였다.

  • PDF

신경회로망을 이용한 직접 자기동조제어기의 설계 (Design of a Direct Self-tuning Controller Using Neural Network)

  • 조원철;이인수
    • 전자공학회논문지SC
    • /
    • 제40권4호
    • /
    • pp.264-274
    • /
    • 2003
  • 본 논문에서는 잡음과 시간지연이 존재하며 시스템 파라미터가 변하는 비선형 비최소위상 시스템에 적응하는 신경회로망이 결합된 PID구조를 갖는 일반화 최소분산 자기동조제어기를 제안한다. PID구조를 갖는 자기동조는 PID제어기처럼 구조가 간단하고 계통을 정밀하게 제어하는 자기동조 제어기의 특성을 그대로 유지할 수 있다. 일반화 최소분산 자기동조 제어기 파라미터는 비선형 시스템을 선형시스템으로 간주하고 순환최소자승법으로 추정하며 설계계수의 값은 확률근사법인 Robbins-Monro 알고리듬을 이용하여 자동조정하였다. 역전파 학습 알고리듬을 사용하는 신경회로망 제어기는 비선형 부분의 제어를 보상하기 위해 필터된 기준입력과 필터된 플랜트 출력이 같도록 제어값을 출력한다. 컴퓨터 시뮬레이션을 통해 제안한 방법이 시스템의 파라미터가 변하는 비최소위상 시스템에 잘 적응함을 보였다.

디지털 통신 시스템에서 데이터-재순환 LMS 알고리즘을 이용한 신호 간섭 제어 (Signal Interference Rejection using Data-Recycling LMS Algorithm in Digital Communication System)

  • 김원균;나상동
    • 한국통신학회논문지
    • /
    • 제24권9A호
    • /
    • pp.1329-1338
    • /
    • 1999
  • 본 논문에서, LMS 알고리즘의 수렴 속도를 향상시키기 위한 효율적인 신호간섭 제어기법을 제안한다. 수신 데이터를 재활용하여 심볼 시간 주기에 계수들을 곱함으로써 적응되는 제안된 알고리즘의 수렴특성이 수렴 속도의 향상을 이론적으로 증명하기 위해 분석한다. 스텝-크기 매개변수 $\mu$가 증가됨에 따라 알고리즘의 수렴 속도가 제어된다. 또한, 스텝-크기 매개변수 $\mu$의 증가는 실험적으로 계산된 학습 곡선에서 분산을 감소시키는 효과를 갖는다. 고유치 확산을 증가시킴에 따라 적응 등화기의 수렴속도를 천천히 제어하고 평균 자승 에러의 안정-상태 값을 증가시키는 효과를 나타내며 데이터-재사용 LMS 기술이 수렴속도를 (B+1)배만큼 증가시켜 필터 알고리즘에서 신호간섭제어의 우수성을 입증한다.

  • PDF

K-means 군집화 및 Harmony Search 알고리즘을 이용한 분산 SDN의 부하 분산 기법 (A Load Balancing Scheme for Distributed SDN Based on Harmony Search with K-means Clustering)

  • 김세준;유승언;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.29-30
    • /
    • 2019
  • 본 논문에서는 다중 컨트롤러가 존재하는 분산 SDN 환경에서 과도한 제어 메시지로 인한 과부하된 컨트롤러의 부하를 줄이기 위하여 이주할 스위치를 K-means 군집화와 Harmony Search(HS)를 기반으로 선정 하는 기법을 제안하였다. 기존에 HS를 이용하여 이주할 스위치를 선택하는 기법이 제시되었으나, 시간 소모에 비하여 정확도가 부족한 단점이 있다. 또한 Harmony Memory(HM) 구축을 위해 메모리 소모 또한 크다. 이를 해결하기 위하여 본 논문에서는 유클리드 거리를 기반으로 하는 K-means 군집화를 이용하여 이주할 스위치를 골라내어 HM의 크기를 줄이고 이주 효율을 향상 시킨다.

  • PDF