• 제목/요약/키워드: Learning speed

검색결과 1,145건 처리시간 0.026초

미니맥스 알고리즘을 이용한 학습속도 개선을 위한 Q러닝 (Q-learning to improve learning speed using Minimax algorithm)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제18권4호
    • /
    • pp.99-106
    • /
    • 2018
  • 보드게임에서는 많은 경우의 수의 말들과 많은 상태공간들을 가지고 있다. 그러므로 게임은 학습을 오래 하여야 한다. 본 논문에서는 Q러닝 알고리즘을 이용했다. 그러나 강화학습은 학습초기에 학습속도가 느려지는 단점이 있다. 그러므로 학습을 하는 동안에 같은 최선의 값이 있을 때, 게임트리를 고려한 문제영역의 지식을 활용한 휴리스틱을 사용하여 학습의 속도향상을 시도하였다. 기존 구현된 말과 개선하여 구현된 말을 비교하기 위하여 보드게임을 제작했다. 그래서 일방적으로 공격하는 말과 승부를 겨루게 하였다. 개선된 말은 게임트리를 고려하여 상대방 말을 공격하였다. 실험결과 개선하여 구현된 말이 학습속도적인 면에서 향상됨 것을 알 수 있었다.

영향력분포도를 이용한 강화학습의 학습속도개선 (An improvement of the learning speed through Influence Map on Reinforcement Learning)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제17권4호
    • /
    • pp.109-116
    • /
    • 2017
  • 보드게임은 많은 수의 말들과 상태공간을 갖고 있다. 그러므로 게임은 학습을 오래하여야 한다. 그러나 강화학습은 학습초기에 학습속도가 느려지는 단점이 있다. 그러므로 학습 도중에 동일한 최선 값이 있을 때, 영향력분포도를 고려한 문제 영역 지식을 활용한 휴리스틱을 사용해 학습의 속도 향상을 시도하였다. 기존 구현된 말과 개선 구현된 말을 비교하기 위해 보드게임을 제작하였다. 그래서 일방공격형 말과 승부를 하게 하였다. 실험 결과 개선 구현된 말의 성능이 학습속도 측면에서 향상됨을 알 수 있었다.

Machine learning approaches for wind speed forecasting using long-term monitoring data: a comparative study

  • Ye, X.W.;Ding, Y.;Wan, H.P.
    • Smart Structures and Systems
    • /
    • 제24권6호
    • /
    • pp.733-744
    • /
    • 2019
  • Wind speed forecasting is critical for a variety of engineering tasks, such as wind energy harvesting, scheduling of a wind power system, and dynamic control of structures (e.g., wind turbine, bridge, and building). Wind speed, which has characteristics of random, nonlinear and uncertainty, is difficult to forecast. Nowadays, machine learning approaches (generalized regression neural network (GRNN), back propagation neural network (BPNN), and extreme learning machine (ELM)) are widely used for wind speed forecasting. In this study, two schemes are proposed to improve the forecasting performance of machine learning approaches. One is that optimization algorithms, i.e., cross validation (CV), genetic algorithm (GA), and particle swarm optimization (PSO), are used to automatically find the optimal model parameters. The other is that the combination of different machine learning methods is proposed by finite mixture (FM) method. Specifically, CV-GRNN, GA-BPNN, PSO-ELM belong to optimization algorithm-assisted machine learning approaches, and FM is a hybrid machine learning approach consisting of GRNN, BPNN, and ELM. The effectiveness of these machine learning methods in wind speed forecasting are fully investigated by one-year field monitoring data, and their performance is comprehensively compared.

초등학생들을 위한 속력 측정 어플리케이션의 학습 모듈 개발 (A Learning Module Development of Speed Measurement Application for Elementary Students)

  • 김갑수;박하나
    • 정보교육학회논문지
    • /
    • 제17권1호
    • /
    • pp.23-31
    • /
    • 2013
  • 초등학생들이 쉽게 스마트폰을 접근할 수 있고 또한 흥미를 가질 수 있다. 스마트폰을 초등학교 학습 도구로 이용하여 학습 효과를 볼 수 있을 것이다. 따라서 스마트폰을 과학 실험의 학습 도구에 이용하면 학습 효과가 좋을 것이다. 속력 학습 분야가 초등학생들이 학습하기 어려운 개념이기 때문에 스마트폰 용 속력 학습 어플리케이션으로 많은 실험을 해 보는 것이 필요하다. 본 연구에서 속력 학습을 위한 모듈을 개발한다. 이 모듈은 스마트폰의 가속도 센서에서 데이터를 추출하고, 주어진 시간에 적분하여 속력을 계산한다. 또한 거리도 계산한다. 본 연구에서 제안한 어플리케이션은 학생들이 실험 시 속력 변화를 즉시 확인할 수 있도록 하는 장점이 있다. 본 연구의 장점은 기존의 속력 측정 도구는 실험과 측정 데이터 값이 분리되어 있어 학생들이 재차 속력을 계산해야 하는 번거로움을 극복한 것이다.

  • PDF

플레이어 행동예측을 위한 순차예측 알고리즘의 개선 (Improvement of Sequential Prediction Algorithm for Player's Action Prediction)

  • 신용우;정태충
    • 인터넷정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.25-32
    • /
    • 2010
  • 게임은 여러 캐릭터와 상태공간을 갖고 있다. 그러므로 학습을 하는데 많은 시간이 걸린다. 본 논문에서는 강화학습 알고리즘을 이용하였다. 보상 값을 받아 캐릭터가 학습하게 하여 지능적으로 움직이게 하였다. 학습초기에는 학습속도가 느려진다. 순차예측 알고리즘을 개선하여 학습에 적용하였다. 기존 강화학습으로 구현된 게임과 비교 실험하였다. 실험결과 개선 구현된 게임의 성능이 학습속도 측면에서 30% 까지 향상됨을 알 수 있었다.

자기 학습 능력을 가진 퍼지 제어기를 이용한 차량의 속력 제어기 개발 (A SPEED CONTROLLER FOR VEHICLES USING FUZZY CONTROL ALGORITHM WITH SELF0LEARNING)

  • 정승현;김상우
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1996년도 한국자동제어학술회의논문집(국내학술편); 포항공과대학교, 포항; 24-26 Oct. 1996
    • /
    • pp.880-883
    • /
    • 1996
  • This paper suggests a speed control algorithm for the ICC(Intelligent Cruise Controller) system. The speed controller is designed using the fuzzy controller which shows the good performance in nonlinear system having the complex mathematical model. The fuzzy controller was equipped with the capability of a self-learning in real time in order to maintain the good performance of the speed controller in a time-varying environment the self-learning properties and the performance of the fuzzy controller are showed via computer simulation. The suggested fuzzy controller will be applied to the PRV-III which is our test vehicle.

  • PDF

SVM을 이용한 고속철도 궤도틀림 식별에 관한 연구 (A Study on Identification of Track Irregularity of High Speed Railway Track Using an SVM)

  • 김기동;황순현
    • 산업기술연구
    • /
    • 제33권A호
    • /
    • pp.31-39
    • /
    • 2013
  • There are two methods to make a distinction of deterioration of high-speed railway track. One is that an administrator checks for each attribute value of track induction data represented in graph and determines whether maintenance is needed or not. The other is that an administrator checks for monthly trend of attribute value of the corresponding section and determines whether maintenance is needed or not. But these methods have a weak point that it takes longer times to make decisions as the amount of track induction data increases. As a field of artificial intelligence, the method that a computer makes a distinction of deterioration of high-speed railway track automatically is based on machine learning. Types of machine learning algorism are classified into four type: supervised learning, unsupervised learning, semi-supervised learning, and reinforcement learning. This research uses supervised learning that analogizes a separating function form training data. The method suggested in this research uses SVM classifier which is a main type of supervised learning and shows higher efficiency binary classification problem. and it grasps the difference between two groups of data and makes a distinction of deterioration of high-speed railway track.

  • PDF

다층퍼셉트론의 오류역전파 학습과 계층별 학습의 비교 분석 (Comparative Analysis on Error Back Propagation Learning and Layer By Layer Learning in Multi Layer Perceptrons)

  • 곽영태
    • 한국정보통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.1044-1051
    • /
    • 2003
  • 본 논문은 MLP의 학습 방법으로 사용되는 EBP학습, Cross Entropy함수, 계층별 학습을 소개하고, 필기체 숫자인식 문제를 대상으로 각 학습 방법의 장단점을 비교한다. 실험 결과, EBP학습은 학습 초기에 학습 속도가 다른 학습 방법에 비해 느리지만, 일반화 성능이 좋다. 또한, EBP학습의 단점을 보안한 Cross Entropy 함수는 학습 속도가 EBP학습보다 빠르다. 그러나, 출력층의 오차 신호가 목표 벡터에 대해 선형적으로 학습하기 때문에, 일반화 성능이 EBP학습보다 낮다. 그리고, 계층별 학습은 학습 초기에, 학습 속도가 가장 빠르다. 그러나, 일정한 시간 후, 더 이상 학습이 진행되지 않기 때문에, 일반화 성능이 가장 낮은 결과를 얻었다. 따라서, 본 논문은 MLP를 응용하고자 할 때, 학습 방법의 선택 기준을 제시한다.

위치 오차를 갖는 2관성 공진계에 대한 반복학습 제어의 적용에 관한 연구 (Application of Iterative Learning Control to 2-Mass Resonant System with Initial Position Error)

  • 이학성
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 A
    • /
    • pp.307-310
    • /
    • 2003
  • In this paper, an iterative learning control method is applied to suppress the vibration of a 2-mass system which has a flexible coupling between a load an a motor. More specifically, conditions for the load speed without vibration are derived based on the steady-state condition. And the desired motor position trajectory is synthesized based on the relation between the load and motor speed. Finally, a PD-type learning iterative control law is applied for the desired motor position trajectory. Since the learning law applied for the desired trajectory guarantees the perfect tracking performance, the resulting load speed shows no vibration. In order to handle the initial position error, the PD-type learning law is changed to PID-type and a weight function is added to suppress the residual vibration caused by the initial error. The simulation results show the effectiveness of the proposed learning method.

  • PDF

중복 학습 방지에 의한 역전파 학습 알고리듬 (Back-Propagation Algorithm through Omitting Redundant Learning)

  • 백준호;김유신;손경식
    • 전자공학회논문지B
    • /
    • 제29B권9호
    • /
    • pp.68-75
    • /
    • 1992
  • In this paper the back-propagation algorithm through omitting redundant learning has been proposed to improve learning speed. The proposed algorithm has been applied to XOR, Parity check and pattern recognition of hand-written numbers. The decrease of the number of patterns to be learned has been confirmed as learning proceeds even in early learning stage. The learning speed in pattern recognition of hand-written numbers is improved more than 2 times in various cases of hidden neuron numbers. It is observed that the improvement of learning speed becomes better as the number of patterns and the number of hidden numbers increase. The recognition rate of the proposed algorithm is nearly the same as that conventional method.

  • PDF