• 제목/요약/키워드: 학습속도

검색결과 1,099건 처리시간 0.025초

영향력분포도를 이용한 강화학습의 학습속도개선 (An improvement of the learning speed through Influence Map on Reinforcement Learning)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제17권4호
    • /
    • pp.109-116
    • /
    • 2017
  • 보드게임은 많은 수의 말들과 상태공간을 갖고 있다. 그러므로 게임은 학습을 오래하여야 한다. 그러나 강화학습은 학습초기에 학습속도가 느려지는 단점이 있다. 그러므로 학습 도중에 동일한 최선 값이 있을 때, 영향력분포도를 고려한 문제 영역 지식을 활용한 휴리스틱을 사용해 학습의 속도 향상을 시도하였다. 기존 구현된 말과 개선 구현된 말을 비교하기 위해 보드게임을 제작하였다. 그래서 일방공격형 말과 승부를 하게 하였다. 실험 결과 개선 구현된 말의 성능이 학습속도 측면에서 향상됨을 알 수 있었다.

미니맥스 알고리즘을 이용한 학습속도 개선을 위한 Q러닝 (Q-learning to improve learning speed using Minimax algorithm)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제18권4호
    • /
    • pp.99-106
    • /
    • 2018
  • 보드게임에서는 많은 경우의 수의 말들과 많은 상태공간들을 가지고 있다. 그러므로 게임은 학습을 오래 하여야 한다. 본 논문에서는 Q러닝 알고리즘을 이용했다. 그러나 강화학습은 학습초기에 학습속도가 느려지는 단점이 있다. 그러므로 학습을 하는 동안에 같은 최선의 값이 있을 때, 게임트리를 고려한 문제영역의 지식을 활용한 휴리스틱을 사용하여 학습의 속도향상을 시도하였다. 기존 구현된 말과 개선하여 구현된 말을 비교하기 위하여 보드게임을 제작했다. 그래서 일방적으로 공격하는 말과 승부를 겨루게 하였다. 개선된 말은 게임트리를 고려하여 상대방 말을 공격하였다. 실험결과 개선하여 구현된 말이 학습속도적인 면에서 향상됨 것을 알 수 있었다.

가변 감쇠 파라미터를 이용한 Levenberg-Marquardt 알고리즘의 학습 속도 향상 (Accelerating Levenberg-Marquardt Algorithm using Variable Damping Parameter)

  • 곽영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.57-63
    • /
    • 2010
  • Levenberg-Marquardt 알고리즘에서 감쇠 파라미터는 오류역전파 학습과 Gauss-Newton 학습의 스위치 역할을 하며 학습 속도에 영향을 준다. 이런 감쇠 파라미터를 고정시키는 것은 오차 함수의 진동을 유발하고 학습 속도를 감소시킨다. 따라서 본 논문은 오차 함수의 변화 과정을 참조하여 감쇠 파라미터를 가변적으로 적용하는 방법을 제안한다. 제안된 방법은 오차의 변화량이 크면 감쇠 파라미터를 크게, 오차의 변화량이 작으면 감쇠 파라미터를 작게 조정한다. 이것은 모멘텀과 유사한 역할을 하여 학습 속도를 향상시킨다. 제안된 방법의 검증을 위한 실험으로는 iris 분류 문제와 wine 분류 문제를 사용하였다. 제안된 방법은 iris 분류 문제에서는 67% 학습에서, wine 분류 문제에서는 78% 학습에서 학습 속도가 향상되었으며 기존 방법과 비교하여 오차의 진동도 적은 것을 확인할 수 있었다.

플레이어 행동예측을 위한 순차예측 알고리즘의 개선 (Improvement of Sequential Prediction Algorithm for Player's Action Prediction)

  • 신용우;정태충
    • 인터넷정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.25-32
    • /
    • 2010
  • 게임은 여러 캐릭터와 상태공간을 갖고 있다. 그러므로 학습을 하는데 많은 시간이 걸린다. 본 논문에서는 강화학습 알고리즘을 이용하였다. 보상 값을 받아 캐릭터가 학습하게 하여 지능적으로 움직이게 하였다. 학습초기에는 학습속도가 느려진다. 순차예측 알고리즘을 개선하여 학습에 적용하였다. 기존 강화학습으로 구현된 게임과 비교 실험하였다. 실험결과 개선 구현된 게임의 성능이 학습속도 측면에서 30% 까지 향상됨을 알 수 있었다.

신경망 학습의 일반화 성능향상을 위한 초기 가중값과 학습률 그리고 계수조정의 효과 (The Effect of Initial Weight, Learning Rate and Regularized Coefficient on Generalization Performance)

  • 윤여창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.493-496
    • /
    • 2004
  • 본 연구에서는 신경망 학습의 중요한 평가 척도로써 고려될 수 있는 일반화 성능과 학습속도를 개선시키기 위한 방안으로써 초기 가중값과 학습률과 같은 주요 인자들을 이용한 신경망 학습 영향을 살펴본다. 특히 초기 가중값과 학습률을 고정시킨 후 새롭게 조정된 계수들을 점차적으로 변화시키는 새로운 인자 결합방법을 이용하여 신경망 학습량과 학습속도를 비교해 보고 계수조정을 통한 개선된 학습 영향을 살펴본다. 그리고 단순한 예제를 이용한 실증분석을 통하여 신경망 모형의 일반화 성능과 학습 속도 개선을 위한 각 인자들의 개별 효과와 결합 효과를 살펴보고 그 개선 방안을 제시한다.

  • PDF

에러 역전파 학습 성능 향상을 위한 초기 가중치 결정에 관한 연구 (A Study of Initial Determination for Performance Enhancement in Backpropagation)

  • 김웅명;이현수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.333-335
    • /
    • 1998
  • 에러 역전파 신경망에서 학습속도와 수렴률은 초기 가중의 분포에 따라 크게 영향을 받는다. 본 연구에서는 이를 위하여 비교사 학습 신경망(Hebbian learning rule)을 이용한 새로운 초기 가중치 결정 방법을 제안한다. 또는 비교사 학습 신경망이 에러 역전파 신경망 학습에 적당하도록 은닉층의 각 뉴런과 연결된 가중치의 norm을 이용하여 학습하였다. 시뮬레이션을 통하여 기존 에러 역전파 신경망 학습과 그 성능을 비교한 결과 제안한 초기 가중치 표현이 학습속도와 수렴능력에서 우수함을 나타낸다.

  • PDF

동영상 학습에서 교수자 출연여부와 발화속도가 학습몰입과 교수실재감에 미치는 효과 (Effects of Lecturer Appearance and Speech Rate on Learning Flow and Teaching Presence in Video Learning)

  • 태효하;제혜금;김보경
    • 한국산학기술학회논문지
    • /
    • 제22권1호
    • /
    • pp.267-274
    • /
    • 2021
  • 본 연구는 동영상 학습에서 교수자 출연 여부와 교수자 발화속도가 학습몰입과 교수실재감의 효과에 차이를 나타내는지를 실험을 통해 밝히는 것이다. 실험 대상자는 중국 형태대학교 1학년 183명이며, 이들에게 교수자가 출연여부와 발화속도 고저의 4가지 동영상을 학습하도록 한 후, 학습몰입과 교수실재감을 측정하였다. 수집된 자료는 다변량분산분석을 통해 분석하였다. 분석결과 첫째, 교수자가 출연한 동영상을 학습한 집단이 그렇지 않은 집단보다 학습몰입과 교수실재감이 모두 높게 나타났다. 둘째, 교수자의 발화속도가 높은 동영상으로 학습한 집단이 낮은 동영상으로 학습한 집단보다 학습몰입과 교수실재감이 모두 높게 나타났다. 셋째, 교수자 출연여부와 발화속도의 학습몰입과 교수실재감에 대한 상호작용 효과는 유의한 차이가 없는 것으로 나타났다. 이러한 연구결과는 대학 수업에서 효과적인 학습을 위한 강의 동영상을 개발할 때 교수자의 출연여부와 발화속도를 어떻게 설계할 것인지에 대한 이론적·실천적 근거를 제공한다. 즉 가급적 동영상에 교수자가 출연하여 표정, 몸짓과 같은 비언어적 방식으로 사회적 단서를 제시하는 것이 중요하다. 또한 교수자는 동영상에서 약간 빠른 속도로 설명함으로써 학생이 학습에 더 집중하여 몰입하게 할 수 있다. 교수자 출연과 빠른 발화속도는 학습에 몰입하게 하고, 동영상에서 교수행위가 실재로 이루어지고 있다는 느낌을 주게 한다는 것을 시사한다.

사전 지식에 의한 강화학습 에이전트의 학습 속도와 경향성 변화 (How the Learning Speed and Tendency of Reinforcement Learning Agents Change with Prior Knowledge)

  • 김지수;이은헌;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.512-515
    • /
    • 2020
  • 학습 속도가 느린 강화학습을 범용적으로 활용할 수 있도록 연구가 활발하게 이루어지고 있다. 사전 지식을 제공해서 학습 속도를 높일 수 있지만, 잘못된 사전 지식을 제공했을 위험이 존재한다. 본 연구는 불확실하거나 잘못된 사전 지식이 학습에 어떤 영향을 미치는지 살펴본다. OpenAI Gym 라이브러리를 이용해서 만든 Gamble 환경, Cliff 환경, 그리고 Maze 환경에서 실험을 진행했다. 그 결과 사전 지식을 통해 에이전트의 행동에 경향성을 부여할 수 있다는 것을 확인했다. 또한, 경로탐색에 있어서 잘못된 사전 지식이 얼마나 학습을 방해하는지 알아보았다.

강화학습에서 점진적인 심화를 이용한 고누게임의 개선 (Improvement of the Gonu game using progressive deepening in reinforcement learning)

  • 신용우
    • 한국게임학회 논문지
    • /
    • 제20권6호
    • /
    • pp.23-30
    • /
    • 2020
  • 게임에서는 많은 경우의 수들을 가지고 있다. 그래서 학습을 많이 하여야 한다. 본 논문은 학습속도를 개선하기 위하여 강화학습을 이용했다. 그러나 강화학습은 많은 경우의 수들을 가지므로 학습 초기에 속도가 느려진다. 그래서 미니맥스 알고리즘을 이용하여 학습의 속도를 향상하였다. 개선된 성능을 비교하기 위해 고누게임을 제작하여 실험하였다. 실험결과는 승률은 높았지만, 동점의 결과가 발생하게 되었다. 점진적인 심화를 이용하여 게임트리를 더 탐색하여 동점인 경우를 줄이고 승률이 약 75% 향상되었다.

패턴인식에서 온라인 오류역전파 알고리즘의 학습속도 향상방법 (An Improvement of the Outline Mede Error Backpropagation Algorithm Learning Speed for Pattern Recognition)

  • 이태승;황병원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.616-618
    • /
    • 2002
  • MLP(multilayer perceptron)는 다른 패턴인식 방법에 비해 몇 가지 이점이 있어 다양한 문제영역에서 사용되고 있다 그러나 MLP의 학습에 일반적으로 사용되는 EBP(error backpropagation) 알고리즘은 학습시간이 비교적 오래 걸린다는 단점이 있으며, 이는 실시간 처리를 요구하는 문제나 대규모 데이터 및 MLP 구조로 인해 학습시간이 상당히 긴 문제에서 제약으로 작용한다. 패턴인식에 사용되는 학습데이터는 풍부한 중복특성을 내포하고 있으므로 패턴마다 MLP의 내부변수를 갱신하는 은라인 계열의 학습방식이 속도의 향상에 상당한 효과가 있다. 일반적인 온라인 EBP 알고리즘에서는 내부 가중치 갱신시 고정된 학습률을 적용한다. 고정 학습률을 적절히 선택함으로써 패턴인식 응용에서 상당한 속도개선을 얻을 수 있지만, 학습률을 고정함으로써 온라인 방식에서 패턴별 갱신의 특성을 완전히 활용하지 못하는 비효율성이 발생한다. 또한, 학습도중 패턴군이 학습된 패턴과 그렇지 못한 패턴으로 나뉘고 이 가운데 학습된 패턴은 학습을 위한 계산에 포함될 필요가 없음에도 불구하고, 기존의 온라인 EBP에서는 에폭에 할당된 모든 패턴을 일률적으로 계산에 포함시킨다. 이 문제에 대해 본 논문에서는 학습이 진행됨에 따라 패턴마다 적절한 학습률을 적용하고 필요한 패턴만을 학습에 반영하는 패턴별 가변학습률 및 학습생략(COIL) 방댑을 제안한다. 제안한 COIL의 성능을 입증하기 위해 화자증명과 음성인식을 실험하고 그 결과를 제시한다.

  • PDF