• 제목/요약/키워드: 탐색학습

검색결과 1,863건 처리시간 0.027초

미로 환경에서 최단 경로 탐색을 위한 실시간 강화 학습 (Online Reinforcement Learning to Search the Shortest Path in Maze Environments)

  • 김병천;김삼근;윤병주
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.155-162
    • /
    • 2002
  • 강화 학습(reinforcement teaming)은 시행-착오(trial-and-er개r)를 통해 동적 환경과 상호작용하면서 학습을 수행하는 학습 방법으로, 실시간 강화 학습(online reinforcement learning)과 지연 강화 학습(delayed reinforcement teaming)으로 분류된다. 본 논문에서는 미로 환경에서 최단 경로를 빠르게 탐색할 수 있는 실시간 강화 학습 시스템(ONRELS : Outline REinforcement Learning System)을 제안한다. ONRELS는 현재 상태에서 상태전이를 하기 전에 선택 가능한 모든 (상태-행동) 쌍에 대한 평가 값을 갱신하고 나서 상태전이를 한다. ONRELS는 미로 환경의 상태 공간을 압축(compression)하고 나서 압축된 환경과 시행-착오를 통해 상호 작용하면서 학습을 수행한다. 실험을 통해 미로 환경에서 ONRELS는 TD -오류를 이용한 Q-학습과 $TD(\lambda{)}$를 이용한 $Q(\lambda{)}$-학습보다 최단 경로를 빠르게 탐색할 수 있음을 알 수 있었다.

A Study of Collaborative and Distributed Multi-agent Path-planning using Reinforcement Learning

  • Kim, Min-Suk
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권3호
    • /
    • pp.9-17
    • /
    • 2021
  • 동적 시스템 환경에서 지능형 협업 자율 시스템을 위한 기계학습 기반의 다양한 방법들이 연구 및 개발되고 있다. 본 연구에서는 분산 노드 기반 컴퓨팅 방식의 자율형 다중 에이전트 경로 탐색 방법을 제안하고 있으며, 지능형 학습을 통한 시스템 최적화를 위해 강화학습 방법을 적용하여 다양한 실험을 진행하였다. 강화학습 기반의 다중 에이전트 시스템은 에이전트의 연속된 행동에 따른 누적 보상을 평가하고 이를 학습하여 정책을 개선하는 지능형 최적화 기계학습 방법이다. 본 연구에서 제안한 방법은 강화학습 기반 다중 에이전트 최적화 경로 탐색 성능을 높이기 위해 학습 초기 경로 탐색 방법을 개선한 최적화 방법을 제안하고 있다. 또한, 분산된 다중 목표를 구성하여 에이전트간 정보 공유를 이용한 학습 최적화를 시도하였으며, 비동기식 에이전트 경로 탐색 기능을 추가하여 실제 분산 환경 시스템에서 일어날 수 있는 다양한 문제점 및 한계점에 대한 솔루션을 제안하고자 한다.

로봇이 새로운 창의성 학습도구로서의 가능성 탐색 (A Study on the Possibility of a Robot as a New Learning Tool for Creativity)

  • 문외식
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2010년도 하계학술대회
    • /
    • pp.259-264
    • /
    • 2010
  • 본 연구는 초등학생들이 창의성 및 문제해결력 향상을 위해 기존의 컴퓨터를 대신하여 로봇을 이용한 새로운 학습방법의 가능성을 탐색하기 위해 현장 교사들이 로봇교육에 대한 성향을 조사 분석하고 이를 기초로 교육과정과 교재를 개발하였다. 로봇교육을 통한 창의성 구성요소를 확인하고 가능성을 탐색하기 위해 초등학생 6학년을 대상으로 방과 후 학습시간에 학습시킨 후 결과산출물을 만들고 이를 평가하였다. 결과로서 초등학교에서 로봇이 창의적인 학습도구로 성공할 수 있는 가능성을 확인하게 되었다.

  • PDF

강화학습 기법을 이용한 최적경로 탐색 (Optimal Path Search using Reinforcement Learning Technique)

  • 구다솔;이태경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.886-889
    • /
    • 2014
  • 본 논문에서는 사용자로부터 실시간으로 전송 받은 교통정보 이용하여 강화학습에 의한 최적 경로탐색을 제안한다. ITS(Intelligent Transportation Systems)를 서비스하기 위한 시스템을 구축하기에는 많은 시간적 비용과 물질적 비용이 소모된다. 이를 보완하기 위해 사용자의 단말기로부터 실시간으로 수집한 교통 정보를 이용하여 강화학습기법을 적용한다. 강화학습의 목표는 환경 내에서의 에이전트가 행동에 대한 보상의 총합을 최대화 하는 것이다. 본 논문에서는 실시간으로 사용자의 단말기로부터 획득한 교통 정보를 이용하여 강화학습기법을 적용하고, 최단경로탐색 알고리즘을 분석하여 비교한다.

대학생의 자기주도성, 학습몰입, 진로결정효능감과 진로탐색행동 간의 관계 구조분석 (The Analysis on the Causal Model between Self-directedness, Learning Flow, Career Decision and Self-efficacy, and Career Exploration Behavior of Undergraduate Students)

  • 강명숙;방은령
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제20권4호
    • /
    • pp.443-467
    • /
    • 2014
  • 본 연구는 대학생을 대상으로 자기주도성, 학습몰입, 진로결정효능감과 진로탐색행동 간의 관계 구조를 검증하고자 하였다. 이를 위하여 남녀 대학생 604명을 대상으로 자기보고식 설문조사를 하였고, 구조방정식을 활용하여 자료를 분석하였다. 본 연구의 주요결과는 다음과 같다. 첫째, 학습몰입과 진로결정효능감은 진로탐색행동에 긍정적인 영향을 미치는 선행변인으로 밝혀졌으나, 자기주도성이 진로탐색행동에 미치는 직접적인 영향은 유의하지 않은 것으로 나타났다. 둘째, 자기주도성은 학습몰입과 진로결정효능감에 긍정적인 영향을 미치는 것으로 나타났다. 셋째, 진로결정효능감과 학습몰입은 자기주도성과 진로탐색행동의 관계를 완전 매개함으로써 자기주도성이 진로탐색행동에 간접적인 영향을 미치는 것으로 나타났다. 특정간접효과(specific indirect effect)의 크기를 검토하였을 때, 자기주도성의 간접효과는 진로결정효능감을 매개하는 경로가 학습몰입을 매개하는 경로보다 진로탐색행동에 미치는 영향력이 더 큰 것으로 밝혀졌다. 이러한 결과를 토대로 대학생의 진로탐색행동을 증진시키기 위한 논의와 후속연구를 위한 제언이 이루어졌다.

  • PDF

벡터양자화기의 코드북을 구하는 새로운 고속 학습 알고리듬 (A New Fast Training Algorithm for Vector Quantizer Design)

  • 이대룡;백성준;성굉모
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.107-112
    • /
    • 1996
  • 본 논문에서는 코드북 학습 알고리듬의 대표적인 LBG 알고리듬의 탐색시간을 줄이기 위한 새로운 고속 학습 알고리듬을 제안한다. 제안한 알고리듬은 각 학습데이타가 모든 코드워드를 탐색하지 않고, 먼저 첫 번째 단계에서 각 학습데이타의 주위에 있는 일정한 개수의 코드워드에 대한 인덱스(index) 정보를 저장하고, 다음 단계에서부터는 이 인덱스가 가리키는 코드워드만을 탐색대상으로 함으로써 학습시간을 줄이는 것이다. 제안한 알고리듬을 기존의 고속 탐색 알고리듬인 FSLBG 알고리듬과 비교하면 제안한 알고리듬이 더 짧은 학습시간으로 더 좋은 성능을 갖는 코드북을 얻을 수 있음을 보인다. 또한 제안한 알고리듬을 LBG 알고리듬과 비교하면 영상데이타에 대해 코드북의 크기가 256인 경우에는 약 6%, 코드북의 크기가 1024인 경우에는 약 1.6%인 16개의 코드워드만을 탐색대상으로 해서 PSNR(peak signal-to-noise ratio)면에서 거의 성능이 같은 코드북을 생성할 수 있음을 보이고 있다.

  • PDF

학습에의한 진화전략의 수렴성에 관한연구 (A Study on the Convergence of the Evolution Strategies based on Learning)

  • 심귀보
    • 한국지능시스템학회논문지
    • /
    • 제9권6호
    • /
    • pp.650-656
    • /
    • 1999
  • 본논문에서는 라마르크 진화와 볼드윈 효과를 진화전략에 적용하여 진화전략의 수렴성에 대해서 고찰한다. 또한 진화전략의 탐색법으로 랜덤 지역탐색법과 강화 지역 탐색법을 제안한다. 랜덤지역탐색은 미리 정한 일정한 회수의 지역탐색을 랜덤하게 수행하는 것이고 강화 지역탐색은 주어진 범위내에 존재하는 모든개체의 적합도를 평가하여 가장 적합도가 높은 개체 주변을 탐색하는 것이다. 이러한 관점에서 라마르크 진화와 볼드윈 효과를 기본으로 하는 강화 지역탐색은 단순히 랜덤하게 주변개체의 적합도를 탐색하는 것이 아니라 해 공간상에서 적합도가 높아지는 방향으로 지역 탐색을 행함으로써 랜덤 지역탐색에 비해 보다 효과적으로 주변 개체를 탐색할 수 있어 전역적 탐색능력의 향상은 물론 수렴속도의 향상은 가져 올수 있었다. 결과적으로 진화과정에 학습을 도입함으로써 진화만으로 최적해를 탐색할때보다 그성능이 향상됨을 볼 수 있다, 제안한 방법은 다양한 함수최적화 문제에 적용하여 그 시뮬레이션을 통해 학습이 진화에 미치는 영향에 대해서 고찰한다.

  • PDF

유전자와 역전파 알고리즘을 이용한 효율적인 윤곽선 추출 (The Efficient Edge Detection using Genetic Algorithms and Back-Propagation Network)

  • 박찬란;이웅기
    • 한국정보처리학회논문지
    • /
    • 제5권11호
    • /
    • pp.3010-3023
    • /
    • 1998
  • 유전자 알고리즘은 염색체 집단을 이용하는 탐색이므로 전역적인 최적해의 탐색 성능은 우수하여 최적해에 근접한 한점까지의 수렴속도는 빠르지만 탐색 메카니즘이 없기 때문에 최적해 근처의 탐색에서는 수렴 속도가 떨어지는 단점이 있고, 역전파 알고리즘은 개체 수준의 탐색이므로 지역적 미세조정의 탐색능력은 우수하지만 전역적 탐색기능이 없어 지역적 최적해로 수렴하는 경우가 있다. 본 논문에서는 수렴 속도가 향상된 윤곽선 추출을 위하여 유전자와 역전파 알고리즘을 병행해서 실행하는 윤곽선 추출방법을 제안하였다. 윤곽선 추출 방법은 먼저 유전자 알고리즘을 이용하여 최적의 연결강도와 오프셋 값을 계산한다. 다음으로 이 값을 역전파 학습 알고리즘 학습의 파라미터의 초기값으로 한 반복 학습으로 최적의 윤곽선 구조를 추출하였다. 제안된 알고리즘은 유전자 알고리즘 또는 역전파 알고리즘 단독으로 실행한 경우보다 수렴속도가 향상된 결과를 보여 주었다.

  • PDF

ICT 활용 교수-학습 유형 중 정보 탐색 및 분석 학습에 대한 평가 모형 연구 (A Research on Evaluation Model for information Search and Analysis Learning in Teaching and Learning using ICT)

  • 안성훈;최숙영
    • 한국콘텐츠학회논문지
    • /
    • 제3권3호
    • /
    • pp.1-10
    • /
    • 2003
  • 본 논문에서는 ICT를 활용한 교수 학습에서 효과적으로 이용될 수 있는 평가 모형과 평가 방법들을 연구하였다. ICT를 활용한 교수 학습의 유형에는 정보 탐색하기, 정보분석하기, 정보 안내하기, 협력 연구하기, 전문가와 교류하기, 웹 토론하기, 웹 펜팔하기, 정보 만들기 등의 8가지 유형이 있는데 그 중 가장 많이 활용되고 있는 정보 탐색하기와 정보 분석하기 유형에 대한 평가 모형과 평가 방법을 제시하였다. 현재 ICT활용 수업에서 평가 모형과 방법에 대한 선행연구가 없기 때문에 본 논문에서 제시한 평가 방안은 ICT활용 교수학습의 효과를 높이는데 기여할 것이다.

  • PDF

R-CORE를 통한 베이지안 망 구조 학습의 탐색 공간 분석 (Search Space Analysis of R-CORE Method for Bayesian Network Structure Learning and Its Effectiveness on Structural Quality)

  • 정성원;이도헌;이광형
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.572-578
    • /
    • 2008
  • 본 논문에서는 대규모 베이지안 망 구조 학습을 위해 제안되었던 R-CORE 방법의 탐색 공간의 크기에 대한 개략적인 분석과 실제 문제에 적용하였을 경우의 효과에 대한 실험적 결과를 제시한다. R-CORE 방법은 베이지안 망 구조 학습의 탐색 공간을 축소하기 위해 제안된 확률변수들의 재귀적 군집화와 오더 제한 방법이다. 알려진 벤치마크 베이지안 망을 이용한 분석을 통해, 제안되었던 R-CORE 방법이 worst case에는 기존의 방법과 유사한 탐색 공간을 가지나 평균적으로 기존방법보다 훨씬 적은 탐색 공간만을 고려한다는 것을 보인다. 또한 평균적으로 훨씬 적은 탐색 공간만을 고려하는 결과, 구조 탐색에서 기존 방법에 비해 상대적으로 적은 overfitting이 일어남을 실험적으로 보인다.