• 제목/요약/키워드: 관계형 강화 학습

검색결과 20건 처리시간 0.021초

효율적인 관계형 강화학습을 위한 사전 영역 지식의 활용 (Using Prior Domain Knowledge for Efficient Relational Reinforcement Learning)

  • 강민교;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.483-486
    • /
    • 2021
  • 기존의 심층 강화학습은 상태, 행동, 정책 등을 모두 벡터 형태로 표현하는 강화학습으로서, 학습된 정책의 일반성과 해석 가능성에 제한이 있고 영역 지식을 학습에 효과적으로 활용하기도 어렵다는 한계성이 있다. 이러한 문제점들을 해결하기 위해 제안된 새로운 관계형 강화학습 프레임워크인 dNL-RRL은 상태, 행동, 그리고 학습된 정책을 모두 논리 서술자와 규칙들로 표현할 수 있다. 본 논문에서는 dNL-RRL을 기초로 공장 내 운송용 모바일 로봇의 제어를 위한 행동 정책 학습을 수행하였으며, 학습의 효율성 향상을 위해 인간 전문가의 사전 영역 지식을 활용하는 방안들을 제안한다. 다양한 실험들을 통해, 본 논문에서 제안하는 영역 지식을 활용한 관계형 강화학습 방법의 학습 성능 개선 효과를 입증한다.

관계형 강화 학습을 위한 도메인 지식의 효과적인 활용 (Effective Utilization of Domain Knowledge for Relational Reinforcement Learning)

  • 강민교;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.141-148
    • /
    • 2022
  • 최근 들어 강화 학습은 심층 신경망 기술과 결합되어 바둑, 체스와 같은 보드 게임, Atari, StartCraft와 같은 컴퓨터 게임, 로봇 물체 조작 작업 등과 같은 다양한 분야에서 매우 놀라운 성공을 거두었다. 하지만 이러한 심층 강화 학습은 행동, 상태, 정책 등을 모두 벡터 형태로 표현한다. 따라서 기존의 심층 강화 학습은 학습된 정책의 해석 가능성과 일반성에 제한이 있고, 도메인 지식을 학습에 효과적으로 활용하기도 어렵다는 한계성이 있다. 이러한 한계점들을 해결하기 위해 제안된 새로운 관계형 강화 학습 프레임워크인 dNL-RRL은 센서 입력 데이터와 행동 실행 제어는 기존의 심층 강화 학습과 마찬가지로 벡터 표현을 이용하지만, 행동, 상태, 그리고 학습된 정책은 모두 논리 서술자와 규칙들로 나타내는 관계형 표현을 이용한다. 본 논문에서는 dNL-RRL 관계형 강화 학습 프레임워크를 이용하여 제조 환경 내에서 운송용 모바일 로봇을 위한 행동 정책 학습을 수행하는 효과적인 방법을 제시한다. 특히 본 연구에서는 관계형 강화 학습의 효율성을 높이기 위해, 인간 전문가의 사전 도메인 지식을 활용하는 방안들을 제안한다. 여러 가지 실험들을 통해, 본 논문에서 제안하는 도메인 지식을 활용한 관계형 강화 학습 프레임워크의 성능 개선 효과를 입증한다.

증강현실 조합형 마커시스템의 교육효과분석 (Analysis of Educational Effects in Augmented Reality Combined Marker System)

  • 고영남;김종우
    • 정보교육학회논문지
    • /
    • 제16권3호
    • /
    • pp.373-382
    • /
    • 2012
  • 컴퓨팅 기술발달에 따른 새로운 기술을 적용한 다양한 교육용 매체들이 개발되고 있다. 특히, 증강현실 콘텐츠는 학습자의 조작활동을 통한 3차원 입체영상을 제공하여 현실감 있는 정보 제공과 학습 경험을 확장시킬 수 있는 교육매체이다. 본 논문에서는 학습자의 직접적인 조작활동 강화 및 객체 간의 관계 탐구 향상을 위하여, 증강현실 콘텐츠를 증강현실 객체의 조합으로 구성하는 증강현실 조합형 마커시스템을 제작하였다. 교실수업에서 초등교과서 5학년 과학교과의 "지구와 달" 단원의 학습 콘텐츠로 사용하였으며, 학습자의 학습활동을 심층적으로 분석하였다. 개발된 증강현실 조합형 마커시스템을 활용한 수업은 학습자의 학습에 대한 자신감과 주의집중에 유의미한 영향을 주고 있으며, 내재적 만족도를 강화하였고, 특히 학습태도를 긍정적으로 변화시켜서 학업성취도의 주요 요소인 지식과 실천에 유의미한 영향을 주고 있다.

  • PDF

대학의 학생창업에 미치는 창업동아리의 역할

  • 원치운;배태준
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2019년도 추계학술대회
    • /
    • pp.87-93
    • /
    • 2019
  • 본 연구는 최근 창업에 대한 관심이 대학 내에서 확산되고 성공한 학생창업가들이 배출되고 있는 시점에서 대학 내 창업동아리 활동이 실제로 학생창업으로 이어지는지 국내 4년제 대학 169개를 대상으로 실증분석을 실시하였다. 대학의 창업동아리는 학생창업을 활성화하기 위한 방안으로써 정부와 대학은 매년 창업동아리에 필요한 예산과 교육 등 적극적인 지원을 하고 있지만 창업동아리 활동이 학생창업에 어떻게 영향을 미치는지 국내에서는 학술적으로 연구된 바가 극히 드물다. 이러한 이유로 본 연구에서는 대학의 창업동아리가 학생창업 증가에 미치는 영향을 분석하고자 한다. 구체적으로 선행연구에서 강조한 바와 같이 창업동아리 활동이 학생창업에 미치는 영향을 대학의 창업지원과 교육의 조절효과를 중심으로 실증분석 한다. 분석결과 첫째, 대학의 창업동아리가 실제로 학생창업에 정(+)의 영향을 미치는 것으로 나타났다. 이러한 결과는 창업동아리 활동이 활발한 대학일수록 학생창업이 많이 이루어진다는 것을 시사한다. 둘째, 학생 창업지원과 교육의 조절효과를 검증한 결과 대학의 실습형 창업강좌는 창업동아리 활동과 학생창업 간의 관계를 정(+)의 방향으로 조절한다는 증거가 발견되었다. 즉, 창업동아리 활동이 학생창업에 미치는 긍정적인 영향은 실습형 창업강좌의 비중이 높은 학교일수록 긍정적인 관계가 강화된다는 것을 의미한다. 이는 경험적 학습을 통한 동아리 활동과 실습형 교육 간 연계의 필요성을 강조한다. 따라서, 창업 동아리 활동을 통한 학생들의 창업활동을 분석함으로써 대학의 창업 동아리 활동의 효과를 증진시킬 수 있는 현실적인 대안을 제시하고자 한다. 본 연구의 결과는 대학 내 활발한 창업 동아리 활동의 질적 향상과 실제 창업 동아리 활동을 경험한 학생들이 창업으로 이루어질 수 있는 현실적인 창업 교육에 기여할 수 있는 것으로 기대된다.

  • PDF

중소벤처기업의 기술혁신역량, 협업, 신제품개발성과 간의 구조적 관계 분석 (An Analysis of Structural Relationship between Technological Innovation Capability, Collaboration and New Product Development Performance in Small & Mid-sized Venture Companies)

  • 이록
    • 벤처창업연구
    • /
    • 제15권1호
    • /
    • pp.185-195
    • /
    • 2020
  • 본 연구에서는 중소벤처기업의 기술혁신역량과 신제품개발성과가 상호 인과관계가 있음을 밝히고, 기술혁신역량을 강화하기 위한 수단으로 협업을 도입하면 신제품개발성과가 향상됨을 규명하였다. 연구방법으로는 국내 소재 중소벤처기업 R&D업무에 종사하는 실무담당자들을 대상으로 설문조사를 실시하였다. 연구결과, 중소 벤처기업의 기술혁신역량에 속하는 기술전략, 기술학습, 그리고 개방형 혁신이 신제품개발성과에 영향을 미치는 것으로 나타났다. 즉 신제품개발성과에 미치는 다수의 핵심전략으로서 협업을 선택한 결과, 협업이 신제품개발성과에 영향을 주는 전략임을 규명하였다. 아울러 협업을 도입하면 기술혁신역량이 신제품개발성과를 강화하는데 조절역할을 하는 지도 함께 살펴보았는데, 일반적인 협업은 기술전략 강화에는 직접적인 영향을 미치지 않지만, 협업에 따라서는 기술전략과 개방형 혁신이 강화되어 신제품개발성과의 크기에 긍정적인 영향을 주는 것으로 평가되었다.

방향 벡터를 이용한 다중에이전트 휴리스틱 (The multi agent control heuristic using direction vector)

  • 김현;이승관;정태충
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.525-528
    • /
    • 2004
  • 먹이추적문제(prey pursuit problem)는 가상 격자로 이루어진 공간 내에 다중의 에이전트를 이용하여 먹이를 포획하는 것이다. 에이전트들은 먹이를 포획하기 위해 $30{\times}30$으로 이루어진 격자공간 (gride)안에서 기존 제안된 지역 제어, 분산 제어, 강화학습을 이용한 분산 제어 전략들을 적용하여 먹이를 포획하는 전략을 구현하였다. 제한된 격자 공간은 현실세계를 표현하기에는 너무도 역부족이어서 본 논문에서는 제한된 격자공간이 아닌 현실 세계와 흡사한 무한 공간 환경을 표현하고자 하였다. 표현된 환경의 모델은 순환구조(circular)형 격자 공간이라는 새로운 실험 공간이며, 새로운 공간에 맞는 전략은 에이전트와 먹이와의 추적 관계를 방향 벡터를 고려한 모델로 구현하였다. 기존 실험과는 차별화 된 환경에서 에이전트들은 휴리스틱을 통한 학습을 할 수 있다는 가정과 먹이의 효율적 포획, 충돌문제 해결이라는 결과를 얻었다.

  • PDF

한국형 지역혁신모델의 신흥국 전수사업 : 정책분석과 제안 (Capacity Building Programs for Emerging Countries by the Korean Regional Innovation Model: Policy Analysis and Suggestions)

  • 김학민
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.75-82
    • /
    • 2018
  • 최근 신흥개발국들은 한국형 경제개발 정책에 관심을 갖고 한국의 지역혁신 모델을 접목하고자 노력하고 있다. 한국도 신흥국의 수요에 맞추어 지역혁신 모델을 수출하고 해당국과 경제협력을 강화하는데 관심이 있다. 본 연구는 신흥국에 대한 한국형 지역혁신모델 전수사업을 분석하고 정책을 제시하고자 한다. 이를 위해 태국, 키르키즈공화국, 베트남, 멕시코 등 신흥 4개국의 혁신기관 실무자들이 공동학습 - 네트워크- 상호작용 활동에 참여하는 행태를 표적집단면접법에 의해 분석하였다. 한국의 혁신기관에서 제공하는 전수사업에서 현지국가 혁신주체의 초기 활동을 분석한 결과, 전수사업의 연수 시간과 이후 현지인들에 의한 자체 공동학습 참여율의 관계는 가장 밀접한 상관관계 (0.975)가 있음을 발견하였다. 그러나 이들의 자체 공동학습과 현지의 네트워크 참여율의 상관계수는 다소 낮아 (0.667), 현지에서 공동학습을 네트워크로 연결하는 정책이 필요하다. 네트워크 참여율과 혁신주체의 상호작용 참여율은 높은 상관관계 (0.950)로 나타나, 네트워크 구축이 지역혁신 모델의 관건이라는 것을 보여준다. 본 연구는 교육과 컨설팅 형태의 연수보다는 현지의 혁신 네트워크 활동을 촉진하는 사업을 추천한다. 본 연구는 충남테크노파크의 사례와 같이 혁신주체들이 스스로 학습 네트워크를 구축하여 지역에 맞는 혁신모델을 창출하고 지역혁신플랫폼을 직접 운영하는 단계까지 추진하는 전수사업 정책을 제안한다.

예비교사를 위한 실감형 콘텐츠 활용 메타인지 학습전략 기반 화학 프로그램의 효과 및 관계성 분석 (Effectiveness and Relationship Analysis of Chemistry Programs Based on Metacognitive Learning Strategies Using Realistic Contents for Pre-service Teachers)

  • 이다은;김현경
    • 대한화학회지
    • /
    • 제67권4호
    • /
    • pp.271-280
    • /
    • 2023
  • 본 연구에서는 실감형 콘텐츠를 활용한 메타인지 학습전략 기반 화학 프로그램이 예비 교사의 창의적 사고역량 및 과학과 핵심 역량에 미치는 효과와 이에 대한 인식을 조사하는데 목적이 있다. 특히, 메타인지를 강화시키는 전략을 도입하여 프로그램의 효과를 더욱 향상시키고자 하였다. 참가자는 새로 개발한 화학 프로그램을 적용 받는 실험반과 실감형 콘텐츠와 메타인지 전략을 포함하지 않은 일반적인 수업을 적용 받는 전통반으로 분류하였다. 두 집단 모두에게 프로그램 적용 전과 적용 후 설문을 실시하여 메타인지 역량과 창의적 사고역량 및 과학과 핵심역량의 변화 정도를 측정하였다. 또한 메타인지 역량과 과학과 핵심역량이 창의력 사고역량에 미치는 영향에 대해 분석하였다. 연구 결과, 실험반의 메타인지 역량, 창의적 사고역량 하위요소 중 적절성과 합리성, 과학과 핵심 역량 중 과학적 참여 및 평생 학습 능력을 제외한 모든 하위요소가 유의하게 향상되었다. 또한 메타인지 역량 중 메타인지적 지식, 과학과 핵심역량 중 과학적 탐구능력과 과학적 사고력이 창의적 사고역량에 영향을 미친다는 결과가 도출되었다. 결과를 통해 창의력 사고역량의 향상을 위해 메타인지 학습전략을 접목시킨 실감형 콘텐츠 개발이 필요하며 이를 활용할 수 있는 학습모형 및 프로그램 개발이 필요하다는 시사점을 얻었다.

간호대학생의 메타인지, 학습 동기가 문제해결력에 미치는 영향요인 (Influencing Factors the Metacognition and Learning Motivation on Problem-Solving Ability in Nursing Students)

  • 김남영
    • 한국응용과학기술학회지
    • /
    • 제38권4호
    • /
    • pp.931-940
    • /
    • 2021
  • 본 연구는 간호대학생의 메타인지, 학습 동기가 문제해결력에 어떠한 영향을 주는지 확인하고, 이를 통해 간호대학생의 문제해결력을 효과적으로 강화할 수 있는 학습전략 마련에 기초자료를 제공하고자 시행되었다. 연구자료 수집을 위해, 2개 간호대학에 재학 중인 간호대학생 160명에게 2021년 1월 20일 부터 3월 10일까지 설문을 통해 조사한 후, SPSS/WIN 24.0 프로그램을 활용하여 통계로 분석하였다. 연구결과, 간호대학생의 문제해결력은 메타인지(r=.44, p<.001), 학습 동기(r=.45, p<.001)와 유의한 양의 상관관계가 있었다. 또한 간호대학생의 문제해결력에 영향을 주는 요인은 학습 동기, 메타인지 순으로 전체 설명력은 32%였다. 본 연구의 결과를 토대로, 간호대학생의 문제해결력을 증진할 수 있는 간호대학생 맞춤형 비교과 프로그램들이 개발·적용되기를 바란다.

작업 준비비용 최소화를 고려한 강화학습 기반의 실시간 일정계획 수립기법 (Real-Time Scheduling Scheme based on Reinforcement Learning Considering Minimizing Setup Cost)

  • 유우식;김성재;김관호
    • 한국전자거래학회지
    • /
    • 제25권2호
    • /
    • pp.15-27
    • /
    • 2020
  • 본 연구는 일정계획을 위한 간트 차트(Gantt Chart) 생성과정을 세로로 세우면 일자형만 존재하는 테트리스(Tetris) 게임과 유사하다는 아이디어에서 출발하였다. 테트리스 게임에서 X축은 M개의 설비(Machine)들이 되고 Y축은 시간이 된다. 모든 설비에서 모든 종류(Type)의 주문은 분리 없이 작업 가능하나 작업물 종류가 다를 경우에는 시간지체 없이 작업 준비비용(SetupCost)이 발생한다는 가정이다. 본 연구에서는 앞에서 설명한 게임을 간트리스(Gantris)라 명명하고 게임환경을 구현 하였으며, 심층 강화학습을 통해서 학습한 인공지능이 실시간 스케줄링한 일정계획과 인간이 실시간으로 게임을 통해 수립한 일정계획을 비교하였다. 비교연구에서 학습환경은 단일 주문목록 학습환경과 임의 주문목록 학습환경에서 학습하였다. 본 연구에서 수행한 비교대상 시스템은 두 가지로 4개의 머신(Machine)-2개의 주문 종류(Type)가 있는 시스템(4M2T)과 10개의 머신-6개의 주문종류가 있는 시스템(10M6T)이다. 생성된 일정계획의 성능지표로는 100개의 주문을 처리하는데 발생하는 Setup Cost, 총 소요 생산시간(makespan)과 유휴가공시간(idle time)의 가중합이 활용되었다. 비교연구 결과 4M2T 시스템에서는 학습환경에 관계없이 학습된 시스템이 실험자보다 성능지표가 우수한 일정계획을 생성하였다. 10M6T 시스템의 경우 제안한 시스템이 단일 학습환경에서는 실험자보다 우수한 성능 지표의 일정계획을 생성하였으나 임의 학습환경에서는 실험자보다 부진한 성능지표를 보였다. 그러나 job Change 횟수 비교에서는 학습시스템이 4M2T, 10M6T 모두 사람보다 적은 결과를 나타내어 우수한 스케줄링 성능을 보였다.