• 제목/요약/키워드: Simulation Learning

검색결과 1,827건 처리시간 0.025초

강화학습 기반 수평적 파드 오토스케일링 정책의 학습 가속화를 위한 전이학습 기법 (Transfer Learning Technique for Accelerating Learning of Reinforcement Learning-Based Horizontal Pod Autoscaling Policy)

  • 장용현;유헌창;김성석
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권4호
    • /
    • pp.105-112
    • /
    • 2022
  • 최근 환경의 변화에 적응적이고 특정 목적에 부합하는 오토스케일링 정책을 만들기 위해 강화학습 기반 오토스케일링을 사용하는 연구가 많이 이루어지고 있다. 하지만 실제 환경에서 강화학습 기반 수평적 파드 오토스케일러(HPA, Horizontal Pod Autoscaler)의 정책을 학습하기 위해서는 많은 비용과 시간이 요구되며, 서비스를 배포할 때마다 실제 환경에서 강화학습 기반 HPA 정책을 처음부터 다시 학습하는 것은 실용적이지 않다. 본 논문에서는 쿠버네티스에서 강화학습 기반 HPA를 구현하고, 강화학습 기반 HPA 정책에 대한 학습을 가속화하기 위해 대기행렬 모델 기반 시뮬레이션을 활용한 전이 학습 기법을 제안한다. 시뮬레이션을 활용한 사전 학습을 수행함으로써 실제 환경에서 시간과 자원을 소모하며 학습을 수행하지 않아도 시뮬레이션 경험을 통해 정책 학습이 이루어질 수 있도록 하였고, 전이 학습 기법을 사용함으로써 전이 학습 기법을 사용하지 않았을 때보다 약 42.6%의 비용을 절감할 수 있었다.

경영 시뮬레이션 게임에서 PPO 알고리즘을 적용한 강화학습의 유용성에 관한 연구 (A Study about the Usefulness of Reinforcement Learning in Business Simulation Games using PPO Algorithm)

  • 양의홍;강신진;조성현
    • 한국게임학회 논문지
    • /
    • 제19권6호
    • /
    • pp.61-70
    • /
    • 2019
  • 본 논문에서는 경영 시뮬레이션 게임 분야에서 강화학습을 적용하여 게임 에이전트들이 자율적으로 주어진 목표를 달성하는지를 확인하고자 한다. 본 시스템에서는 Unity Machine Learning (ML) Agent 환경에서 PPO (Proximal Policy Optimization) 알고리즘을 적용하여 게임 에이전트가 목표를 달성하기 위해 자동으로 플레이 방법을 찾도록 설계하였다. 그 유용성을 확인하기 위하여 5가지의 게임 시나리오 시뮬레이션 실험을 수행하였다. 그 결과 게임 에이전트가 다양한 게임 내 환경 변수의 변화에도 학습을 통하여 목표를 달성한다는 것을 확인하였다.

스마트 제어알고리즘 개발을 위한 강화학습 리워드 설계 (Reward Design of Reinforcement Learning for Development of Smart Control Algorithm)

  • 김현수;윤기용
    • 한국공간구조학회논문집
    • /
    • 제22권2호
    • /
    • pp.39-46
    • /
    • 2022
  • Recently, machine learning is widely used to solve optimization problems in various engineering fields. In this study, machine learning is applied to development of a control algorithm for a smart control device for reduction of seismic responses. For this purpose, Deep Q-network (DQN) out of reinforcement learning algorithms was employed to develop control algorithm. A single degree of freedom (SDOF) structure with a smart tuned mass damper (TMD) was used as an example structure. A smart TMD system was composed of MR (magnetorheological) damper instead of passive damper. Reward design of reinforcement learning mainly affects the control performance of the smart TMD. Various hyper-parameters were investigated to optimize the control performance of DQN-based control algorithm. Usually, decrease of the time step for numerical simulation is desirable to increase the accuracy of simulation results. However, the numerical simulation results presented that decrease of the time step for reward calculation might decrease the control performance of DQN-based control algorithm. Therefore, a proper time step for reward calculation should be selected in a DQN training process.

강화 및 진화 학습 기능을 갖는 에이전트 기반 함정 교전 시뮬레이션 (The Battle Warship Simulation of Agent-based with Reinforcement and Evolutionary Learning)

  • 정찬호;박철영;지승도;김재익
    • 한국시뮬레이션학회논문지
    • /
    • 제21권4호
    • /
    • pp.65-73
    • /
    • 2012
  • 함정 전투체계는 무기체계, 정보통신 등의 기술 발전으로 인한 복잡한 전장 환경에 따라 인간이 개입하여 다양한 전술을 운용해야 한다. 따라서 에이전트 기반의 국방 M&S 시스템의 연구가 최근 들어 활발히 진행되고 있다. 그러나 현존하는 에이전트 기반 M&S 시스템은 고정된 전술을 적용하여 분석하는데 그치고 있다. 본 논문에서는 함정 교전에서 보다 적합한 대응을 찾기 위해 환경변화에 능동적으로 대처할 수 있도록 강화 학습 기능을 갖으며, 또한 유전 알고리즘을 이용하여 세대별 진화 학습 기능을 갖는 에이전트 모델링 방법론을 제안하였다. 타당성 검증을 위해 서해상에서 벌어지는 가상의 1:1 함정교전 시뮬레이션을 수행하였고, 이를 통해 함정 교전에 있어 강화 및 진화 학습이 가능함을 검증하였다.

문제중심학습 기반 가상현실 시뮬레이션 교육이 간호대학생의 비판적 사고능력, 문제해결능력 및 자기효능감에 미치는 효과: 유사실험 연구 (Effects of a virtual reality simulation integrated with problem-based learning on nursing students' critical thinking ability, problem solving ability, and self-efficacy: a non-randomized trial)

  • 송영아;김민경
    • 여성건강간호학회지
    • /
    • 제29권3호
    • /
    • pp.229-238
    • /
    • 2023
  • Purpose: This study analyzed the effects of virtual reality simulation-based problem-based learning on nursing students' critical thinking ability, problem-solving ability, and self-efficacy in the nursing care of women undergoing induction of labor. Methods: A nonequivalent control group pretest and posttest design was employed. The study participants included 52 nursing students (24 in the experimental group and 28 in the control group). The experimental group took a problem-based learning (PBL) class in the first week, and then engaged in self-directed learning using virtual reality simulation. In the second week, lectures about emergency nursing care for induction of labor and drug administration were given. The control group participated in PBL in the first week and lectures in the second week. The study was conducted from April 17 to May 19, 2023. Data were analyzed using the chi-square test, Fisher exact test, analysis of variance, and the independent t-test. Results: Before-and-after differences between the two groups were statistically significant in problem solving ability (t=-5.47, p<.001) and self-efficacy (t=-5.87, p<.001). Critical thinking ability did not show a statistically significant difference between the two groups. The score for satisfaction with the virtual reality simulation program was 3.64±5.88 out of 5 in the experimental group. Conclusion: PBL education using a virtual reality simulation was found to be an effective way of teaching. Although convenience sampling was used, PBL education using virtual reality can be used as an educational strategy to enhance nursing students' problem-solving ability and self-efficacy.

시뮬레이션 교육이 간호대학생의 의사소통능력, 학습자기효능감, 임상추론역량에 미치는 효과 (Effects of Simulation Training on Communication Ability, Learning Self-Efficacy and Clinical Reasoning among Nursing Students)

  • 이지영;김경희
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.353-361
    • /
    • 2024
  • 시뮬레이션 교육은 현장감있는 모의 상황에서 학습자가 반복적으로 학습하도록 하는 방법으로 직접간호 수행이 부족한 임상실습의 한계를 해결하여 간호대학생에게 필요한 의사소통능력, 학습자기효능감, 임상추론역량을 습득하고 개발하는 데 유용하다. 본 연구는 고충실도 시뮬레이터를 활용한 시뮬레이션 교육이 간호대학생의 의사소통능력, 학습자기효능감, 임상추론역량에 미치는 효과와 시뮬레이션 교육 효과성을 확인하기 위해 실시되었다. 연하곤란 대상자 간호 시나리오를 활용한 시뮬레이션 교육에 참여한 일개대학 간호학과 4학년 학생 84명의 자료를 SPSS/WIN 22.0 프로그램을 이용하여 분석하였다. 연구 결과 시뮬레이션 교육 후 의사소통능력, 학습자기효능감, 임상추론역량은 유의하게 증가하였으며, 시뮬레이션 교육 효과성은 2.64점(3점 만점)이었다. 따라서 간호대학생의 의사소통능력, 학습자기효능감, 임상추론역량 증진을 위해서 다양한 임상현장을 반영하여 실재감있는 시나리오의 개발 및 적용이 필요하다.

이족 보행 로봇의 반복 걸음새 제어를 위한 학습 제어기 (A Learning Controller for Repetitive Gate Control of Biped Walking Robot)

  • 임동철;국태용
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.538-538
    • /
    • 2000
  • This paper presents a learning controller for repetitive gate control of biped robot. The learning control scheme consists of a feedforward learning rule and linear feedback control input for stabilization of learning system. The feasibility of teaming control to biped robotic motion is shown via dynamic simulation with 12 dof biped robot.

  • PDF

LMS 기반의 가상 시뮬레이션 데이터 요소 (The Virtual Simulation Data Element based on LMS)

  • 오상훈;손남례
    • 디지털융복합연구
    • /
    • 제4권1호
    • /
    • pp.17-30
    • /
    • 2006
  • Recently, Modeling and Simulation, which have been received attention in various in dustries such as national defence, eduction and entertainment, have been researched, and related applications have been developed actively. Especially, it is focused on the to chnology of a virtual reality and a virtual simulation which represents the implementation technology for the simulation education related to the e-Learning industry. However, a solution is needed to fulfill the lack of technology and research about standardize d data elements which could be applied to virtual simulation technologies in common. Therefore, this article suggests the virtual simulation data elements to increase the educational effect of a virtual simulation and interoperability of data among LMS through reference to korean and international standards and the result of related area analysis. In other words, this article aims to define the expression of data element and to propose the guideline elements in the virtual simulation scope.

  • PDF

강화학습을 이용한 이종 장비 토목 공정 계획 (Earthwork Planning via Reinforcement Learning with Heterogeneous Construction Equipment)

  • 지민기;박준건;김도형;정요한;박진규;문일철
    • 한국시뮬레이션학회논문지
    • /
    • 제27권1호
    • /
    • pp.1-13
    • /
    • 2018
  • 토목 공정 계획은 건설 공정 관리에서 중요한 과제 중 하나이다. 수학적 방법론에 기반을 둔 최적화 기법, 휴리스틱에 기반을 둔 최적화 기법 그리고 행위자 기반의 시뮬레이션 등의 방법론이 건설 공정 관리를 위해 적용되어왔다. 본 연구에서는 가상의 토목 공정 환경을 개발하고, 가상의 토목 공정 환경에서 강화학습을 이용한 시뮬레이션을 통해 토목 공정의 최적 경로를 찾는 방법을 제안하였다. 강화학습에 있어 본 연구에서는 상호작용 하며 서로 다른 행동을 하는 굴삭기와 트럭 에이전트들 에 대해 순차적 학습과 독립적 학습에 기반을 둔 두 가지의 Markov decision process (MDP)를 사용하였다. 가상의 토목 공정 환경에서 두 가지 방법 모두 최적에 가까운 토목 공정 계획을 만들어 낼 수 있음을 시뮬레이션 결과에 따라 알 수 있었으며, 이 계획은 건설 자동화의 기초가 될 수 있을 것이다.

무작위 생성 심층신경망 기반 유기발광다이오드 흑점 성장가속 전산모사를 통한 소자 변수 추출 (Extraction of the OLED Device Parameter based on Randomly Generated Monte Carlo Simulation with Deep Learning)

  • 유승열;박일후;김규태
    • 반도체디스플레이기술학회지
    • /
    • 제20권3호
    • /
    • pp.131-135
    • /
    • 2021
  • Numbers of studies related to optimization of design of organic light emitting diodes(OLED) through machine learning are increasing. We propose the generative method of the image to assess the performance of the device combining with machine learning technique. Principle parameter regarding dark spot growth mechanism of the OLED can be the key factor to determine the long-time performance. Captured images from actual device and randomly generated images at specific time and initial pinhole state are fed into the deep neural network system. The simulation reinforced by the machine learning technique can predict the device parameters accurately and faster. Similarly, the inverse design using multiple layer perceptron(MLP) system can infer the initial degradation factors at manufacturing with given device parameter to feedback the design of manufacturing process.