• 제목/요약/키워드: Reinforcement methods

검색결과 991건 처리시간 0.028초

An autonomous radiation source detection policy based on deep reinforcement learning with generalized ability in unknown environments

  • Hao Hu;Jiayue Wang;Ai Chen;Yang Liu
    • Nuclear Engineering and Technology
    • /
    • 제55권1호
    • /
    • pp.285-294
    • /
    • 2023
  • Autonomous radiation source detection has long been studied for radiation emergencies. Compared to conventional data-driven or path planning methods, deep reinforcement learning shows a strong capacity in source detection while still lacking the generalized ability to the geometry in unknown environments. In this work, the detection task is decomposed into two subtasks: exploration and localization. A hierarchical control policy (HC) is proposed to perform the subtasks at different stages. The low-level controller learns how to execute the individual subtasks by deep reinforcement learning, and the high-level controller determines which subtasks should be executed at the current stage. In experimental tests under different geometrical conditions, HC achieves the best performance among the autonomous decision policies. The robustness and generalized ability of the hierarchy have been demonstrated.

고속 발사체 충격을 받은 시멘트 복합체의 철근보강에 따른 파괴 특성에 관한 실험적 연구 (Experimental study on fracture properties with re-bar reinforcement of cement composite subjected to impact of high-velocity projectile)

  • 석원균;김규용;남정수;이예찬;전현수;김영선
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2022년도 봄 학술논문 발표대회
    • /
    • pp.220-221
    • /
    • 2022
  • With reent changes in energy sources, infrastructure facilities for energy charging are increasing around living areas. The infrastructure facilities have a slight possibility of explosion, and for this research on protection is needed. In this study, the performance of the reinforcement type is reviewed by examining the destructive properties after applying the impact by the high-velocity projectile to the cement composite to which various reinforcement methods are applied.

  • PDF

철골 시스템보강의 가새 형태에 따른 학교건축물의 내진성능특성 분석 (Analysis of Seismic Performance Characteristics for School Buildings on the Bracing Configuration of Steel Frame System Reinforcement)

  • 김호수;김소연
    • 한국공간구조학회논문집
    • /
    • 제23권4호
    • /
    • pp.59-69
    • /
    • 2023
  • Recently, the occurrence frequency of earthquake has increased in Korea, and the interests for seismic reinforcement of existing school buildings have been raised. To this end, the seismic performance evaluations for school buildings that did not accomplish the seismic design are required. In particular, this study checks the eigenvalue analysis, pushover curves, maximum base shears, performance points and story drift ratios, and then analyzes the seismic performance characteristics according to bracing configuration of steel frame system reinforcement. Also, this study presents the practical field application methods through the comparison of analysis results for the seismic performance characteristics.

Design of geocell reinforcement for supporting embankments on soft ground

  • Latha, G. Madhavi
    • Geomechanics and Engineering
    • /
    • 제3권2호
    • /
    • pp.117-130
    • /
    • 2011
  • The methods of design available for geocell-supported embankments are very few. Two of the earlier methods are considered in this paper and a third method is proposed and compared with them. In the first method called slip line method, plastic bearing failure of the soil was assumed and the additional resistance due to geocell layer is calculated using a non-symmetric slip line field in the soft foundation soil. In the second method based on slope stability analysis, general-purpose slope stability program was used to design the geocell mattress of required strength for embankment. In the third method proposed in this paper, geocell reinforcement is designed based on the plane strain finite element analysis of embankments. The geocell layer is modelled as an equivalent composite layer with modified strength and stiffness values. The strength and dimensions of geocell layer is estimated for the required bearing capacity or permissible deformations. These three design methods are compared through a design example. It is observed that the design method based on finite element simulations is most comprehensive because it addresses the issue of permissible deformations and also gives complete stress, deformation and strain behaviour of the embankment under given loading conditions.

커리큘럼 기반 심층 강화학습을 이용한 좁은 틈을 통과하는 무인기 군집 내비게이션 (Collective Navigation Through a Narrow Gap for a Swarm of UAVs Using Curriculum-Based Deep Reinforcement Learning)

  • 최명열;신우재;김민우;박휘성;유영빈;이민;오현동
    • 로봇학회논문지
    • /
    • 제19권1호
    • /
    • pp.117-129
    • /
    • 2024
  • This paper introduces collective navigation through a narrow gap using a curriculum-based deep reinforcement learning algorithm for a swarm of unmanned aerial vehicles (UAVs). Collective navigation in complex environments is essential for various applications such as search and rescue, environment monitoring and military tasks operations. Conventional methods, which are easily interpretable from an engineering perspective, divide the navigation tasks into mapping, planning, and control; however, they struggle with increased latency and unmodeled environmental factors. Recently, learning-based methods have addressed these problems by employing the end-to-end framework with neural networks. Nonetheless, most existing learning-based approaches face challenges in complex scenarios particularly for navigating through a narrow gap or when a leader or informed UAV is unavailable. Our approach uses the information of a certain number of nearest neighboring UAVs and incorporates a task-specific curriculum to reduce learning time and train a robust model. The effectiveness of the proposed algorithm is verified through an ablation study and quantitative metrics. Simulation results demonstrate that our approach outperforms existing methods.

강화학습에 의해 학습된 기는 로봇의 성능 비교 (Performance Comparison of Crawling Robots Trained by Reinforcement Learning Methods)

  • 박주영;정규백;문영준
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.33-36
    • /
    • 2007
  • 최근에 인공지능 분야에서는, 국내외적으로 강화학습(reinforcement learning)에 관한 관심이 크게 증폭되고 있다. 강화학습의 최근 경향을 살펴보면, 크게 가치함수를 직접 활용하는 방법(value function-based methods), 제어 전략에 대한 탐색을 활용하는 방법(policy search methods), 그리고 액터-크리틱 방법(actor-critic methods)의 세가지 방향으로 발전하고 있음을 알 수 있다. 본 논문에서는 이중 세 번째 부류인 액터-크리틱 방법 중 NAC(natural actor-critic) 기법의 한 종류인 RLS-NAC(recursive least-squares based natural actor-critic) 알고리즘을 다양한 트레이스 감쇠계수를 사용하여 연속제어입력(real-valued control inputs)으로 제어되는 Kimura의 기는 로봇에 대해 적용해보고, 그 성능을 기존의 SGA(stochastic gradient ascent) 알고리즘을 이용하여 학습한 경우와 비교해보도록 한다.

  • PDF

Kernel-based actor-critic approach with applications

  • Chu, Baek-Suk;Jung, Keun-Woo;Park, Joo-Young
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제11권4호
    • /
    • pp.267-274
    • /
    • 2011
  • Recently, actor-critic methods have drawn significant interests in the area of reinforcement learning, and several algorithms have been studied along the line of the actor-critic strategy. In this paper, we consider a new type of actor-critic algorithms employing the kernel methods, which have recently shown to be very effective tools in the various fields of machine learning, and have performed investigations on combining the actor-critic strategy together with kernel methods. More specifically, this paper studies actor-critic algorithms utilizing the kernel-based least-squares estimation and policy gradient, and in its critic's part, the study uses a sliding-window-based kernel least-squares method, which leads to a fast and efficient value-function-estimation in a nonparametric setting. The applicability of the considered algorithms is illustrated via a robot locomotion problem and a tunnel ventilation control problem.

운영 중인 철도노반 보강을 위한 그라우팅 성능 (Grouting Performance for the Reinforcement of Operating Railway Roadbed)

  • 정혁상;한진규;문준식;윤환희
    • 한국지반환경공학회 논문집
    • /
    • 제18권12호
    • /
    • pp.13-23
    • /
    • 2017
  • 본 논문에서는 운영 중인 철도노반의 침하에 대응하고자 노반보강 재료와 공법에 대한 내용을 다루었다. 국내에서는 도시철도와 고속철도, 그리고 일반철도에 콘크리트궤도가 도입되고 있지만 최근 시공된 일부구간에서 콘크리트궤도의 노반침하가 발생되고 있고, 유지보수에 어려움을 겪고 있는 실정이다. 철도 안전운행을 위해 침하된 철도노반의 보강이 시급하지만 현재까지 운영중인 철도노반의 보강에 대한 시공사례는 전무한 상태로서 노반 보강에 어려움이 있다. 따라서 본 연구에서는 최초로 시도되는 운영 중인 철도노반을 보강하기 위해 지반보강 재료들을 통해 노반 보강의 목표성능을 선정하였고, 이에 침투성능 및 고결성 주입효과 등을 확인하여 목표성능의 만족여부를 판단하였다. 연구 결과 일반적으로 쓰이는 지반보강재료 및 공법들은 철도노반 보강의 적용을 위해 개선이 필요하다는 것이 확인되었다.

긴급시공이 가능한 FRP 내진보강재 개발 및 최적 보강량 산정을 위한 해석적 연구 (Analytical Study for Optimal Reinforcement Amount and Development of FRP Seismic Reinforcement that can be Emergency Construction)

  • 김진섭;권민호;서현수;임정희;김동영
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제17권5호
    • /
    • pp.136-145
    • /
    • 2013
  • 최근 발생한 대규모 지진으로 구조물의 내진보강에 대한 사회적 관심도가 높아지고 있다. 특히 내진 설계가 반영되지 않은 기둥은 취성적인 파괴로 구조물 전체붕괴를 유발하기 때문에 내진보강이 적용 되어야한다. 과거에는 단면증설법, 강판보강법등이 주로 적용되었고 최근에는 복합재료의 장점을 이용한 섬유보강법이 선호되고 있다. 그러나 이러한 보강법들은 구조물의 물리적 손상을 유발하며, 작업공간과 시간소비가 크다는 단점이 있다. 본 연구에서는 기존 보강법의 단점을 보강하여 복합재료 (Fiber reinforced polymer)와 Aluminum 체결부 이용한 FRP 내진보강재를 개발하였다. 비선형 유한요소 해석프로그램을 통해 개발된 FRP 내진보강재의 최적 보강량을 결정하였다.

신장형 띠형 보강재의 형상에 따른 인발저항 및 시공성능 평가 실험 연구 (The Evaluation of Pullout Resistance and Installation Damage according to the Shape of Flexible Strip Reinforcement)

  • 정재형;김재홍
    • 지질공학
    • /
    • 제31권3호
    • /
    • pp.321-332
    • /
    • 2021
  • 최근 새로운 개념의 보강토 옹벽이 많이 개발되고 있으나, 개발된 보강재에서 발생되는 시공과정에서 문제나 붕괴와 같은 문제의 연구는 부족한 실정이다. 이에 본 연구에서는 신장형 띠형 보강재의 형상에 따른 현장 적용성을 인발저항시험과 내시공성시험으로 평가하고자 하였다. 시험체는 일반적인 신장형 띠형 보강재, 돌기가 부착된 개발된 신장형 띠형 보강재, 지오그리드를 절단하여 만든 띠형 보강재를 사용하여, 신장형 띠형 보강재 형상의 차이에 대한 기초적인 연구를 수행하고 각 보강재료의 장단점을 비교하였다. 연구 결과로서 보강재의 형상에 따른 장·단점을 명확하게 가지고 있는 것으로 나타났으며, 보강토 옹벽의 설치 조건과 뒤채움재의 입도를 고려하여 선택한다면 최선의 보강재를 선택할 수 있을 것으로 나타났다.