• Title/Summary/Keyword: 시간 스텝

Search Result 127, Processing Time 0.021 seconds

Max-Mean N-step Temporal-Difference Learning Using Multi-Step Return (멀티-스텝 누적 보상을 활용한 Max-Mean N-Step 시간차 학습)

  • Hwang, Gyu-Young;Kim, Ju-Bong;Heo, Joo-Seong;Han, Youn-Hee
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.10 no.5
    • /
    • pp.155-162
    • /
    • 2021
  • n-step TD learning is a combination of Monte Carlo method and one-step TD learning. If appropriate n is selected, n-step TD learning is known as an algorithm that performs better than Monte Carlo method and 1-step TD learning, but it is difficult to select the best values of n. In order to solve the difficulty of selecting the values of n in n-step TD learning, in this paper, using the characteristic that overestimation of Q can improve the performance of initial learning and that all n-step returns have similar values for Q ≈ Q*, we propose a new learning target, which is composed of the maximum and the mean of all k-step returns for 1 ≤ k ≤ n. Finally, in OpenAI Gym's Atari game environment, we compare the proposed algorithm with n-step TD learning and proved that the proposed algorithm is superior to n-step TD learning algorithm.

The Effects of Arm Restriction on Stabilization Step With Respect to Barrier Height (장애물 높이에 따른 상지 팔운동 제한이 스텝안정화(stabilization step)에 미치는 영향)

  • Kwon, Oh-Yun;Jang, Kyung-Wook;Kim, Tack-Hoon
    • Physical Therapy Korea
    • /
    • v.5 no.4
    • /
    • pp.1-8
    • /
    • 1998
  • 본 연구의 목적은 장애물 높이에 따른 상지 팔운동 제한이 스텝안정화(stabilization step)에 영향을 주는지 알아보기 위하여 실시하였다. 연구대상자는 대학생 남자 14명, 여자 16명으로 총 30명이였으며, 평균 연령은 21.5세이었다. 스텝 안정화는 FASTEX(functional activity System for testing and exercise, Cybex Division of Lumex, Inc., USA)를 이용하여 측정하였다. 장애물의 조건은 1) 장애물이 없는 조건 2) 15 cm 장애물 3) 25 cm 장애물이었고, 팔 운동의 제한 조건은 1) 팔운동을 제한하지 않은 조건 2) 우세 팔의 운동 제한 3) 양쪽 팔을 모두 제한하는 3개의 조건에서 스텝 안정화 시간을 측정하였다. 장애물 요인과 팔운동 제한 요인간에 안정화 시간(stabilization time)의 차이가 있는지 알아보기 위하여 반복이 있는 2요인 분산분석을 실시하였고, 남녀간에 안정화 시간에 차이가 있는지 알아보기 위하여 t-검정을 실시하였다. 장애물이 없는 조건에서 양팔의 운동을 제한하지 않고 측정한 안정화 시간의 평균은 0.89초이었고, 건측의 상지운동을 제한한 상태에서의 평균은 0.88초이었으며, 양쪽 팔의 운동을 모두 제한했을 때의 평균은 0.84초이었다. 15 cm의 장애물이 있는 조건에서 양팔의 운동을 제한하지 않고 측정한 안정화 시간은 평균 0.98초이었고, 건측의 상지운동을 제한한 상태에서의 펑균은 1.00초이었으며, 양쪽 팔의 운동을 모두 제한했을 때의 평균은 1.14초이었다. 25 cm의 장애물이 있는 조건에서 양팔의 운동을 제한하지 않고 측정한 안정화 시간은 평균 1.09초이었고, 건측의 상지운동을 제한한 상태에서의 평균은 1.28초이었으며, 양쪽 팔의 운동을 모두 제한했을 때의 평균은 1.57초이었다. 남녀간의 스텝 안정화 시간에 차이가 있는지 알아본 결과 각각의 조건에서 통계학적으로 유의한 차이가 없었다. 장애물과 팔운동 제한 조건에 따른 스텝 안정화 시간의 차이가 있는지 알아보기 위하여 반복이 있는 2요인 분산분석을 실시한 결과, 장애물의 높이에 따라 스텝 안정화 시간에는 유의한 차이가 있었고(p<0.05), 15 cm, 25 cm 장애물 조건에서는 팔운동 제한 조건에 따른 스텝 안정화 시간에도 유의한 차이가 있었지만(p<0.05), 장애물이 없는 조건에서는 팔운동 제한에 따른 안정화 시간에는 유의한 차이가 없었다. 이상의 결과는 보행중 장애물을 넘고, 한발로 기립하여 안정성을 유지할 때 팔의 운동이 스텝 안정성에 영향을 미친다는 것을 알았고, 이러한 결과는 한팔 또는 두 팔을 사용할 수 없는 편마비환자나 상지 절단환자의 균형 평가나 치료시 고려되어져야 할 것이다.

  • PDF

Variable Time Step Control for Six-Step Operation in IPMM (매입형 영구자석 전동기에서의 6-스텝 운전을 위한 가변시간제어)

  • Park, Jaeyong;Ha, Jung-Ik
    • Proceedings of the KIPE Conference
    • /
    • 2017.11a
    • /
    • pp.191-192
    • /
    • 2017
  • 본 6-스텝 운전은 하드웨어의 수정 없이 운전 영역을 확장할 수 있다는 장점을 가진다. 하지만, 샘플링 주파수 대비 기본파 주파수가 크면 저주파수 전류 맥동 문제가 발생한다. 이는 시스템의 효율을 낮추고 안정성 문제를 일으킨다. 따라서, 본 논문에서는 가변 시간 제어 방법을 제안한다. 선형화과정을 통해 정확한 전달 함수를 구하고, 이를 이용하여 추가적인 약 자속 제어기나 전류 지령 생성기 없이 6-스텝 운전을 구현 할 수 있다.

  • PDF

A Predicted Newton-Raphson Iterative Method utilizing Neural Network (신경회로망을 이용한 예측 뉴턴-랩손 반복계산기법)

  • Kim, Jong-Hoon;Kim, Yong-Hyup
    • Proceedings of the KSME Conference
    • /
    • 2000.04a
    • /
    • pp.339-344
    • /
    • 2000
  • Newton-Raphson 기법은 구조물의 비선형 해석에 널리 쓰이는 반복계산기법이다. 비선형 해석을 위한 반복계산기법은 컴퓨터의 발달을 감안해도 상당한 계산시간이 소요된다. 본 논문에서는 신경회로망 예측을 사용한 Predicted Newton-Raphson 반복계산기법을 제안하였다. 통상적인 Newton-Raphson 기법은 이전스텝에서 수렴된 점으로부터 현재 스텝의 반복계산을 시작하는 반면 제시된 방법은 현재 스텝 수렴해에 대한 예측점에서 반복계산을 시작한다. 수렴해에 대한 예측은 신경회로망을 사용하여 이전 스텝 수렴해의 과거경향을 파악한 후 구한다. 반복계산 시작점이 수렴점에 보다 근접하여 위치하므로 수렴속도가 빨라지게 되고 허용되는 하중스텝의 크기가 커지게 된다. 또한 반복계산의 시작점으로부터 이루어지는 계산과정은 통상적인 Newton-Raphson 기법과 동일하므로 기존의 Newton-Raphson 기법과 정확히 일치하는 수렴해를 구할 수 있다. 구조물의 정적 비선형 거동에 대한 수치해석을 통하여 modified Newton-Raphson 기법과 제시된 Predicted Newton=Raphson 기법의 정확성과 효율성을 비교하였다. 제시된 Predicted Newton-Raphson 기법은 modified Newton-Raphson 기법과 동일한 해를 산출하면서도 계산상의 효율성이 매우 큼을 확인할 수 있었다.

  • PDF

원자로 정지 관련 동적보상기의 응답시간 평가

  • 주운표;황희수;우숭웅;김건중
    • Proceedings of the Korean Nuclear Society Conference
    • /
    • 1996.05a
    • /
    • pp.309-314
    • /
    • 1996
  • 가압 경수로형 원전 안전정지/ 안전 주입 변수와 관련된 계기는 관련 기술 기준에 따라 정기 보수시 교정이 이루어지면, 정지 신호를 모의 주입하여 물리량 검출기로 부터 원자로 정지집계 권선의 풀림시간까지의 총 응답 시간이 사고해석시 가정된 계통의 응답 지연시간이내에 들어 있는 지를 확인한다. 이 정지 신호에 응답하는 동적 보상기의 특성과 관련하여 설계과정에서 삽입된 근사화 오차에 대한 정략적인 평가가 이미 알려진 바 있고, 시간 응답 측정시 삽입되는 지연 요소로 인한 오차도 이에 포함시켜 분석한 바 있어 실제 교정시 정밀도 향상을 위하여 활용하고 있다. 이 논문을 통하여 원자로 정지계통의 응답시간 측정시 노 냉각수 평균 온도 변화율 동적 보상 미분-지연 카드에 모의입력으로 스텝신호를 주입할 경우, 이를 과도하게 큰 신호로 인식하여 매우 짧은 시간(1초 이내)에 응답되고, 스텝신호대신 1%P.U./초로 평균온도 변화율만을 주입할 경우, 보다 늦게 응답됨을 밝혔다. 따라서 모의 시험 방범에 있어서 입력 선택을 적합하게 하여야만 계통의 건전성을 응답시간으로 확인한 수 있는 데, 이에 적합한 모의 입력 방법을 제안하였다.

  • PDF

Design of Impulse Generator using Transistor (트랜지스터를 이용한 임펄스 발생기 설계)

  • 이승식;김재영;이형수
    • The Journal of Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.14 no.11
    • /
    • pp.1121-1126
    • /
    • 2003
  • In this paper we show impulse generator which is important component in UWB communication. There is two steps to generate monocycle impulse. In first step, Gaussian pulse was made by operation of transistor switching and operation time of transistor switching. The second step the high pass filter change from Gaussian to Monocycle impulse. The result of this impulse generator is impulse whose pulse width is 0,9 ns in time domain and amplitude is +/-250 ㎷.

Variable Step Size Adaptive Algorithm using Instantaneous Absolute Value Based on System Generator (시스템 제너레이터 환경에서 순시 절대값을 이용한 가변스텝사이즈 적응알고리즘)

  • Lee, Chae-Wook;Ryu, Jeong-Tak
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.21 no.3
    • /
    • pp.1-6
    • /
    • 2016
  • As the convergence speed of time domain adaptive algorithm on the LMS(Least Mean Square) becomes slow when eigen value distribution width is spread, So variable step size algorithm is used widely. But it needs a lot of calculation load. In this paper we consider new algorithm, which can reduce calculations and improve convergence speed, uses instantaneous absolute value of average noise signal adapting the exponential function. For the performance of proposed algorithm is tested and simulated to system generator. As the result we show the variable step size adaptive algorithm in proportion to instantaneous absolute value is more stable and efficient than others.

Analysis of 3-Dimensional TLM for Step Discontinuity Microstrip Line (스텝 불연속 마이크로스트립 라인의 3차원 TLM 해석)

  • 김태원
    • Journal of the Korea Society of Computer and Information
    • /
    • v.8 no.2
    • /
    • pp.88-96
    • /
    • 2003
  • Microstrip line is one of the most essential elements of microwave and milimeter-wave integrated circuits. And then the frequency dependent characteristics of the microstrip line have previously been analyzed using several frequency domain approaches But the 3-D TLM method presented in this Paper is another independent approaches for obtaining frequency domain results for microstrip line. The structure analysed with this TLM algorithm is step discontinuity microstrip line and the symmetrical condensed node is used. After numerical analysis, the frequency dependent scattering Parameters of a step discontinuity microstrip line have been calculated by Fourier transform of the time domain data. From the time domain TLM numerical results. this numerical analysis is shown to be an efficient method for modelling complicated structure as step discontinuity microstrip line.

  • PDF

The optimal compensation gain algorithm using variable step for buck-type active power decoupling circuits (벅-타입 능동 전력 디커플링을 위한 가변 스텝을 적용한 최적 보상 이득 알고리즘)

  • Baek, Ki-Ho;Kim, Seung-Gwon;Park, Sung-Min
    • Proceedings of the KIPE Conference
    • /
    • 2017.11a
    • /
    • pp.177-178
    • /
    • 2017
  • 본 논문에서는 벅-타입 능동 전력 디커플링 회로의 단순화된 제어 방법을 위한 가변 스텝을 적용한 최적 보상 이득 알고리즘을 제안한다. 고정 스텝을 사용한 기존의 최적 보상 이득 알고리즘보다 유동적인 보상 이득 변화를 통해 DC링크 전압 리플을 효과적으로 줄일 수 있다. 기존의 방법보다 최적 보상 이득을 추적하는 시간이 줄어들어 갑작스런 부하 변동이나 이상 상황에 빠른 대응이 가능하다. 벅-타입 능동 전력 디커플링 회로는 전류 불연속 모드로 동작하며, 전류 지령치는 DC링크 전류의 1차 리플 성분에 전류 이득을 유동적으로 보상하여 생성하기 때문에 모든 구간에서 효과적으로 DC링크의 전압 리플을 줄일 수 있고 빠른 대응이 가능하다. 제안하는 가변 스텝을 적용한 최적 보상 알고리즘의 효과는 MATLAB-Simulink 시뮬레이션을 통해 검증하였다.

  • PDF

Performance of a Closed-Loop Power Control Using a Variable Step-size Control Scheme in a DS/CDMA LEO Mobile Satellite System (DS/CDMA 저궤도 이동 위성 시스템에서 가변 스텝사이즈 조절 방식 폐루프 전력제어의 성능분석)

  • 전동근;이연우;홍선표
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.1
    • /
    • pp.16-24
    • /
    • 2000
  • In this paper the performance of a closed-loop power control scheme using variable step size decision method for DS/CDMA based-low earth orbit(LEO) mobile satellite systems in which the long round trip delay is a dominant performance degradation factor is evaluated. Because there are fundamental differences in the characteristics between the LEO mobile satellite channel and terrestrial mobile channel, such as long round trip delay and different elevation angle, these factors are considered in channel modeling based on the European Space Agency(ESA) measurement data. Since the round trip delay (from the mobile terminal to the gateway station via satellite) is typically 10∼20ms in low altitude satellite channels, closed-loop power control is much less effective than it is on a terrestrial channel. Thus, the adaptive power control scheme using a variable step size control is essential for overcoming the long round trip delay and fading due to the elevation angle. It is shown that the standard deviation of signal to interference ratio(SIR) adopting a variable step size closed-loop power control scheme is much less than that of a fixed step size closed-loop power control. Furthermore, we have driven the conclusion that the measurement interval of power control commands is optimal choice when it is twice the round trip delay.

  • PDF