• Title/Summary/Keyword: discrete space and time

검색결과 214건 처리시간 0.03초

영향력 분포도를 이용한 Q-학습 (Q-learning Using Influence Map)

  • 성연식;조경은
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.649-657
    • /
    • 2006
  • 강화학습이란 환경에 대한 정보가 주어지지 않았을 때 현재의 상태에서 가능한 행동들을 취한 후 얻어지는 보상값이 가장 큰 행동을 최적의 행동 전략으로 학습하는 것이다. 강화학습에서 가장 많이 사용하는 Q-학습은 환경의 특정 상태에서 가능한 행동 중에 하나를 선택해서 취한 행동으로 얻어지는 보상값으로 구성되는데 실세계 상태를 이산값으로 표현하기에는 많은 어려움이 있다. 상태를 많이 정의하면 그만큼 학습에 필요한 시간이 많아지게 되고 반대로 상태 공간을 줄이면 다양한 환경상태를 한 개의 환경상태로 인지를 하고 그 환경에 맞는 한 가지의 행동만 취하도록 학습하기 때문에 행동이 단순해진다. 본 논문에서는 학습 시간을 단축하기 위해 상태 공간을 줄이는 데서 발생하는 행동의 단순화의 단점을 보완하기 위한 방법으로 영향력 분포도를 이용한 Q-학습 방법을 제안한다. 즉, 영향력 분포도와 인접한 학습 결과를 이용해서 학습하지 못한 중간 상태에 적합한 행동을 취하게 하여 동일한 상태 개수에 대해서 학습 시간을 단축하는 것이다. 동일한 학습 시간 동안에 일반적인 강화학습 방법으로 학습한 에이전트와 영향력 분포도와 강화학습을 이용해서 학습한 에이전트의 성능을 비교해 보았을 때 영향력 분포도와 강화학습을 이용해서 학습한 에이전트가 단지 일반적인 강화학습에 필요한 상태공간의 4.6%만 정의를 하고도 성능 면에서는 거의 비슷한 효과를 볼 수가 있음을 확인하였다. 이는 영향력 분포도와 강화학습을 이용한 학습이 일반적인 강화학습에 비해서 학습 속도가 2.77배정도 빨리 이루어지고 실제 학습해야 할 상태 공간의 개수가 적어져서 발생되는 문제를 영향력 분포도를 이용해서 보완을 하기 때문이다.

  • PDF

Propulsion System Design and Optimization for Ground Based Interceptor using Genetic Algorithm

  • Qasim, Zeeshan;Dong, Yunfeng;Nisar, Khurram
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2008년 영문 학술대회
    • /
    • pp.330-339
    • /
    • 2008
  • Ground-based interceptors(GBI) comprise a major element of the strategic defense against hostile targets like Intercontinental Ballistic Missiles(ICBM) and reentry vehicles(RV) dispersed from them. An optimum design of the subsystems is required to increase the performance and reliability of these GBI. Propulsion subsystem design and optimization is the motivation for this effort. This paper describes an effort in which an entire GBI missile system, including a multi-stage solid rocket booster, is considered simultaneously in a Genetic Algorithm(GA) performance optimization process. Single goal, constrained optimization is performed. For specified payload and miss distance, time of flight, the most important component in the optimization process is the booster, for its takeoff weight, time of flight, or a combination of the two. The GBI is assumed to be a multistage missile that uses target location data provided by two ground based RF radar sensors and two low earth orbit(LEO) IR sensors. 3Dimensional model is developed for a multistage target with a boost phase acceleration profile that depends on total mass, propellant mass and the specific impulse in the gravity field. The monostatic radar cross section (RCS) data of a three stage ICBM is used. For preliminary design, GBI is assumed to have a fixed initial position from the target launch point and zero launch delay. GBI carries the Kill Vehicle(KV) to an optimal position in space to allow it to complete the intercept. The objective is to design and optimize the propulsion system for the GBI that will fulfill mission requirements and objectives. The KV weight and volume requirements are specified in the problem definition before the optimization is computed. We have considered only continuous design variables, while considering discrete variables as input. Though the number of stages should also be one of the design variables, however, in this paper it is fixed as three. The elite solution from GA is passed on to(Sequential Quadratic Programming) SQP as near optimal guess. The SQP then performs local convergence to identify the minimum mass of the GBI. The performance of the three staged GBI is validated using a ballistic missile intercept scenario modeled in Matlab/SIMULINK.

  • PDF

An Improved Particle Swarm Optimization Algorithm for Care Worker Scheduling

  • Akjiratikarl, Chananes;Yenradee, Pisal;Drake, Paul R.
    • Industrial Engineering and Management Systems
    • /
    • 제7권2호
    • /
    • pp.171-181
    • /
    • 2008
  • Home care, known also as domiciliary care, is part of the community care service that is a responsibility of the local government authorities in the UK as well as many other countries around the world. The aim is to provide the care and support needed to assist people, particularly older people, people with physical or learning disabilities and people who need assistance due to illness to live as independently as possible in their own homes. It is performed primarily by care workers visiting clients' homes where they provide help with daily activities. This paper is concerned with the dispatching of care workers to clients in an efficient manner. The optimized routine for each care worker determines a schedule to achieve the minimum total cost (in terms of distance traveled) without violating the capacity and time window constraints. A collaborative population-based meta-heuristic called Particle Swarm Optimization (PSO) is applied to solve the problem. A particle is defined as a multi-dimensional point in space which represents the corresponding schedule for care workers and their clients. Each dimension of a particle represents a care activity and the corresponding, allocated care worker. The continuous position value of each dimension determines the care worker to be assigned and also the assignment priority. A heuristic assignment scheme is specially designed to transform the continuous position value to the discrete job schedule. This job schedule represents the potential feasible solution to the problem. The Earliest Start Time Priority with Minimum Distance Assignment (ESTPMDA) technique is developed for generating an initial solution which guides the search direction of the particle. Local improvement procedures (LIP), insertion and swap, are embedded in the PSO algorithm in order to further improve the quality of the solution. The proposed methodology is implemented, tested, and compared with existing solutions for some 'real' problem instances.

속성 버전화에 기반한 시공간 지리-객체의 객체 지향 데이터 모델 (An Object Oriented Data Model of a Spatiotemporal Geographic-Object Based on Attribute Versioning)

  • 이홍로
    • 전자공학회논문지CI
    • /
    • 제38권6호
    • /
    • pp.1-17
    • /
    • 2001
  • 시공간 데이터 모델은 공간과 시간 기능이 추가된 복합 객체를 기술하는 많은 응용 분야에서 이용될 수 있는 자료를 다룬다. 그러나 각 응용 분야를 위해 필요한 정보가 시공간 정보의 설계 단계에서 시간의 종류에 종속해서 지리정보가 다르게 표현될 수 있다. 이러한 다양한 필요성을 다루기 위해서는 지리정보를 시간 관점 하에서 기하학적 입장, 공간 관계 입장과 공간에 종속하는 속성의 입장으로 표현해야 한다. 이 논문에서는 지리정보시스템에 대한 객체들 사이의 관계와 속성에 대한 형식적 정의 문제를 제시하고 있다. 지리 자료는 지리-객체, 지리-필드로 분류되는데, 지리적 공간상에 존재하는 실제의 연속적이고, 이산적인 표현을 나타낸 것이다. 이 논문은 비지리-객체와 지리-객체 상에서 시간에 따른 속성의 변화와 관계 역할에 대해 연구하고자 한다. 따라서 이 연구결과는 지리-객체의 공간 클래스에 머문 기존 연구에 비지리-객체를 포함한 시공간 객체의 속성버전화 방법을 제안함으로써 시공간 객체 지향 클래스 설계상에서의 효율성에 기여한다.

  • PDF

상태(狀態)벡터 모형(模型)에 의한 하천유출(河川流出)의 실시간(實時間) 예측(豫測)에 관한 연구(研究) (Real-Time Prediction of Streamflows by the State-Vector Model)

  • 서병하;윤용남;강관원
    • 대한토목학회논문집
    • /
    • 제2권3호
    • /
    • pp.43-56
    • /
    • 1982
  • 상태공간(狀態空間) 개념(槪念)에 기초(基礎)를 두어 시스템의 동적(動的) 거동(擧動)을 나타낸 Kalman filter와 자기공진(自己共振) 예측자(豫測子)의 순환(循還) 알고리즘에 의한 예측방법(豫測方法)을 연구(硏究)하여 하천유출(河川流出) 예측(豫測)에의 적용성(適用性)을 검토(檢討)하고 그 결과(結果)를 제시하였다. 강우(降雨)-유출과정(流出過程)의 동적(動的) 거동(擧動)을 자색(白色) Gaussian 잡음(雜音)이 있는 선형(線型), 이산형(離散型)시스템으로 보아서 낮은 차수(次數)의 ARMA 과정(過程)으로 나타내었으며 예측모형(豫測模型)의 상태(狀態)벡터를 random walk로 나타내었다. 예측오차(豫測誤差)에 대한 통계적(統計的)인 분석(分析)으로 모형구조(模型構造)를 결정하였으며 적용(適用)된 예측(豫測)알고리즘의 검정(檢正)을 위하여 시우량(時雨量)과 시유량(時流量)의 과거(過去) 기록치(記錄値)를 사용하였다. 예측결과(豫測結果)를 분석(分析)하나 Kalman filter에 의한 알고리즘이 자기공진(自己共振) 예측자(豫測子)보다 우수하다는 것을 알 수 있었다.

  • PDF

A probabilistic framework for drought forecasting using hidden Markov models aggregated with the RCP8.5 projection

  • Chen, Si;Kwon, Hyun-Han;Kim, Tae-Woong
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.197-197
    • /
    • 2016
  • Forecasting future drought events in a region plays a major role in water management and risk assessment of drought occurrences. The creeping characteristics of drought make it possible to mitigate drought's effects with accurate forecasting models. Drought forecasts are inevitably plagued by uncertainties, making it necessary to derive forecasts in a probabilistic framework. In this study, a new probabilistic scheme is proposed to forecast droughts, in which a discrete-time finite state-space hidden Markov model (HMM) is used aggregated with the Representative Concentration Pathway 8.5 (RCP) precipitation projection (HMM-RCP). The 3-month standardized precipitation index (SPI) is employed to assess the drought severity over the selected five stations in South Kore. A reversible jump Markov chain Monte Carlo algorithm is used for inference on the model parameters which includes several hidden states and the state specific parameters. We perform an RCP precipitation projection transformed SPI (RCP-SPI) weight-corrected post-processing for the HMM-based drought forecasting to derive a probabilistic forecast that considers uncertainties. Results showed that the HMM-RCP forecast mean values, as measured by forecasting skill scores, are much more accurate than those from conventional models and a climatology reference model at various lead times over the study sites. In addition, the probabilistic forecast verification technique, which includes the ranked probability skill score and the relative operating characteristic, is performed on the proposed model to check the performance. It is found that the HMM-RCP provides a probabilistic forecast with satisfactory evaluation for different drought severity categories, even with a long lead time. The overall results indicate that the proposed HMM-RCP shows a powerful skill for probabilistic drought forecasting.

  • PDF

건강검진센터의 공간서비스 적정할당을 통한 대기시간 및 이동거리 단축에 관한 연구 (A Study on the Reduction of Waiting Time and Moving Distance through Optimal Allocation of Service Space in a Health Examination Center)

  • 김석태;오성진
    • 한국산학기술학회논문지
    • /
    • 제20권12호
    • /
    • pp.167-175
    • /
    • 2019
  • 최근 건강검진센터는 병원의 보조시설에서 핵심적이고 독립적인 의료시설로 위상이 높아지고 있다. 그러나 검진센터를 비롯한 의료시설들은 공간 및 인간간의 관계가 주체가 되는 가변적 특성으로 인하여 개선이 쉽지 않다. 이에 검진센터의 문제점과 및 개선방법을 발견하기 위하여 보행자 기반 이산사건시뮬레이션 분석프로그램을 개발하고자 하였다. 프로그램은 5가지 평가지표와 수검자 밀도를 분석할 수 있도록 구축하였으며, 시뮬레이션을 통해 소요시간, 수용능력, 검사항목별 대기열 규모를 분석하여 문제점을 도출하였다. 제안된 평가방법을 통해 검사시간이 길어지는 가장 큰 원인은 대기열의 증가와 집중에 의한 장시간 대기자의 발생으로 밝혀졌다. 적정한 서비스 재배분으로 대기열을 분산시켜 검사시간을 크게 단축시킬 수 있었으며 조정안의 검증 결과, 수검인원 18% 증가, 1인당 수검시간 15% 단축, 이동거리 5.5% 단축의 효과를 정량적으로 계산해 낼 수 있었다. 또한 히트맵 분석과 병행한 공간 재배치 계획으로 복도의 교차부에 집중되었던 과밀현상을 해소할 수 있었으며, 이는 통행자와 대기자간의 혼잡을 줄이는 긍정적 효과를 가져올 것이다. 본 연구는 분석프로그램을 구축하기 위한 기초적 성격을 가진 알고리즘 중심의 검토연구이지만, 이러한 복잡계 시뮬레이션 분석방법론은 운영 중인 시스템을 중단시키지 않으면서도 저비용의 최적 대안을 도출하는 도구로서 충분한 활용가치를 가질 수 있을 것으로 기대하고 있다.

DCT 평면에서의 비정상 시변 근전도 신호의 인식과 병렬처리컴퓨터를 이용한 실시간 구현 (Identification of Nonstationary Time Varying EMG Signal in the DCT Domain and a Real Time Implementation Using Parallel Processing Computer)

  • 이영석;이진;김성환
    • 대한의용생체공학회:의공학회지
    • /
    • 제16권4호
    • /
    • pp.507-516
    • /
    • 1995
  • 근전도 신호(electromyogram)의 시변 비정상(time varying nonstationary) 특성은 신호의 정확한 모델링 및 인식에 제약 조건으로 받아들여 졌다. 특히, 최근 들어 장애자들을 위한 보철제어분야에서 근전도 신호를 이용한 기능적 전기 자극을 위한 FES(funcitonal electrical stimulation) 시스템에 있어 근전도 신호의 파라메터 인식은 중요한 요소로서 작용한다. 그러나, 근전도 신호는 자세의 변화 및 근육 피로도 등의 요인에 의해서 시변 비정상 특성을 띠고 있기 때문에 시간에 따라 변하는 인식 파라메터를 정확하게 인식할 수 있는 새로운 알고리즘의 개발과 실시간 처리가 가능한 컴퓨터 하드웨어의 설계가 요구된다. 따라서, 본 논문에서는 시평면의 근전도 신호를 이산 여현 변환(discrete cosine transform)을 이용하여 변환 평면으로 옮긴 다음 상태 방정식(state space equation)을 써서 변환 평면상에서의 AR(autoregressive) 모델을 세우고 주어진 근전도 신호에 대해 모델 파라메터를 추정하였으며, 제안한 알고리즘은 실시간 처리를 위하여 2개의 독립적인 중앙 연산 처리 장치를 갖춘 INMOS사의 IMS T-805 병렬 처리 컴퓨터를 이용하여 동시 다발적인 연산을 수행함으로서 알고리즘의 연산 효율을 높였다. 제안된 알고리즘의 타당성을 검증하기 위해 모델의 추정 오차에 영향을 미치는 입력 자기상관 행렬(input correlation matrix)의 condition number의 변화 및 평균자승오차(mean square error)를 구하여 기존의 SLS(sequential least square) 알고리즘과 비교하였다.

  • PDF

산개성단 NGC 1039(M34) 영역의 변광성 (VARIABLE STARS IN THE REGION OF THE OPEN CLUSTER NGC 1039 (M34))

  • 전영범;박윤호;이상민;이의렬;김동현;장혜은;조성윤
    • 천문학논총
    • /
    • 제30권3호
    • /
    • pp.821-832
    • /
    • 2015
  • NGC 1039 영역의 변광성 탐사로부터 7개의 ${\delta}$ Scuti형 변광성, 2개의 ${\gamma}$ Doradus형 변광성, 14개의 식쌍성 및 5개의 장지기형 불규칙 변광성을 찾았다. 이 중에서 3개를 제외한 나머지는 모두 새로 발견한 것이다. 이들 중 ${\delta}$ Scuti형 변광성 4개와 ${\gamma}$ Doradus형 변광성 2개 및 장주기형 불규칙 변광성 1개는 성단구성원일 가능성이 크다. 14개의 식쌍성 중에서 12개는 주기와 변광진폭 등을 구하였으며, 나머지 2개는 22일 관측 자료 중 하루치에서만 식 현상이 나타나서 EA형 식쌍성으로 보인다. B, V등급의 변광진폭을 같이 구한 식쌍성의 변광진폭비 $A_V/A_B$는 0.92이며, ${\delta}$ Scuti형 변광성의 결과를 이용한 0.75와 뚜렷이 구분된다. 5개의 장주기형 불규칙 변광성은 하나를 제외하고 나머지는 주기가 너무 길었고, 또한 주기성인지 알 수 없어서 밝기 변화만으로 변광성임을 알 수 있었다. 이 연구에서 찾은 변광성은 V등급이 10.84등급부터 16.30등급까지 분포하며, V등급의 변광진폭이 0.5등급 이상이면 16.3등급까지도 변광 여부를 확인할 수 있었다.

TBM 운전조건을 고려한 스포크형 쉴드TBM의 굴진모사 연구 (Study on Driving Simulation of Spoke-type Shield TBM Considering Operation Conditions)

  • 최순욱;이효범;최항석;장수호;강태호;이철호
    • 터널과지하공간
    • /
    • 제29권6호
    • /
    • pp.456-467
    • /
    • 2019
  • 본 연구에서는 개별요소법을 사용하여 스포크형 쉴드TBM의 굴진을 모사하였다. 지반에 대해 수평응력계수를 사용하여 깊이에 따른 수평응력 증가를 모사하였고 TBM의 커터헤드에서 발생하는 토크를 기준으로 운전 조건을 부여하여 운전 범위 내에서 굴진을 하도록 설정하였다. 즉, 커터헤드에서 발생하는 토크의 값이 주어진 운전 조건을 넘어서는 경우 굴진속도를 일정하게 줄이고 반대로 운전 조건보다 낮은 경우에는 굴진 속도를 높이는 방안을 고려하였다. 이때 굴진속도 변경에는 운전자의 검토 시간을 고려하여 최소 변경 가능 요건을 부여하고 굴진 조건에 따라 이를 변경 가능하도록 하였다. 이러한 조건을 사용하기 위하여 사용자 프로그램을 별도로 작성하였으며, 결과를 통해 사전에 입력한 운전 범위 내에서 굴진 해석이 가능하였다.