• 제목/요약/키워드: Heuristic Function

검색결과 306건 처리시간 0.022초

가중치 학습과 결합된 전술적 경로 찾기의 구현 (Implementation of Tactical Path-finding Integrated with Weight Learning)

  • 유견아
    • 한국시뮬레이션학회논문지
    • /
    • 제19권2호
    • /
    • pp.91-98
    • /
    • 2010
  • 기존의 경로 찾기는 장애물을 피하는 짧은 경로를 찾는 것에 집중되어 왔다. 그러나 컴퓨터 게임이 점점 복잡해지면서 경로 찾기에 매복지점이나 적으로부터의 가시성과 같은 전술적 정보를 포함하는 것이 요구되고 있다. 이와 같은 정보를 경로 찾기에 반영하는 한 가지 방법은 탐색 알고리즘의 휴리스틱 함수를 전술들의 가중치 합으로 나타내는 것이다. 본 논문에서는 주어진 전술적 정보에 대해 경로 찾기를 최적화하도록 휴리스틱을 학습하는 문제를 다룬다. 여기서 학습이란 휴리스틱 함수를 위한 좋은 가중치 벡터를 찾아내는 것을 의미한다. 학습용 훈련 예제는 게임 레벨 설계자가 제공하며 매 탐색 레벨마다 실제 탐색결과와 비교되어 가중치를 갱신하는데 사용된다. 본 논문에서는 전술적 경로 찾기를 위해 탐색과 결합된 학습 알고리즘을 제안한다. 가중치를 갱신하는데 사용된 퍼셉트론 유사 방법을 설명하며 이를 구현한 시뮬레이션 도구를 소개한다. 시뮬레이션 도구에서는 레벨 설계자가 캐릭터의 특성에 따라 바람직한 이동경로를 제시할 수 있고, 이를 훈련 예제로 이용하여 가중치를 학습하며 훈련에 따라 변화하는 경로의 자취를 보여주는 기능을 제공한다.

Actor-Critic Algorithm with Transition Cost Estimation

  • Sergey, Denisov;Lee, Jee-Hyong
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제16권4호
    • /
    • pp.270-275
    • /
    • 2016
  • We present an approach for acceleration actor-critic algorithm for reinforcement learning with continuous action space. Actor-critic algorithm has already proved its robustness to the infinitely large action spaces in various high dimensional environments. Despite that success, the main problem of the actor-critic algorithm remains the same-speed of convergence to the optimal policy. In high dimensional state and action space, a searching for the correct action in each state takes enormously long time. Therefore, in this paper we suggest a search accelerating function that allows to leverage speed of algorithm convergence and reach optimal policy faster. In our method, we assume that actions may have their own distribution of preference, that independent on the state. Since in the beginning of learning agent act randomly in the environment, it would be more efficient if actions were taken according to the some heuristic function. We demonstrate that heuristically-accelerated actor-critic algorithm learns optimal policy faster, using Educational Process Mining dataset with records of students' course learning process and their grades.

The Use of Particle Swarm Optimization for Order Allocation Under Multiple Capacitated Sourcing and Quantity Discounts

  • Ting, Ching-Jung;Tsai, Chi-Yang;Yeh, Li-Wen
    • Industrial Engineering and Management Systems
    • /
    • 제6권2호
    • /
    • pp.136-145
    • /
    • 2007
  • The selection of suppliers and the determination of order quantities to be placed with those suppliers are important decisions in a supply chain. In this research, a non-linear mixed integer programming model is presented to select suppliers and determine the order quantities. The model considers the purchasing cost which takes into account quantity discount, the cost of transportation, the fixed cost for establishing suppliers, the cost for holding inventory, and the cost of receiving poor quality parts. The capacity constraints for suppliers, quality and lead-time requirements for the parts are also taken into account in the model. Since the purchasing cost, which is a decreasing step function of order quantities, introduces discontinuities to the non-linear objective function, it is not easy to employ traditional optimization methods. Thus, a heuristic algorithm, called particle swarm optimization (PSO), is used to find the (near) optimal solution. However, PSO usually generates initial solutions randomly. To improve the PSO solution quality, a heuristic procedure is proposed to find an initial solution based on the average unit cost including transportation, purchasing, inventory, and poor quality part cost. The results show that PSO with the proposed initial solution heuristic provides better solutions than those with PSO algorithm only.

시간 제약을 가지는 차량 경로 스케줄링 문제 해결을 위한 기회시간 반영 하이브리드 휴리스틱 (Hybrid Heuristic Applied by the Opportunity Time to Solve the Vehicle Routing and Scheduling Problem with Time Window)

  • 유영훈;차상진;조근식
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.137-150
    • /
    • 2009
  • 본 연구는 시간 제약조건을 가지는 차량 경로 탐색과 스케줄링 문제(VRSPTW, the Vehicle Routing and Scheduling Problem with Time Window)를 해결하기 위하여, 기회시간(Opportunity time)을 반영한 하이브리드 휴리스틱을 제안하였다. 기회시간은 각 고객 노드에서 요구하는 하역 서비스를 수행 한 뒤에도 남아 있는 여유시간이다. 제안된 휴리스틱은 기회시간에 대한 제약조건을 추가하고, 기회시간을 고려한 비용 평가함수를 삽입 전략에 적용함으로써 초기 해를 구하였다. 또한 고객 노드 교환에 의한 타부 탐색 전략에도 기회시간을 반영함으로써 해를 개선 시켰다. 마지막으로 지리적, 시간적, 용량적으로 다양한 데이터 유형들에 대하여 각각 효과적으로 최적 해를 구할 수 있는 초기 경로 생성 전략들을 소개하고 비교하였다. 본 연구의 실험에서는 제안된 휴리스틱이 Solomon I1 휴리스틱 보다 효율적으로 최근사 해를 얻을 수 있음을 보였다.

  • PDF

혼합형 메타휴리스틱 접근법을 이용한 지속가능한 폐쇄루프 공급망 네트워크 모델: 국내 모바일폰 산업을 중심으로 (Sustainable Closed-loop Supply Chain Model using Hybrid Meta-heuristic Approach: Focusing on Domestic Mobile Phone Industry)

  • 윤영수
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.49-62
    • /
    • 2024
  • 본 연구는 국내 모바일폰 산업을 위한 지속가능한 폐쇄루프 공급망 (Sustainable closed-loop supply chain: SCLSC) 네트워크 모델을 제안한다. 제안된 SCLSC 네트워크 모델의 지속 가능성을 위해 경제적, 환경적, 사회적 요인들이 각각 고려된다. 이들 세 가지 요인들은 SCLSC 네트워크 모델의 각 단계에서 고려되는 설비의 구축 및 운영으로부터 발생하는 총비용 최소화, CO2 방출 총량 최소화, 사회적 영향력 최대화를 목표로 한다. 이러한 목표들은 SCLSC 네트워크의 모델링 단계에서 각각 개별적인 목적함수로 고려되어야 하기 때문에 SCLSC 네트워크 모델은 다목적 최적화 문제로 간주할 수 있다. SCLSC 네트워크 모델은 수리모델을 사용하여 표현되며, 혼합형 메타휴리스틱 접근법을 수리모델에 적용하여 그 해를 구한다. 수치실험에서는 제안된 혼합형 메타휴리스틱 접근법의 수행도가 기존의 메타휴리스틱 접근법들의 수행도와 비교된다. 실험결과는 본 연구에서 제안된 혼합형 메타휴리스틱 접근법이 기존의 메타휴리스틱 접근법들과 비교하여 더 뛰어난 수행도를 보여주는 것을 알 수 있다.

A* 알고리즘 평가함수의 추정 부하량 변경에 관한 연구 (A Study on Changing Estimation Weights of A* Algorithm's Heuristic Function)

  • 정병두;유영근
    • 한국ITS학회 논문지
    • /
    • 제14권3호
    • /
    • pp.1-8
    • /
    • 2015
  • 교통 네트워크에서 하나의 노드로부터 다른 노드로 가는 최단 경로 탐색은 탐색속도와 함께 정확성도 매우 중요시되고 있다. 기존 $A^*$ 알고리즘은 빠른 탐색속도가 큰 장점이기는 하지만, 분석네트워크가 다소 복잡하고, 링크수가 많은 대규모 네트워크에서는 최단 통행경로를 가까운 노드의 순서대로 단계적으로 찾아내는 데 정확도가 다소 낮은 약점을 갖고 있다. 따라서 본 연구에서는 $A^*$ 알고리즘의 평가함수와 알고리즘을 수정하여 정확성을 높일 수 있도록 하였다. 구체적으로는 평가함수를 선적인 개념에서 면적인 개념으로 전환하였고, 계산단계의 진행과정에서 실제 부하량이 적을수록 무조건 좋은 것이 아니라, 부하량이 커도 목표노드에 가까운 것이라면 더욱 최단경로에 유리하다는 개념을 도입한 것이다. 마지막으로 평가함수 값은 반복계산을 수행할수록 적어야 하는데, 이렇지 못할 경우, 피드백 기능을 부가하여 탐색 정확도를 높이도록 알고리즘을 수정하였다. 이렇게 개선된 알고리즘을 실제 네트워크상에서 적용해 본 결과, 유용성이 있는 것으로 밝혀졌다.

DIRICHLET PROBLEM ON THE UPPER HALF PLANE - A HEURISTIC ARGUMENT

  • Choe, Geon-H.
    • 대한수학회논문집
    • /
    • 제9권2호
    • /
    • pp.327-329
    • /
    • 1994
  • The Dirichlet problem (DP) on the upper half plane {z = x + iy : y > 0} is to find a real-valued harmonic function u(x, y) satisfying u(x, 0) = g(x) almost everywhere for some reasonably nice function g defined on the real line, which is called the data on the boundary for (DP).(omitted)

  • PDF

FUZZY CONTROL AS INTERPOLATION

  • Kovalerchuk, B.;Yusupov, H.
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1993년도 Fifth International Fuzzy Systems Association World Congress 93
    • /
    • pp.1151-1154
    • /
    • 1993
  • The purpose of the paper is to explain some heuristic, common sense suppositions of fuzzy control. It is shown that Fuzzy Control is a kind of quasilinear interpolation of prototypes. Control function can be sufficiently exact represented as piecewise-linear function. The best interpolation is connected with normalized intersected fuzzy sets.

  • PDF

가변 부하시 전문가 제어 기법을 이용한 직류 서보 전동기의 속도제어기에 관한 연구 (A study on the speed controller for D.C servo motor using expert control technique in variable)

  • 윤양웅;왈서;오훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1991년도 하계학술대회 논문집
    • /
    • pp.34-36
    • /
    • 1991
  • The idea of expert control is to incoporate a rule based expert system in a feedback control system. In this paper, we present some heuristic rules about input requlation and supervision and turning for D.C servo motor speed control in variable. The expert auto-turning PID controller which heuristic rules are used as an element of the feedback control system is implemented with the numerical algorithms and heuristic logics. The accurate control function is confirmed by computer simulation.

  • PDF

작업의 특성에 종속되는 병렬기계의 일정계획을 위한 발견적 기법 (A Heuristic for parallel Machine Scheduling Depending on Job Characteristics)

  • 이동현;이경근;김재균;박창권;장길상
    • 경영과학
    • /
    • 제17권1호
    • /
    • pp.41-54
    • /
    • 2000
  • in the real world situations that some jobs need be processed only on certain limited machines frequently occur due to the capacity restrictions of machines such as tools fixtures or material handling equipment. In this paper we consider n-job non-preemptive and m parallel machines scheduling problem having two machines group. The objective function is to minimize the sum of earliness and tardiness with different release times and due dates. The problem is formulated as a mixed integer programming problem. The problem is proved to be Np-complete. Thus a heuristic is developed to solve this problem. To illustrate its suitability and efficiency a proposed heuristic is compared with a genetic algorithm and tabu search for a large number of randomly generated test problems in ship engine assembly shop. Through the experimental results it is showed that the proposed algorithm yields good solutions efficiently.

  • PDF