• 제목/요약/키워드: Path Learning

검색결과 464건 처리시간 0.025초

가중치 학습과 결합된 전술적 경로 찾기의 구현 (Implementation of Tactical Path-finding Integrated with Weight Learning)

  • 유견아
    • 한국시뮬레이션학회논문지
    • /
    • 제19권2호
    • /
    • pp.91-98
    • /
    • 2010
  • 기존의 경로 찾기는 장애물을 피하는 짧은 경로를 찾는 것에 집중되어 왔다. 그러나 컴퓨터 게임이 점점 복잡해지면서 경로 찾기에 매복지점이나 적으로부터의 가시성과 같은 전술적 정보를 포함하는 것이 요구되고 있다. 이와 같은 정보를 경로 찾기에 반영하는 한 가지 방법은 탐색 알고리즘의 휴리스틱 함수를 전술들의 가중치 합으로 나타내는 것이다. 본 논문에서는 주어진 전술적 정보에 대해 경로 찾기를 최적화하도록 휴리스틱을 학습하는 문제를 다룬다. 여기서 학습이란 휴리스틱 함수를 위한 좋은 가중치 벡터를 찾아내는 것을 의미한다. 학습용 훈련 예제는 게임 레벨 설계자가 제공하며 매 탐색 레벨마다 실제 탐색결과와 비교되어 가중치를 갱신하는데 사용된다. 본 논문에서는 전술적 경로 찾기를 위해 탐색과 결합된 학습 알고리즘을 제안한다. 가중치를 갱신하는데 사용된 퍼셉트론 유사 방법을 설명하며 이를 구현한 시뮬레이션 도구를 소개한다. 시뮬레이션 도구에서는 레벨 설계자가 캐릭터의 특성에 따라 바람직한 이동경로를 제시할 수 있고, 이를 훈련 예제로 이용하여 가중치를 학습하며 훈련에 따라 변화하는 경로의 자취를 보여주는 기능을 제공한다.

Q-Learning을 ol용한 Intelligent Transportation System (Intelligent Transportation System using Q-Learning)

  • 박명수;김표재;최진영
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1299-1302
    • /
    • 2003
  • In this paper, we propose new method which can provide user the path to the target place efficiently. It stores the state of roads to target place as the form of Q-table and finds the proper path using Q-table.0-table is updated by the information about real traffic which is reported by users. This method can provides the proper path, using less storage and less computation time than the conventional method which stores entire road traffic information and finds the path by graph search algorithm.

  • PDF

Adaptive Learning Path Recommendation based on Graph Theory and an Improved Immune Algorithm

  • BIAN, Cun-Ling;WANG, De-Liang;LIU, Shi-Yu;LU, Wei-Gang;DONG, Jun-Yu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권5호
    • /
    • pp.2277-2298
    • /
    • 2019
  • Adaptive learning in e-learning has garnered researchers' interest. In it, learning resources could be recommended automatically to achieve a personalized learning experience. There are various ways to realize it. One of the realistic ways is adaptive learning path recommendation, in which learning resources are provided according to learners' requirements. This paper summarizes existing works and proposes an innovative approach. Firstly, a learner-centred concept map is created using graph theory based on the features of the learners and concepts. Then, the approach generates a linear concept sequence from the concept map using the proposed traversal algorithm. Finally, Learning Objects (LOs), which are the smallest concrete units that make up a learning path, are organized based on the concept sequences. In order to realize this step, we model it as a multi-objective combinatorial optimization problem, and an improved immune algorithm (IIA) is proposed to solve it. In the experimental stage, a series of simulated experiments are conducted on nine datasets with different levels of complexity. The results show that the proposed algorithm increases the computational efficiency and effectiveness. Moreover, an empirical study is carried out to validate the proposed approach from a pedagogical view. Compared with a self-selection based approach and the other evolutionary algorithm based approaches, the proposed approach produces better outcomes in terms of learners' homework, final exam grades and satisfaction.

Deep Reinforcement Learning based Tourism Experience Path Finding

  • Kyung-Hee Park;Juntae Kim
    • Journal of Platform Technology
    • /
    • 제11권6호
    • /
    • pp.21-27
    • /
    • 2023
  • In this paper, we introduce a reinforcement learning-based algorithm for personalized tourist path recommendations. The algorithm employs a reinforcement learning agent to explore tourist regions and identify optimal paths that are expected to enhance tourism experiences. The concept of tourism experience is defined through points of interest (POI) located along tourist paths within the tourist area. These metrics are quantified through aggregated evaluation scores derived from reviews submitted by past visitors. In the experimental setup, the foundational learning model used to find tour paths is the Deep Q-Network (DQN). Despite the limited availability of historical tourist behavior data, the agent adeptly learns travel paths by incorporating preference scores of tourist POIs and spatial information of the travel area.

  • PDF

Design of track path-finding simulation using Unity ML Agents

  • In-Chul Han;Jin-Woong Kim;Soo Kyun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.61-66
    • /
    • 2024
  • 본 연구에서는 강화학습 기술을 이용하여, 시뮬레이션이나 게임 환경 내에서 개체의 경로 탐색을 위한 시뮬레이션을 개발하는 것을 목표로 한다. 본 연구에서는 주어진 트랙 위에 생성된 임의 위치의 장애물을 회피하고, 아이템을 획득할 수 있는 경로를 자동으로 탐색할 수 있도록 시뮬레이션 내 개체를 학습시킨 점이 주된 특징이다. 해당 시뮬레이션을 구현하기 위해 유니티 게임 엔진에서 제공하는 ML 에이전트 (Machine Learning Agents)를 사용하였고, PPO(Proximal Policy Optimization)에 기반을 둔 학습 정책을 수립하여 강화학습 환경을 구성한다. 본 논문에서 제안한 강화학습 기반의 시뮬레이션을 통해, 개체가 학습을 진행할수록 장애물을 회피하고, 아이템을 획득할 수 있는 경로를 탐색해 트랙 위를 움직이고 있다는 점을 시뮬레이션 결과와 학습 결과 그래프를 분석하여 확인할 수 있다.

SOM(Self-Organization Map)을 이용한 로보트 매니퓰레이터 충돌회피 경로계획 (Collision-Free Path Planning for Robot Manipulator using SOM)

  • 이종우;이종태
    • 대한산업공학회지
    • /
    • 제22권3호
    • /
    • pp.499-515
    • /
    • 1996
  • The basic function of on industrial robot system is to move objects in the workspace fast and accurately. One difficulty in performing this function is that the path of robot should be programmed to avoid the collision with obstacles, that is, tools, or facilities. This path planning requires much off-line programming time. In this study, a SOM technique to find the collision-free path of robot in real time is developed. That is, the collision-free map is obtained through SOM learning and a collision-free path is found using the map in real time during the robot operation. A learning procedure to obtain the map and an algorithm to find a short path using the map is developed and simulated. Finally, a path smoothing method to stabilize the motion of robot is suggested.

  • PDF

무인수상정 경로점 추종을 위한 강화학습 기반 Dynamic Window Approach (Dynamic Window Approach with path-following for Unmanned Surface Vehicle based on Reinforcement Learning)

  • 허진영;하지수;이준식;유재관;권용진
    • 한국군사과학기술학회지
    • /
    • 제24권1호
    • /
    • pp.61-69
    • /
    • 2021
  • Recently, autonomous navigation technology is actively being developed due to the increasing demand of an unmanned surface vehicle(USV). Local planning is essential for the USV to safely reach its destination along paths. the dynamic window approach(DWA) algorithm is a well-known navigation scheme as a local path planning. However, the existing DWA algorithm does not consider path line tracking, and the fixed weight coefficient of the evaluation function, which is a core part, cannot provide flexible path planning for all situations. Therefore, in this paper, we propose a new DWA algorithm that can follow path lines in all situations. Fixed weight coefficients were trained using reinforcement learning(RL) which has been actively studied recently. We implemented the simulation and compared the existing DWA algorithm with the DWA algorithm proposed in this paper. As a result, we confirmed the effectiveness of the proposed algorithm.

강화학습을 이용한 무인 자율주행 차량의 지역경로 생성 기법 (Local Path Generation Method for Unmanned Autonomous Vehicles Using Reinforcement Learning)

  • 김문종;최기창;오병화;양지훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.369-374
    • /
    • 2014
  • 무인 자율주행 차량에서의 경로 생성 기법은 차량이 자동적으로 안전하고 효율적인 경로를 생성하고 주행할 수 있도록 해 준다. 경로에는 크게 전역경로와 지역경로가 있다. 전역경로는 차량이 출발점으로부터 도착점까지 가기 위해 주행해야 하는 구간을, 지역경로는 전역경로에서 얻은 구간을 주행하기 위해서 차량이 실제로 주행해야 할 경로를 의미한다. 본 논문에서는 지역경로 생성을 위하여 효율성 높은 곡선 함수를 사용하는 기존연구에서 더 나아가 학습을 통해 경로를 생성하는 방법을 제안한다. 먼저 강화학습을 통해서 후보경로에 대한 예측 보상 값을 얻고 보상 값이 최고가 되는 경로를 찾는 작업을 한다. 또한 인공 신경망을 통해서는 생성된 경로에 최적화된 조향 명령을 주기 위해 조향 각을 학습하는 작업을 한다. 더 나아가 주행하는 경로에 장애물이 발견되더라도 이를 효율적으로 회피하는 최적의 경로를 학습 기법을 통해 만들어낸다. 본 논문에서 제안된 알고리즘의 우수성은 실제 주행 환경으로 모델링한 시뮬레이션 실험을 통해 검증되었다.

조향규칙 학습을 이용한 자율주행로봇의 지역경로계획설계 (Local Path Planning Design of Autonomous Mobile Robot using The Direction Indicator Rules Learning)

  • 박경석;최한수;정헌
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(5)
    • /
    • pp.25-28
    • /
    • 2002
  • The path planning of autonomous mobile robot use two method. One is global path planning and another is local path planning. In this paper, We study the local path planning of autonomous mobile robot move in unknown enviroment. This local path planning is based on neural network using the direction indicator rules learning. also the system is made up of sensor system. The motion control system for real-time execution. The experimental results show that the developed direction indicator system operates properly and strongly at circumstance.

  • PDF

Path-smoothing for a robot arm manipulator using a Gaussian process

  • Park, So-Youn;Lee, Ju-Jang
    • 한국산업융합학회 논문집
    • /
    • 제18권4호
    • /
    • pp.191-196
    • /
    • 2015
  • In this paper, we present a path-smoothing algorithm for a robot arm manipulator that finds the path using a joint space-based rapidly-exploring random tree. Unlike other smoothing algorithms which require complex mathematical computation, the proposed path-smoothing algorithm is done using a Gaussian process. To find the optimal hyperparameters of the Gaussian process, we use differential evolution hybridized with opposition-based learning. The simulation result indicates that the Gaussian process whose hyperparameters were optimized by hybrid differential evolution successfully smoothed the path generated by the joint space-based rapidly-exploring random tree.