• Title/Summary/Keyword: 최적화 에이전트

Search Result 127, Processing Time 0.022 seconds

Optimization of Stock Trading System based on Multi-Agent Q-Learning Framework (다중 에이전트 Q-학습 구조에 기반한 주식 매매 시스템의 최적화)

  • Kim, Yu-Seop;Lee, Jae-Won;Lee, Jong-Woo
    • The KIPS Transactions:PartB
    • /
    • v.11B no.2
    • /
    • pp.207-212
    • /
    • 2004
  • This paper presents a reinforcement learning framework for stock trading systems. Trading system parameters are optimized by Q-learning algorithm and neural networks are adopted for value approximation. In this framework, cooperative multiple agents are used to efficiently integrate global trend prediction and local trading strategy for obtaining better trading performance. Agents Communicate With Others Sharing training episodes and learned policies, while keeping the overall scheme of conventional Q-learning. Experimental results on KOSPI 200 show that a trading system based on the proposed framework outperforms the market average and makes appreciable profits. Furthermore, in view of risk management, the system is superior to a system trained by supervised learning.

Sample Average Approximation Method for Task Assignment with Uncertainty (불확실성을 갖는 작업 할당 문제를 위한 표본 평균 근사법)

  • Gwang, Kim
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.28 no.1
    • /
    • pp.27-34
    • /
    • 2023
  • The optimal assignment problem between agents and tasks is known as one of the representative problems of combinatorial optimization and an NP-hard problem. This paper covers multi agent-multi task assignment problems with uncertain completion probability. The completion probabilities are generally uncertain due to endogenous (agent or task) or exogenous factors in the system. Assignment decisions without considering uncertainty can be ineffective in a real situation that has volatility. To consider uncertain completion probability mathematically, a mathematical formulation with stochastic programming is illustrated. We also present an algorithm by using the sample average approximation method to solve the problem efficiently. The algorithm can obtain an assignment decision and the upper and lower bounds of the assignment problem. Through numerical experiments, we present the optimality gap and the variance of the gap to confirm the performances of the results. This shows the excellence and robustness of the assignment decisions obtained by the algorithm in the problem with uncertainty.

Multiagent-based Autonomic Planning and Plan Execution (다중 에이전트 기반의 자율적 계획수립과 계획실행)

  • Lee, Seon-A;Hwang, Gyeong-Sun;Lee, Geon-Myeong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.11a
    • /
    • pp.407-410
    • /
    • 2007
  • 자율컴퓨팅은 관리자나 사용자의 개입없이 시스템이나 서비스가 원활하게 동작되는 환경으로 구조조정, 최적화, 치료, 방어 등을 위한 여러가지 기술이 복합적으로 요구된다. 태스크를 자율적으로 완수하고 최적으로 수행하기위한 자율적 계획수립 및 계획실행은 자율컴퓨팅에서 필요한 요소기술이다. 이 논문에서는 목표의 실패없는 수행을 위한 여러 잠재적인 실행경로를 포함하는 강건한 계획수립과 다중 에이전트 구조를 이용하여 가용한 자원에 대한 전반적인 고려와 함께 실행시점의 상황을 반영하여 최적의 실행경로에 따라 계획을 실행하게 하는 방법을 제안한다.

  • PDF

Design and Implementation of Security Authentication Module for LAN-WISS (LAN-WISS(Web Infoshop Service System)을 위한 보안 인증 모듈 설계 및 구현)

  • 백영미;이종훈;안경환;이현우;한기준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.526-528
    • /
    • 2000
  • 본 논문은 웹 인포샵 서비스를 인터넷 전용선 사용자에게도 제공하기 위해 반드시 필요한 보안 인증 모듈을 설계 및 구현하였다. 보안 인증 모듈은 사용자의 요청 처리와 사용자의 인증 절차 및 암호화 기능을 수행하는 인증 에이전트와 사용자 정보를 암호화하여 전송하고 인증 에이전트로부터 수신한 응답을 처리하는 클라이언트로 구성된다. 이 때 사용된 암호화 알고리즘은 공개 키 암호법인 RSA 알고리즘으로 사용자의 인증치를 보안 공격으로부터 보호한다. 유닉스 상에서 동작하는 인증 에이전트는 C와 JAVA로 구현했고 클라이언트는 JAVA와 JAVA APPLET으로 구현하였다. 현재 구분한 보안 인증 모듈과 웹 인포샵 서비스 시스템을 통합중이고 향후에는 과금 관리 기능, 시스템 관리 기능 등과 같은 부가 기능을 추가하여 최적화된 LAN-WISS를 완성할 계획이다.

  • PDF

도급계약을 허용하는 환경에서 제조자간 협상을 통한 최적공급사슬 구성

  • 조재형;김현수;최형림;홍순구
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 2004.11a
    • /
    • pp.182-190
    • /
    • 2004
  • 공급사슬의 구성문제는 주문의 동적환경를 고려하여 전체 관점에서 스케줄링되어야 한다. 이러한 공급사슬구성문제를 본 연구에서는 에이전트 협상 방법론을 통해 해결하고자 한다. 에이전트 협상은 공급사슬망을 경쟁적 관계로 이해하고 개별목적을 가진 구성원 에이전트간의 협상과정을 통해 재스케줄링이 발생되어 공급사슬을 구성하게된다. 지금까지의 연구는 공급사슬 상에서 수직적 통합(vertical integration)을 중심으로 조직의 유연적 조정에 초점이 맞추어졌다. 그러나 본 문제에서는 구매자로부터 주문을 받기 위해 경쟁적 관계에 놓인 제조자가 도급계약(sub-contract)이 허용되는 환경에서 협력적 관계를 통해 개별적 이익을 최대화하는 동시에 공급사슬 전체의 관점에서도 비용 최적화를 이룰 수 있는 제조자 협상방법론을 제안하였다. 본 협상방법론을 통해 수평적 관계에 놓인 경쟁업체들의 협력적 관계 및 전략적 제휴의 중요성을 살펴볼 수 있다.

  • PDF

The Application of Direction Vector Function for Multi Agents Strategy and The Route Recommendation System Research in A Dynamic Environment (멀티에이전트 전략을 위한 방향벡터 함수 활용과 동적 환경에 적응하는 경로 추천시스템에 관한 연구)

  • Kim, Hyun;Chung, Tae-Choong
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.48 no.2
    • /
    • pp.78-85
    • /
    • 2011
  • In this paper, a research on multi-agent is carried out in order to develop a system that can provide drivers with real-time route recommendation by reflecting Dynamic Environment Information which acts as an agent in charge of Driver's trait, road condition and Route recommendation system. DEI is equivalent to number of n multi-agent and is an environment variable which is used in route recommendation system with optimal routes for drivers. Route recommendation system which reflects DEI can be considered as a new field of topic in multi-agent research. The representative research of Multi-agent, the Prey Pursuit Problem, was used to generate a fresh solution. In this thesis paper, you will be able to find the effort of indulging the lack of Prey Pursuit Problem,, which ignored practicality. Compared to the experiment, it was provided a real practical experiment applying the algorithm, the new Ant-Q method, plus a comparison between the strategies of the established direction vector was put into effect. Together with these methods, the increase of the efficiency was able to be proved.

Smooth 핸드오프를 이용한 Mobile IP의 성능 분석

  • 차재정;김두용;최덕규
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2000.04a
    • /
    • pp.23-24
    • /
    • 2000
  • 최근 개인 이동 통신 단말기의 수요와 인터넷 사용자의 증가와 함께, 유선 통신 서비스에서부터 개인 휴대 통신 서비스에 이르기까지 다양한 통신 서비스가 제공되기 시작하면서 이러한 서비스가 결합된 mobile IP의 관심이 높아지고 있다. 기존의 IP에서는 노드가 계속해서 접속을 유지하기 위해서는 접속되는 위치가 반드시 고정적으로 지정되는 것이 필요하며 노드의 위치가 바뀌면 기존의 IP 주소는 사용할 수 없다. 그러나 mobile IP는 인터넷상의 임의의 다른 위치에 접속해 노드가 IP 주소를 바꾸지 않고 인터넷을 사용할 수 있도록 한다. 이동(mobile) 노드가 새로운 셀 지역으로 이동하면, 그 셀에 해당하는 외부(foreign) 에이전트로부터 임시 주소(care-of address)를 할당받아 홈 네트워크에 위치한 홈 에이전트에 등록하고, 홈 에이전트는 송신 노드가 이동노드로 전송한 패킷을 새롭게 등록된 임시 주소로 터널링을 통해 전달한다. 이러한 기본적인 mobile IP 방법은 모든 패킷이 홈 에이전트를 통해 이동 노드로 전송되므로 최적화된 라우팅 방법을 제공하지 못한다. 그러므로 이러한 mobile IP의 단점을 보완한 route optimization mobile IP가 제안되고 있다. Route optimization mobile IP는 이동 노드의 현재 위치와 관련된 정보를 갖는 바인딩을 저장하여 송신 노드가 패킷을 이동 노드의 홈 에이전트를 거치지 않고 이동 노드로 직접 전송하는 기능을 제공한다. 또한 이동 노드가 다른 셀 지역으로 핸드오프가 이루어질 경우, 핸드오프 발생전의 바인딩 정보를 이용하여 송신 노드가 전송한 패킷은 이전 셀 지역에 있는 에이전트가 새로운 셀 지역에 있는 이동 노드로 패킷을 재전송하여 전달하는 smooth 핸드오프 기능을 제공한다. 이전 셀 지역에 속한 외부 에이전트가 바인딩을 갱신하기 전에 송신 노드로부터 이동노드로 전달된 패킷이 있을 경우는 패킷을 저장하여 이후에 이동 노드의 위치 정보에 관한 바인딩 정보가 갱신되면 이러한 바인딩 정보에 따라 패킷을 재전송하는 버퍼기능도 제공한다. route optimization mobile IP는 기본적인 mobile IP에서의 복잡한 라우팅 문제를 해결하고, 핸드오프에서의 패킷 손실률을 최소화 한다.본 논문에서는 컴퓨터 시뮬레이션을 통해 smooth 핸드오프를 이용한 mobile IP의 성능을 분석한다. 일반적으로 데이터 트래픽 특성, 노드의 이동성, 바인딩 갱신시간, 버퍼관리 방법 등은 핸드오프 동안 mobile IP의 성능에 많은 영향을 미친다. 따라서 시뮬레이션 모델을 이용하여 다양한 트래픽 환경에서 위에 언급된 성능 파라미터들의 영향을 분석한다. 마지막으로 시뮬레이션 결과를 이용하여 mobile IP의 성능을 개선시키기 위한 방법을 제시한다.

  • PDF

A Study about the Usefulness of Reinforcement Learning in Business Simulation Games using PPO Algorithm (경영 시뮬레이션 게임에서 PPO 알고리즘을 적용한 강화학습의 유용성에 관한 연구)

  • Liang, Yi-Hong;Kang, Sin-Jin;Cho, Sung Hyun
    • Journal of Korea Game Society
    • /
    • v.19 no.6
    • /
    • pp.61-70
    • /
    • 2019
  • In this paper, we apply reinforcement learning in the field of management simulation game to check whether game agents achieve autonomously given goal. In this system, we apply PPO (Proximal Policy Optimization) algorithm in the Unity Machine Learning (ML) Agent environment and the game agent is designed to automatically find a way to play. Five game scenario simulation experiments were conducted to verify their usefulness. As a result, it was confirmed that the game agent achieves the goal through learning despite the change of environment variables in the game.

A Mobile IP Handover Scheme Based on Routing Costs (라우팅 비용을 고려한 Mobile IP 핸드오버 방안)

  • Park, Hee-Dong
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.13 no.5
    • /
    • pp.178-185
    • /
    • 2008
  • This paper proposes a new handover scheme to minimize handover delay and signaling costs, using the fact that a new packet forwarding path could be same or similar to the old one in Mobile IPv4. In the proposed scheme a foreign agent estimates the correlation between the new and old routing paths by using routing costs after receiving a registration request message from a mobile node. If the new packet forwarding path could be same or similar to the old one, the mobile node can receive packets from its old foreign agent without registering its new location with its home agent or correspondent node. The performance analysis shows that the proposed scheme can efficiently reduce handover delay and signaling costs.

  • PDF

Bargaining Game using Artificial agent based on Evolution Computation (진화계산 기반 인공에이전트를 이용한 교섭게임)

  • Seong, Myoung-Ho;Lee, Sang-Yong
    • Journal of Digital Convergence
    • /
    • v.14 no.8
    • /
    • pp.293-303
    • /
    • 2016
  • Analysis of bargaining games utilizing evolutionary computation in recent years has dealt with important issues in the field of game theory. In this paper, we investigated interaction and coevolution process among heterogeneous artificial agents using evolutionary computation in the bargaining game. We present three kinds of evolving-strategic agents participating in the bargaining games; genetic algorithms (GA), particle swarm optimization (PSO) and differential evolution (DE). The co-evolutionary processes among three kinds of artificial agents which are GA-agent, PSO-agent, and DE-agent are tested to observe which EC-agent shows the best performance in the bargaining game. The simulation results show that a PSO-agent is better than a GA-agent and a DE-agent, and that a GA-agent is better than a DE-agent with respect to co-evolution in bargaining game. In order to understand why a PSO-agent is the best among three kinds of artificial agents in the bargaining game, we observed the strategies of artificial agents after completion of game. The results indicated that the PSO-agent evolves in direction of the strategy to gain as much as possible at the risk of gaining no property upon failure of the transaction, while the GA-agent and the DE-agent evolve in direction of the strategy to accomplish the transaction regardless of the quantity.