• 제목/요약/키워드: 최적화 에이전트

검색결과 127건 처리시간 0.025초

다중 에이전트 Q-학습 구조에 기반한 주식 매매 시스템의 최적화 (Optimization of Stock Trading System based on Multi-Agent Q-Learning Framework)

  • 김유섭;이재원;이종우
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.207-212
    • /
    • 2004
  • 본 논문은 주식 매매 시스템을 위한 강화 학습 구조를 제시한다. 매매 시스템에 사용되는 매개변수들은 Q-학습 알고리즘에 의하여 최적화되고, 인공 신경망이 값의 근사치를 구하기 위하여 활용된다 이 구조에서는 서로 유기적으로 협업하는 다중 에이전트를 이용하여 전역적인 추세 예측과 부분적인 매매 전략을 통합하여 개선된 매매 성능을 가능하게 한다. 에이전트들은 서로 통신하여 훈련 에피소드와 학습된 정책을 서로 공유하는데, 이 때 전통적인 Q-학습의 모든 골격을 유지한다. 실험을 통하여, KOSPI 200에서는 제안된 구조에 기반 한 매매 시스템을 통하여 시장 평균 수익률을 상회하며 동시에 상당한 이익을 창출하는 것을 확인하였다. 게다가 위험 관리의 측면에서도 본 시스템은 교사 학습(supervised teaming)에 의하여 훈련된 시스템에 비하여 더 뛰어난 성능을 보여주었다.

불확실성을 갖는 작업 할당 문제를 위한 표본 평균 근사법 (Sample Average Approximation Method for Task Assignment with Uncertainty)

  • 김광
    • 한국산업정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.27-34
    • /
    • 2023
  • 최상의 에이전트-작업 할당을 결정하는 문제는 조합 최적화(combinatorial optimization)의 대표적인 문제이자 NP-난해(NP-hard)임이 알려져 있다. 본 연구에서는 에이전트와 작업의 할당 시 결정되는 작업 수행 확률(completion probability)이 불확실한 상황에서의 문제를 다룬다. 에이전트나 작업 내부의 요인 혹은 시스템 외적인 요소로 인한 작업 수행 확률은 고정적이기보다 불확실성을 갖는 것이 일반적이다. 불확실성을 고려하지 않은 할당 결정은 변동성이 있는 현실 상황에서 효과적이지 않은 결정이 될 수 있다. 작업 수행 확률의 불확실성을 수학적으로 반영하기 위해 본 연 구에서는 추계적 계획법(stochastic programming)을 활용한 수리 모형을 제시한다. 본 연구에서는 효율적으로 문제를 풀기 위해 표본 평균 근사법(sample average approximation)을 활용한 알고리즘을 제안한다. 본 문제 해결 방법론을 이용해 효과적인 할당 결정과 상한값과 하한값을 구할 수 있고, 결과의 성능을 확인하기 위해 최적 격차(optimality gap)와 분산을 실험을 통해 제시한다. 이를 통해 알고리즘으로 구한 할당 결정의 우수성 및 강건성을 보인다.

다중 에이전트 기반의 자율적 계획수립과 계획실행 (Multiagent-based Autonomic Planning and Plan Execution)

  • 이선아;황경순;이건명
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.407-410
    • /
    • 2007
  • 자율컴퓨팅은 관리자나 사용자의 개입없이 시스템이나 서비스가 원활하게 동작되는 환경으로 구조조정, 최적화, 치료, 방어 등을 위한 여러가지 기술이 복합적으로 요구된다. 태스크를 자율적으로 완수하고 최적으로 수행하기위한 자율적 계획수립 및 계획실행은 자율컴퓨팅에서 필요한 요소기술이다. 이 논문에서는 목표의 실패없는 수행을 위한 여러 잠재적인 실행경로를 포함하는 강건한 계획수립과 다중 에이전트 구조를 이용하여 가용한 자원에 대한 전반적인 고려와 함께 실행시점의 상황을 반영하여 최적의 실행경로에 따라 계획을 실행하게 하는 방법을 제안한다.

  • PDF

LAN-WISS(Web Infoshop Service System)을 위한 보안 인증 모듈 설계 및 구현 (Design and Implementation of Security Authentication Module for LAN-WISS)

  • 백영미;이종훈;안경환;이현우;한기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.526-528
    • /
    • 2000
  • 본 논문은 웹 인포샵 서비스를 인터넷 전용선 사용자에게도 제공하기 위해 반드시 필요한 보안 인증 모듈을 설계 및 구현하였다. 보안 인증 모듈은 사용자의 요청 처리와 사용자의 인증 절차 및 암호화 기능을 수행하는 인증 에이전트와 사용자 정보를 암호화하여 전송하고 인증 에이전트로부터 수신한 응답을 처리하는 클라이언트로 구성된다. 이 때 사용된 암호화 알고리즘은 공개 키 암호법인 RSA 알고리즘으로 사용자의 인증치를 보안 공격으로부터 보호한다. 유닉스 상에서 동작하는 인증 에이전트는 C와 JAVA로 구현했고 클라이언트는 JAVA와 JAVA APPLET으로 구현하였다. 현재 구분한 보안 인증 모듈과 웹 인포샵 서비스 시스템을 통합중이고 향후에는 과금 관리 기능, 시스템 관리 기능 등과 같은 부가 기능을 추가하여 최적화된 LAN-WISS를 완성할 계획이다.

  • PDF

도급계약을 허용하는 환경에서 제조자간 협상을 통한 최적공급사슬 구성

  • 조재형;김현수;최형림;홍순구
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2004년도 추계학술대회
    • /
    • pp.182-190
    • /
    • 2004
  • 공급사슬의 구성문제는 주문의 동적환경를 고려하여 전체 관점에서 스케줄링되어야 한다. 이러한 공급사슬구성문제를 본 연구에서는 에이전트 협상 방법론을 통해 해결하고자 한다. 에이전트 협상은 공급사슬망을 경쟁적 관계로 이해하고 개별목적을 가진 구성원 에이전트간의 협상과정을 통해 재스케줄링이 발생되어 공급사슬을 구성하게된다. 지금까지의 연구는 공급사슬 상에서 수직적 통합(vertical integration)을 중심으로 조직의 유연적 조정에 초점이 맞추어졌다. 그러나 본 문제에서는 구매자로부터 주문을 받기 위해 경쟁적 관계에 놓인 제조자가 도급계약(sub-contract)이 허용되는 환경에서 협력적 관계를 통해 개별적 이익을 최대화하는 동시에 공급사슬 전체의 관점에서도 비용 최적화를 이룰 수 있는 제조자 협상방법론을 제안하였다. 본 협상방법론을 통해 수평적 관계에 놓인 경쟁업체들의 협력적 관계 및 전략적 제휴의 중요성을 살펴볼 수 있다.

  • PDF

멀티에이전트 전략을 위한 방향벡터 함수 활용과 동적 환경에 적응하는 경로 추천시스템에 관한 연구 (The Application of Direction Vector Function for Multi Agents Strategy and The Route Recommendation System Research in A Dynamic Environment)

  • 김현;정태충
    • 전자공학회논문지CI
    • /
    • 제48권2호
    • /
    • pp.78-85
    • /
    • 2011
  • 본 논문에서는 운전자의 특성, 도로상황, 경로 추천을 담당하는 에이전트와 같은 동적환경정보(DEI:Dynamic Environment Information)를 반영하여 실시간으로 운전자에게 경로를 추천할 수 있는 시스템을 위해 멀티에이전트에 관한 연구를 수행하였다. DEI는 n개의 멀티 에이전트이며 운전자에게 최적화된 경로를 제공할 수 있는 경로추천시스템에 활용되는 환경변수이다. DEI가 반영되는 경로추천 시스템은 멀티 에이전트 연구의 새로운 연구 분야라 할 수 있겠다. 이를 위하여 멀티에이전트 연구의 대표적 실험 환경인 먹이추적문제를 이용하여 새로운 해법을 찾고자 하였다. 본 논문에서는 기존의 먹이추적 실험은 현실성이 결여된 멀티에이전트 연구였기에 기존의 실험환경과 달리 현실세계와 비슷한 실험환경을 제안을 하며 새로운 전략인 Ant-Q 학습을 적용한 알고리즘과 기존의 방향벡터를 활용한 전략과의 비교를 통해 새로운 환경에서의 성능의 향상을 입증할 수 있었다.

Smooth 핸드오프를 이용한 Mobile IP의 성능 분석

  • 차재정;김두용;최덕규
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2000년도 춘계학술대회 논문집
    • /
    • pp.23-24
    • /
    • 2000
  • 최근 개인 이동 통신 단말기의 수요와 인터넷 사용자의 증가와 함께, 유선 통신 서비스에서부터 개인 휴대 통신 서비스에 이르기까지 다양한 통신 서비스가 제공되기 시작하면서 이러한 서비스가 결합된 mobile IP의 관심이 높아지고 있다. 기존의 IP에서는 노드가 계속해서 접속을 유지하기 위해서는 접속되는 위치가 반드시 고정적으로 지정되는 것이 필요하며 노드의 위치가 바뀌면 기존의 IP 주소는 사용할 수 없다. 그러나 mobile IP는 인터넷상의 임의의 다른 위치에 접속해 노드가 IP 주소를 바꾸지 않고 인터넷을 사용할 수 있도록 한다. 이동(mobile) 노드가 새로운 셀 지역으로 이동하면, 그 셀에 해당하는 외부(foreign) 에이전트로부터 임시 주소(care-of address)를 할당받아 홈 네트워크에 위치한 홈 에이전트에 등록하고, 홈 에이전트는 송신 노드가 이동노드로 전송한 패킷을 새롭게 등록된 임시 주소로 터널링을 통해 전달한다. 이러한 기본적인 mobile IP 방법은 모든 패킷이 홈 에이전트를 통해 이동 노드로 전송되므로 최적화된 라우팅 방법을 제공하지 못한다. 그러므로 이러한 mobile IP의 단점을 보완한 route optimization mobile IP가 제안되고 있다. Route optimization mobile IP는 이동 노드의 현재 위치와 관련된 정보를 갖는 바인딩을 저장하여 송신 노드가 패킷을 이동 노드의 홈 에이전트를 거치지 않고 이동 노드로 직접 전송하는 기능을 제공한다. 또한 이동 노드가 다른 셀 지역으로 핸드오프가 이루어질 경우, 핸드오프 발생전의 바인딩 정보를 이용하여 송신 노드가 전송한 패킷은 이전 셀 지역에 있는 에이전트가 새로운 셀 지역에 있는 이동 노드로 패킷을 재전송하여 전달하는 smooth 핸드오프 기능을 제공한다. 이전 셀 지역에 속한 외부 에이전트가 바인딩을 갱신하기 전에 송신 노드로부터 이동노드로 전달된 패킷이 있을 경우는 패킷을 저장하여 이후에 이동 노드의 위치 정보에 관한 바인딩 정보가 갱신되면 이러한 바인딩 정보에 따라 패킷을 재전송하는 버퍼기능도 제공한다. route optimization mobile IP는 기본적인 mobile IP에서의 복잡한 라우팅 문제를 해결하고, 핸드오프에서의 패킷 손실률을 최소화 한다.본 논문에서는 컴퓨터 시뮬레이션을 통해 smooth 핸드오프를 이용한 mobile IP의 성능을 분석한다. 일반적으로 데이터 트래픽 특성, 노드의 이동성, 바인딩 갱신시간, 버퍼관리 방법 등은 핸드오프 동안 mobile IP의 성능에 많은 영향을 미친다. 따라서 시뮬레이션 모델을 이용하여 다양한 트래픽 환경에서 위에 언급된 성능 파라미터들의 영향을 분석한다. 마지막으로 시뮬레이션 결과를 이용하여 mobile IP의 성능을 개선시키기 위한 방법을 제시한다.

  • PDF

경영 시뮬레이션 게임에서 PPO 알고리즘을 적용한 강화학습의 유용성에 관한 연구 (A Study about the Usefulness of Reinforcement Learning in Business Simulation Games using PPO Algorithm)

  • 양의홍;강신진;조성현
    • 한국게임학회 논문지
    • /
    • 제19권6호
    • /
    • pp.61-70
    • /
    • 2019
  • 본 논문에서는 경영 시뮬레이션 게임 분야에서 강화학습을 적용하여 게임 에이전트들이 자율적으로 주어진 목표를 달성하는지를 확인하고자 한다. 본 시스템에서는 Unity Machine Learning (ML) Agent 환경에서 PPO (Proximal Policy Optimization) 알고리즘을 적용하여 게임 에이전트가 목표를 달성하기 위해 자동으로 플레이 방법을 찾도록 설계하였다. 그 유용성을 확인하기 위하여 5가지의 게임 시나리오 시뮬레이션 실험을 수행하였다. 그 결과 게임 에이전트가 다양한 게임 내 환경 변수의 변화에도 학습을 통하여 목표를 달성한다는 것을 확인하였다.

라우팅 비용을 고려한 Mobile IP 핸드오버 방안 (A Mobile IP Handover Scheme Based on Routing Costs)

  • 박희동
    • 한국산업정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.178-185
    • /
    • 2008
  • 본 논문은 Mobile IPv4에서 단말의 핸드오버 후 새로운 패킷 전달 경로는 이전의 패킷 전달경로와 같거나 유사할 확률이 높다는 사실을 이용하여 핸드오버 지연 및 시그널링 비용을 최소화하는 방안을 제안하였다. 제안 방안에서는 단말의 등록요청메시지를 수신한 외부 에이전트가 라우팅 비용을 이용하여 현재의 라우팅 경로와 이전 라우팅 경로의 상관성을 추정한다. 만약 현재의 라우팅 경로가 이전 경로와 같거나 유사하다면, 단말은 홈 에이전트 또는 상대노드로의 등록 과정 없이 이전의 외부에이전트로부터 패킷을 전달받게 된다. 성능 분석 결과 제안 방안은 기존의 핸드오버 및 경로 최적화 방안에 비해 지연 및 시그널링 비용을 효율적으로 감소시킬 수 있음을 확인할 수 있었다.

  • PDF

진화계산 기반 인공에이전트를 이용한 교섭게임 (Bargaining Game using Artificial agent based on Evolution Computation)

  • 성명호;이상용
    • 디지털융복합연구
    • /
    • 제14권8호
    • /
    • pp.293-303
    • /
    • 2016
  • 근래에 진화 연산을 활용한 교섭 게임의 분석은 게임 이론 분야에서 중요한 문제로 다루어지고 있다. 본 논문은 교섭 게임에서 진화 연산을 사용하여 이기종 인공 에이전트 간의 상호 작용 및 공진화 과정을 조사하였다. 교섭게임에 참여하는 진화전략 에이전트들로서 유전자 알고리즘(GA), 입자군집최적화(PSO) 및 차분진화알고리즘(DE) 3종류를 사용하였다. GA-agent, PSO-agent 및 DE-agent의 3가지 인공 에이전트들 간의 공진화 실험을 통해 교섭게임에서 가장 성능이 우수한 진화 계산 에이전트가 무엇인지 관찰 실험하였다. 시뮬레이션 실험결과, PSO-agent가 가장 성능이 우수하고 그 다음이 GA-agent이며 DE-agent가 가장 성능이 좋지 않다는 것을 확인하였다. PSO-agent가 교섭 게임에서 성능이 가장 우수한 이유를 이해하기 위해서 게임 완료 후 인공 에이전트 전략들을 관찰하였다. PSO-agent는 거래 실패로 인해 보수를 얻지 못하는 것을 감수하고서라도 가급적 많은 보수를 얻기 위한 방향으로 진화하였다는 것을 확인하였으며, 반면에 GA-agent와 DE-agent는 소량의 보수를 얻더라도 거래를 성공시키는 방향으로 진화하였다는 것을 확인하였다.