• 제목/요약/키워드: dynamic game

검색결과 274건 처리시간 0.028초

강화 학습에 기초한 로봇 축구 에이전트의 설계 및 구현 (Design and implementation of Robot Soccer Agent Based on Reinforcement Learning)

  • 김인철
    • 정보처리학회논문지B
    • /
    • 제9B권2호
    • /
    • pp.139-146
    • /
    • 2002
  • 로봇 축구 시뮬레이션 게임은 하나의 동적 다중 에이전트 환경이다. 본 논문에서는 그러한 환경 하에서 각 에이전트의 동적 위치 결정을 위한 새로운 강화학습 방법을 제안한다. 강화학습은 한 에이전트가 환경으로부터 받는 간접적 지연 보상을 기초로 누적 보상값을 최대화할 수 있는 최적의 행동 전략을 학습하는 기계학습 방법이다. 따라서 강화학습은 입력-출력 쌍들이 훈련 예로 직접 제공되지 않는 다는 점에서 교사학습과 크게 다르다. 더욱이 Q-학습과 같은 비-모델 기반의 강화학습 알고리즘들은 주변 환경에 대한 어떤 모델도 학습하거나 미리 정의하는 것을 요구하지 않는다. 그럼에도 불구하고 이 알고리즘들은 에이전트가 모든 상태-행동 쌍들을 충분히 반복 경험할 수 있다면 최적의 행동전략에 수렴할 수 있다. 하지만 단순한 강화학습 방법들의 가장 큰 문제점은 너무 큰 상태 공간 때문에 보다 복잡한 환경들에 그대로 적용하기 어렵다는 것이다. 이런 문제점을 해결하기 위해 본 연구에서는 기존의 모듈화 Q-학습방법(MQL)을 개선한 적응적 중재에 기초한 모듈화 Q-학습 방법(AMMQL)을 제안한다. 종래의 단순한 모듈화 Q-학습 방법에서는 각 학습 모듈들의 결과를 결합하는 방식이 매우 단순하고 고정적이었으나 AMMQL학습 방법에서는 보상에 끼친 각 모듈의 기여도에 따라 모듈들에 서로 다른 가중치를 부여함으로써 보다 유연한 방식으로 각 모듈의 학습결과를 결합한다. 따라서 AMMQL 학습 방법은 큰 상태공간의 문제를 해결할 수 있을 뿐 아니라 동적인 환경변화에 보다 높은 적응성을 제공할 수 있다. 본 논문에서는 로봇 축구 에이전트의 동적 위치 결정을 위한 학습 방법으로 AMMQL 학습 방법을 사용하였고 이를 기초로 Cogitoniks 축구 에이전트 시스템을 구현하였다.

완전 몰입형 가상현실로 인한 사이버 멀미가 동적 균형에 미치는 영향 (The Effect of Dynamic Balance on Cyber Motion Sickness of Full Immersion Virtual Reality)

  • 김나은;김유림;문상철;이동훈;임호정;장은경;홍지은;강종호
    • 융합정보논문지
    • /
    • 제8권1호
    • /
    • pp.131-138
    • /
    • 2018
  • 본 연구는 완전 몰입형 가상현실 장비의 사용으로 발생하는 사이버 멀미로 인해 야기된 동적균형의 변화가 낙상을 일으키는지 알아보고자 하였다. 연구의 취지를 이해하고 자발적으로 참여에 동의한 균형감각이 정상인 20대 성인남녀 39명을 대상으로 VR착용 전과 후의 멀미지수, 심박수를 측정하고 Biorescue의 안정성 한계 검사를 실시하였다. 가상현실 체험을 위한 도구로 Samsung gear VR을 이용하였고, To the Homeland 라는 게임을 20분간 실시하였다. VR착용 후 동적균형훈련이 약간 감소하였으나 통계적으로 유의한 차이는 없었다. VR착용 전과 후의 멀미변화는 멀미설문조사를 통해 통계적으로 유의한 차이가 있음을 알 수 있었다. 심박수 변화는 Pulse Oximeter을 이용하여 심박수 증가를 보여 통계적으로 유의한 차이가 있었다. 일반인을 대상으로 완전 몰입형 가상현실 체험은 멀미가 유발되나 동적균형문제에는 다소 영향을 미치지 못하였다. 그렇기 때문에 VR 착용으로 인한 사이버멀미는 균형감소와 낙상을 유발시키지 않는다.

내부기생충의 진화과정을 모방한 인공적응 모형 (An Artificial Adaptation Model by Means of the Endoparasitic Evolution Process)

  • 김여근;이효영;김재윤
    • 대한산업공학회지
    • /
    • 제27권3호
    • /
    • pp.239-249
    • /
    • 2001
  • Competitive coevolution models, often called host-parasite models, are searching models that imitate the biological coevolution that is a series of reciprocal changes in two competing species. The models are known to be an effective method of solving complex and dynamic problems such as game problems, neural network design problems and constraint satisfaction problems. However, previous models consider only ectoparasites that live on the outside of the host when designing the models, not considering endoparasites that live on the inside of the host. This has a limitation to exploiting some information. In this paper, we develop an artificial adaptation model simulating the process in which hosts coevolve with both ectoparasites and endoparasites. In the model, the endoparasites play important roles as follows. By means of them, we can keep the history on results of previous competition between hosts and parasites, and use endogeneous fitness, not exogeneous. Extensive experiments are carried out to show the coevolution phenomenon and to verify the performance of the proposed model. Nim game problems and neural network problems are used as test-bed problems. The results are reported in this paper.

  • PDF

슈타켈버그 모델을 이용한 적응적 네트워크 가격 결정 기법에 대한 연구 (Adaptive Network Pricing Scheme based on the Stackelberg Model)

  • 정우석;김승욱
    • 한국정보과학회논문지:정보통신
    • /
    • 제37권2호
    • /
    • pp.94-98
    • /
    • 2010
  • 무선 네트워크상에서 자원의 단위가격을 결정하는 문제는 매우 중요한 문제이다. 기존의 기법들은 네트워크 운영자 중심 혹은 사용자 중심의 방법들이었기 때문에 최근에는 운영자와 사용자 모두를 만족시킬 수 있는 새로운 기법이 요구되었다. 본 논문에서는 네트워크에서 제공하는 대역폭을 사용하여 정보를 전송하는 유저들이 얻는 이익과 네트워크 운영자가 얻는 이익을 포함한 사회 전체적인 이익인 사회적 편익(social welfare)을 최대화 할 수 있는 적응적 가격 결정 기법을 제안하였다. 제안된 기법에서는 게임이론의 일종인 슈타켈버그 게임과 수요-효율 그래프를 사용하여 현재 네트워크 상황에 적합한 최적가격을 결정하도록 설계하였고, 성능분석을 통해 제안된 기법이 기존의 가격결정 기법에 비해 우수한 성능을 가지는 것을 확인하였다.

광학식 모션 캡쳐(Optical Motion Capture)방식을 이용한 디지털 캐릭터 움직임 (Digital Character Motion Using Motion Capturing System)

  • 최태준;유석호;이동열;이완복
    • 한국콘텐츠학회논문지
    • /
    • 제7권8호
    • /
    • pp.109-116
    • /
    • 2007
  • 가상세계의 멀티미디어 콘텐츠에 있어 모션캡처는 게임, 영화, TV등 다양한 분야에서 활용되고 있다. 게임의 대부분은 모션캡처 기술이 활용되고 있다. 모션 캡처를 이용하면 보다 사실적이고 다이나믹한 화면을 나타낼 수 있을 뿐만 아니라 이전의 키 프레임(Key-Framing)방식보다 시간과 금전적 측면에서 우수할 뿐만 아니라 질적인 면에서도 훨씬 뛰어난 이점이 있다. 그러나 몇몇 전문 업체에서 활용하고 있으며 학계에서는 아직 사용 예가 매우 부족하며, 활용 시 문제점에 대해서도 많이 알려지지 않았다. 본 논문에서는 모션 캡처 장비 중 광학식 모션캡처를 이용하여 다양한 동작의 모션 데이터를 발췌하고, 사람과 다른 캐릭터에 적용할 시 나타나는 문제점에 대해 고찰해 보았다.

A Comparative Study on Behavior-based Agent Control for Computer Games

  • 김태희
    • 한국게임학회 논문지
    • /
    • 제2권2호
    • /
    • pp.37-45
    • /
    • 2002
  • 컴퓨터 게임은 실세계에 대한 시뮬레이션으로 간주되어질 수 있다. 소프트웨어 에이젼트의 제어 문제는 인공지능 분야에서 오랫동안 연구되어져 왔으며, 이는 행동기반 접근법이라는 것을 내놓았다. 인공지능 분야에서는 지금까지 크게 세 가지의 접근법을 볼 수 있다. 인지주의는 기호의 형태로 지능이 표현되어질 수 있고 다루어질 수 있다는 것을 제안하였으며, 연결주의에서는 표현이 신체 구조에 내포되어있어서 신체로부터 분리되어질 수 없음이 강조되었다. 행동기반 접근법에서는 인공지능은 동적인 성질을 가져서 어디서든지 존재하지 않는 대신에 에이젼트가 환경에서 행동할 때 비로소 우러나오는 성질을 가진 것으로 제시된다. 본 논문에서는 이러한 세 가지의 접근법을 비교하고 행동기반 접근법의 타당성과 문제점 에 대하여 논한다. 본 논문은 또한 행동기반 접근법의 컴퓨터 게임의 에이젼트 제어에 대한 활용을 제안한다.

  • PDF

Short Term Spectrum Trading in Future LTE Based Cognitive Radio Systems

  • Singh, Hiran Kumar;Kumar, Dhananjay;Srilakshmi, R.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권1호
    • /
    • pp.34-49
    • /
    • 2015
  • Market means of spectrum trading have been utilized as a vital method of spectrum sharing and access in future cognitive radio system. In this paper, we consider the spectrum trading with multiple primary carrier providers (PCP) leasing the spectrum to multiple secondary carrier providers (SCP) for a short period of time. Several factors including the price of the resource, duration of leasing, and the spectrum quality guides the proposed model. We formulate three trading policies based on the game theory for dynamic spectrum access in a LTE based cognitive radio system (CRS). In the first, we consider utility function based resource sharing (UFRS) without any knowledge of past transaction. In the second policy, each SCP deals with PCP using a non-cooperative resource sharing (NCRS) method which employs optimal strategy based on reinforcement learning. In variation of second policy, third policy adopts a Nash bargaining while incorporating a recommendation entity in resource sharing (RERS). The simulation results suggest overall increase in throughput while maintaining higher spectrum efficiency and fairness.

대화형 광선 추적법을 위한 그림자 컬링 알고리즘 (A Shadow Culling Algorithm for Interactive Ray Tracing)

  • 나재호;박우찬;한탁돈
    • 한국게임학회 논문지
    • /
    • 제9권6호
    • /
    • pp.179-189
    • /
    • 2009
  • 본 논문은 대화형 광선 추적법에서 사용 가능한 새로운 그림자 컬링 알고리즘을 제안한다. 본 접근 방법은 그림자 자료 구조의 구축에 의한 전처리 방법 대신 프레임 간의 일관성을 이용하므로 동적 장면 상에서의 광선 추적법 처리에 적합하다. 본 알고리즘에서 그림자 계산 결과는 각각의 프리미티브 상에 저장이 되며 이 결과는 다음 프레임에 다시 사용된다. 또한 본 논문은 새로운 차폐 검사 방법을 제안한다. 이는 본 컬링 알고리즘에서 생길 수 있는 그림자 오류를 보정하며, 낮은 추가 비용을 요구한다. 실험 결과, 본 그림자 컬링 알고리즘은 7-19%의 탐색 비용 감소와 9-24%의 교차 비용 감소를 가져오는 것으로 나타났다.

  • PDF

공유자원의 효율적 경영을 위한 전략적 시나리오분석 (The Strategical Scenario Analysis for the Efficient Management of Resource in Open Access)

  • 최종두
    • 수산경영론집
    • /
    • 제42권3호
    • /
    • pp.31-39
    • /
    • 2011
  • This paper attempts to extend such analysis to the rather more difficult problem of optimal management of transnational fish stocks jointly owned by two countries. Transboundary fish such as Mackerel creates an incentive to harvest fish before a competitor does and leads to over-exploitation. This tendency is especially poignant for transnational stocks since, in the absence of an enforceable, international agreement, there is little or no reason for either government or the fishing industry to promote resource conservation and economic efficiency. In the current paper I examine a game theoretic setting in which cooperative management can provide more benefits than noncooperative management. A dynamic model of Mackerel fishery is combined with Nash's theory of two countries cooperative games. A characteristic function game approach is applied to describe the sharing of the surplus benefits from cooperation and noncooperation. A bioeconomic model was used to compare the economic yield of the optimal strategies for two countries, under joint maximization of net benefits in joint ocean. The results suggest as follows. First, the threat points represent the net benefits for two countries in absence of cooperation. The net benefits to Korea and China in threat points are 2,000 billion won(${\pi}^0_{KO}$) and 1,130 billion won(${\pi}^0_{CH}$). Total benefits are 3,130 billion won. Second, if two countries cooperate one with another, they reach the solution payoffs such as Pareto efficient. The net benefits to Korea and China in Pareto efficient are 2,785 billion won(${\pi}^0_{KO}$) and 1,605 billion won(${\pi}^0_{CH}$) or total benefits of 4,390 billion won : a gain of 1,260 billion won. Third, the different price effects under the two scenarios show that total benefit rise as price increases.

게임 환경에서의 지능형 다중 에이전트 개발 (Development of Intelligent Multi-Agent in the Game Environment)

  • 김동민;최진우;우종우
    • 인터넷정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.69-78
    • /
    • 2015
  • 다중 에이전트 시스템에 대한 연구는 최근 다양한 분야에서 활성화 되고 있으며, 복잡한 시스템의 제어 및 최적화에 관한 연구가 진행되어 왔다. 본 논문에서는 게임 환경에서의 NPC(Non-Player Character) 시뮬레이션을 위한 다중 에이전트 시스템을 개발한다. 시스템 개발의 목적은 동적 이산사건 영역의 상황을 추론하여 신속하고 정확한 판단을 제공하고 에이전트 시스템의 최적화 과정을 보다 손쉽게 도와주는데 있다. 이를 위한 에이전트 시스템의 기본 모델은 페트리넷을 활용하여 구조를 단순화 하고 퍼지 추론엔진을 사용하여 다양한 상황을 결정할 수 있도록 하였다. 본 연구 시스템의 실험은 NPC간의 가상 전장 상황을 묘사하며, 퍼지 규칙이 적용된 에이전트와 유한 상태 기계로 구현된 NPC를 시뮬레이션 하여 에이전트의 승률과 생존율을 산출하였다. 실험 결과 퍼지 규칙 기반 에이전트의 승률과 생존율이 유한 상태 기계로 구현된 NPC보다 더 높은 것으로 나타났다.