• 제목/요약/키워드: Markov Games

검색결과 15건 처리시간 0.022초

Some Recent Results of Approximation Algorithms for Markov Games and their Applications

  • 장형수
    • 한국전산응용수학회:학술대회논문집
    • /
    • 한국전산응용수학회 2003년도 KSCAM 학술발표회 프로그램 및 초록집
    • /
    • pp.15-15
    • /
    • 2003
  • We provide some recent results of approximation algorithms for solving Markov Games and discuss their applications to problems that arise in Computer Science. We consider a receding horizon approach as an approximate solution to two-person zero-sum Markov games with an infinite horizon discounted cost criterion. We present error bounds from the optimal equilibrium value of the game when both players take “correlated” receding horizon policies that are based on exact or approximate solutions of receding finite horizon subgames. Motivated by the worst-case optimal control of queueing systems by Altman, we then analyze error bounds when the minimizer plays the (approximate) receding horizon control and the maximizer plays the worst case policy. We give two heuristic examples of the approximate receding horizon control. We extend “parallel rollout” and “hindsight optimization” into the Markov game setting within the framework of the approximate receding horizon approach and analyze their performances. From the parallel rollout approach, the minimizing player seeks to combine dynamically multiple heuristic policies in a set to improve the performances of all of the heuristic policies simultaneously under the guess that the maximizing player has chosen a fixed worst-case policy. Given $\varepsilon$>0, we give the value of the receding horizon which guarantees that the parallel rollout policy with the horizon played by the minimizer “dominates” any heuristic policy in the set by $\varepsilon$, From the hindsight optimization approach, the minimizing player makes a decision based on his expected optimal hindsight performance over a finite horizon. We finally discuss practical implementations of the receding horizon approaches via simulation and applications.

  • PDF

마르코프 게임 학습에 기초한 다수 캐릭터의 경쟁적 상호작용 애니메이션 합성 (Learning Multi-Character Competition in Markov Games)

  • 이강훈
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제15권2호
    • /
    • pp.9-17
    • /
    • 2009
  • 다수 캐릭터가 경쟁적으로 상호작용하는 애니메이션의 합성은 컴퓨터 게임, 애니메이션 등의 응용분야에서 종종 요구되는 중요한 문제이다. 하지만 상대의 예측하기 어려운 행동에 효과적으로 대응하는 전략적 경쟁 양상을 모사하는 것은 어려운 문제로 남아있다. 본 논문은 다수 에이전트 학습 분야에서 제안된 마르코프 게임 강화학습 알고리즘을 촬영된 동작 데이터로부터 생성된 행위 모델에 적용하여 사실적인 경쟁 애니메이션을 합성하는 방식을 제안한다. 추격-회피, 간격 유지, 총격전 등의 다양한 경쟁적 상황에 대하여 효과적인 전략을 학습하여 흥미로운 애니메이션을 합성하는 예제들을 통하여 본 논문이 제안하는 방법의 효용성을 보인다.

  • PDF

Parrondo Paradox and Stock Investment

  • Cho, Dong-Seob;Lee, Ji-Yeon
    • 응용통계연구
    • /
    • 제25권4호
    • /
    • pp.543-552
    • /
    • 2012
  • Parrondo paradox is a counter-intuitive phenomenon where two losing games can be combined to win or two winning games can be combined to lose. When we trade stocks with a history-dependent Parrondo game rule (where we buy and sell stocks based on recent investment outcomes) we found Parrondo paradox in stock trading. Using stock data of the KRX from 2008 to 2010, we analyzed the Parrondo paradoxical cases in the Korean stock market.

공간의존 파론도 게임의 협력 효과 (Cooperative effect in space-dependent Parrondo games)

  • 이지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.745-753
    • /
    • 2014
  • 파론도 역설은 개별로는 지는 게임들이 결합하여 이기게 되거나 개별로는 이기는 게임들이 결합하여 지게 되는 역설적인 현상을 말한다. 여러 명의 게임자들이 둘러앉아 게임을 진행할 때, 임의로 선택된 게임자 본인의 과거 실적에 의해 승패 확률이 정해지는 경우와 게임자의 양옆에 있는 다른 게임자들의 실적에 의해 승패 확률이 정해지는 경우를 비교한다. 게임자들의 수와 승패 확률에 의해 계산되는 기대상금을 비교하여 협력에 의한 파론도 효과가 존재함을 확인한다.

집단 파론도 게임의 최적 전략 (Optimal strategies for collective Parrondo games)

  • 이지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.973-982
    • /
    • 2009
  • 파론도 게임은 두 개의 지는 게임을 주기적으로 반복하거나 혹은 임의적으로 선택하면 궁극적으로 이기게 되는 역설적인 게임을 말한다. 여러 명의 게임자들이 파론도 게임을 구성하는 두 게임 중에서 하나를 집단적으로 선택해서 진행하는 게임을 고려하자. 본 논문에서는 이 집단 파론도 게임의 모든 모수의 범위에서 장기적으로 기대상금을 최대화하는 최적의 게임 선택 기준이 무엇인지를 찾고 그 기대상금을 구한다.

  • PDF

컴퓨터 게임에서 HMM 기반의 명령어 신호 처리 시간 단축을 위한 방법 (A HMM-based Method of Reducing the Time for Processing Sound Commands in Computer Games)

  • 박도생;김상철
    • 한국게임학회 논문지
    • /
    • 제16권2호
    • /
    • pp.119-128
    • /
    • 2016
  • 컴퓨터 게임에서 대부분의 사용자 인터페이스 방법은 키보드, 마우스, 터치스크린이다. 사운드 형태 명령어의 전체 처리 시간은 크게 명령어 입력 시간과 인식 시간으로 구성된다. 본 논문은 명령어 신호 전체를 입력받지 않고 일부 앞부분 신호만을 받음으로써, 입력 시간을 줄여 전체 처리 시간을 단축하는 방법을 제안한다. 우리의 방법에서는 HMM(Hidden Markov Process)를 이용해 명령어 신호를 인식하는데, 전체 신호 및 부분 신호들에 대해 별도의 HMM을 구성한다. 플랫홈 게임의 대표 명령어들을 음성과 손바닥 소리로 표현해, 본 논문의 방법을 실험했다. 실험 결과, 인식률의 큰 저하 없이 명령어 처리 시간을 줄임을 알 수 있었다. 본 연구는 게임의 사용자 인터페이스 방법을 다양화하는데 기여할 것이다.

공간의존 파론도 게임과 주식 투자 (Spatially dependent Parrondo games and stock investments)

  • 조동섭;이지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.867-880
    • /
    • 2012
  • 파론도 역설은 개별로는 지는 게임들이 결합하여 이기게 되거나 개별로는 이기는 게임들이 결합하여 지게 되는 역설적인 현상을 말한다. 본 논문에서는 주변의 투자 결과에 의해 매수 종목을 정하는 공간의존 파론도 게임의 규칙을 적용하여 매일 주식을 사고 파는 경우에 각 포트폴리오의 거래당 기대수익금을 계산하고, 2008년부터 2010년까지의 한국거래소의 주식 데이터를 이용하여 주식 투자에서도 파론도 역설 현상이 존재함을 확인한다.

공간의존 파론도 게임의 재분배 모형 (A redistribution model for spatially dependent Parrondo games)

  • 이지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.121-130
    • /
    • 2016
  • N명의 게임자들이 둥글게 둘러앉아 공간의존 파론도 게임 B를 실시한다. 게임 B는 여러 명의 게임자들 중에서 한 명을 임의로 선택하고, 선택된 게임자는 양 옆에 있는 두 명의 게임자들의 상태에 따라 앞면이 나올 확률이 달라지는 동전을 던져서 앞면이 나오면 1원을 얻고 뒷면이 나오면 1원을 잃는다. 게임 A'은 임의로 선택된 게임자가 나머지 N - 1명의 게임자들 중에서 한 명을 임의로 선택하여 본인의 상금 1원을 전달하는 게임으로 전체 게임자들의 총 상금에는 변함이 없으므로 전체 게임자들에게는 항상 공정한 게임이다. 만약 게임 B가 지는 게임인 반면에 두 게임 A'와 B를 결합한 혼합게임 C는 이기는 게임이 되면 파론도 효과가 존재하고, 게임 B가 이기는 게임이고 혼합게임 C는 지는 게임이면 역파론도 효과가 존재한다고 한다. 먼저 마코프 체인의 상태공간의 축소를 위한 lumpability 조건이 게임 A', B 그리고 혼합게임 C에 대해 만족함을 보이고, 축소된 상태공간에서 게임 B와 C의 기대상금을 계산한다. 이를 이용하여 파론도 효과와 역파론도 효과의 존재를 확인하고, 특별히 $3{\leq}N{\leq}6$의 경우에는 파론도 효과와 역파론도 효과가 존재하는 확률 모수의 영역을 도식화 한다.

은닉 마르코프 모델 기반 동작 인식 방법 (Human Primitive Motion Recognition Based on the Hidden Markov Models)

  • 김종호;윤요섭;김태영;임철수
    • 한국멀티미디어학회논문지
    • /
    • 제12권4호
    • /
    • pp.521-529
    • /
    • 2009
  • 본 논문은 비전 기반 동작 인식 방법으로 모범 동작의 유형을 모형화하고 이를 이용하여 사용자의 동작을 인식하고 모범동작과 사용자의 동작간의 유사도를 측정하는 방법을 제안한다. 동작 인식을 위하여 은닉 마르코프 모델 기반의 유형화 기법을 통하여 모범 동작의 유형 모델을 구성하고 이를 이용하여 사용자의 동작을 인식한다. 유사도 측정을 위하여 편집 거리 알고리즘을 응용하여 모범 동작과 사용자 동작의 유사도를 측정하고 점수 표기가 가능하도록 하였다. 본 논문에서 제안하는 동작 인식 처리 방법은 평균 93% 이상의 높은 인식율을 보였다. 본 연구의 결과는 동작 인식 기반 게임, 자세인식, 동작의 반복 훈련 및 훈련 달성도 측정을 요하는 재활훈련 시스템 등에 활용 가능하다.

  • PDF

과거의존 파론도 게임의 재분배 모형 (A redistribution model of the history-dependent Parrondo game)

  • 진건주;이지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.77-87
    • /
    • 2015
  • 파론도 역설은 두 개의 지는 게임이 결합하여 이기게 되거나, 두 개의 이기는 게임이 결합하여 지게 되는 현상을 말한다. 본 논문에서는 여러 명으로 구성된 집단에서 임의로 한 명을 선택하여 본인의 과거 실적에 의해 승패 확률이 정해지는 과거의존 파론도 게임을 실시하거나 또는 단순히 상금을 임의로 선택한 또 다른 사람에게 전달만 하는 게임을 진행하는 경우를 살펴본다. 각 게임은 지거나 공정한 게임인 반면에 두 게임을 임의로 결합한 혼합게임은 이기게 되는 파론도 효과가 존재함을 확인한다. 또한 각 게임은 이기거나 공정한 게임인데 임의로 결합한 혼합게임은 지게 되는 역 파론도 효과가 존재하는 확률 모수의 범위도 완성한다.