• 제목/요약/키워드: Game Optimal

검색결과 273건 처리시간 0.028초

효율적인 경로 선택을 위한 Q-Learning 정책 및 보상 설계 (Q-Learning Policy and Reward Design for Efficient Path Selection)

  • 용성중;박효경;유연휘;문일영
    • 한국항행학회논문지
    • /
    • 제26권2호
    • /
    • pp.72-77
    • /
    • 2022
  • 강화학습의 기법 중 Q-Learning은 주어진 상태에서 행동을 수행하면서 미래의 효율적인 기댓값을 예측하는 Q 함수를 학습하면서 최적의 정책을 학습하는 것이다. Q-Learning은 강화학습의 기본적인 알고리즘으로 많이 활용하고 있다. 본 논문에서는 Q-Learning을 바탕으로 정책과 보상을 설계하여 효율적인 경로를 선택하고 학습하는 효용성에 대하여 연구하였다. 또한 Frozen Lake 게임의 8x8 그리드 환경에 동일한 학습 횟수를 적용하여 기존 알고리즘 및 처벌 보상 정책과 제시한 처벌강화 정책의 결과를 비교하였다. 해당 비교를 통해 본 논문에서 제시한 Q-Learning의 처벌강화 정책이 통상적인 알고리즘의 적용보다 학습 속도를 상당히 높일 수 있는 것으로 분석되었다.

자기 적응형 교배기법을 이용한 반복적 죄수 딜레마 게임의 진화적 협동 수렴 분석 (Analysis on the a Self Adaptive Crossover for Iterated Prisoner's Dilemma Game of Evolutionary Convergence)

  • 김찬중;이종현;안창욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.478-481
    • /
    • 2010
  • 본 논문에서는 경제학, 사회학, 수학 분야에서 수십년 전부터 연구해오던 죄수의 딜레마 게임의 협동진화에 대해 고찰해보고자 한다. 반복적 죄수의 딜레마 게임은 게임이론의 가장 기본적인 이론으로써, 사회적 상호작용, 경제활동, 국제관계 등 다양한 현상들을 모델링 하기 위한 하나의 방법이다. 그 중에 N명이 참가하는 반복적 죄수 딜레마 게임의 전략은 유전 알고리즘(Genetic Algorithms, GAs)을 통해 진화적으로 만들어 낼 수 있으며, 이 경우에 그 결과를 일반적인 내쉬 균형 이 아닌, 모든 개체들이 유전알고리즘을 통해 협동으로 수렴하도록 유도할 수 있다는 사실은 상당히 시사하는 바가 크다. 기존에 주로 연구되어오던 죄수의 딜레마 게임은 협동으로의 수렴과정에서 일반적으로 순위기반선택(Rank-based selection)과 1점 교배기법(1point crossover)을 사용한다. 그러나 순위기반선택은 모든 개체에 순위을 매겨야 하기 때문에, 개체수가 커질수록 성능이 저하되며, 1점 교배기법은 개체 값이 분산되어있을 경우, 최적해(Optimal solution)을 찾기 힘들다는 단점이 있어, 개체수가 많은 경우에 적용하기에는 비효율적이다. 본 논문에서는 토너먼트 선택기법(Tournament selection)과 자기 적응형 교배기법(Self-adaptive crossover)을 적용한 새로운 기법을 제안한다. 또한 기존 기법과 비교 실험을 통해 제안기법이 기존기법에 비해 평균 수렴시간과 수렴 횟수에서 뛰어난 성능을 보이고 있음을 확인하였다.

이중 비밀 다층구조 네트워크에 기반한 전기주조 공정 시스템의 개선 (Improvement of Electroforming Process System Based on Double Hidden Layer Network)

  • 민병원
    • 사물인터넷융복합논문지
    • /
    • 제9권3호
    • /
    • pp.61-67
    • /
    • 2023
  • 구리의 전기주조 공정을 최적화하기 위하여 이중 비밀 다층구조의 역전파 뉴럴 네트워크가 구성된다. 샘플 학습을 통하여, 구리 전기주조 공정 조건과 목표 특성 간의 함수관계가 정확히 성취되고, 구리 전기주조 공정 내에서 다층구조의 미세강도와 장력에 대한 예측이 이루어진다. 예측된 결과는 펄스 전원공급기를 장착한 구리 피로인산염 솔루션 시스템 내에서 구리의 전해석출 시험에 의하여 증명된다. 그 결과는 다음과 같이 나타난다. "3-4-3-2" 구조의 이중비밀 다층구조 뉴럴 네트워크에 의하여 예측된 구리 다층구조의 미세강도와 장력은 실험값에 매우 근접하며 그 상대적 오차는 2.32%보다 작다. 주어진 파라미터의 범위 내에서, 구리의 미세강도는 100.3~205.6MPa이며, 장력은 112~485MPa 정도로 측정된다. 미세강도와 장력이 최적인 조건에서 그에 대응하는 공정 조건은 다음과 같다: 전류밀도는 2A·dm-2, 펄스 주파수는 2KHz, 펄스의 듀티싸이클은 10%이다.

태권도 품새 경기의 주관적 평가결과의 오차원 분석: 일반화가능도 이론 적용 (Analysis of error source in subjective evaluation results on Taekwondo Poomsae: Application of generalizability theory)

  • 조은형
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.395-407
    • /
    • 2016
  • 본 연구는 G-Theory를 적용하여 태권도 품새 평가항목에 대한 채점자 간 평가점수의 신뢰도를 추정하기 위해 G-연구로 경기일 수, 채점자 수를 다중오차원으로 선정하고 이들 변인간의 상호작용으로 인한 오차변량의 상대적 크기에 의해 오차원을 분석하고, G-연구의 결과를 토대로 D-연구를 수행하여 최적의 측정조건을 결정하는 데 목적이 있다. 결과를 요약하면 다음과 같다. G-Theory를 적용하여 태권도 품새 평가항목 중 정확성에 대해 분산성분 추정치를 추정한 결과, 오차의 영향력은 채점자국면에서 가장 크게 나타났으며, 각 설계에 따른 상호효과 (피험자 내), 피험자 간 순서였으며, 표현성 평가항목에 대한 분산성분 추정치 오차의 영향력은 상호효과 (피험자 내)국면에서 가장 크게 나타났으며, 각 설계에 따른 피험자 간, 채점자 국면 순으로 나타났다. 마지막으로 D-연구를 통하여 일반화가능도계수를 추정한 결과, 채점자 수에 따른 최적수준의 측정조건은 정확성 평가항목에서 8명의 채점자일 때 안정적인 신뢰도를 얻을 수 있으며, 표현성 평가항목에서는 7명의 채점자일 때 안정적인 신뢰도를 얻었다.

최적의 매매계약을 위한 지능형 에이전트 기반의 비즈니스 모형에 관한 연구 (A Study of Business Model Based on Intelligent Agents for Optimal Contract)

  • 정종진
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.131-146
    • /
    • 2004
  • 전자상거래가 활성화되면서 멀티에이전트를 비롯한 다양한 에이전트 기법을 전자상거래에 적용하여 구매자와 판매자간의 매매를 지능적으로 수행시키는 연구가 활발하게 이루어지고 있다. 그러나 기존의 연구들은 구매자와 판매자간의 매매 프로세스를 에이전트들이 수행하는 과정에서 에이전트의 지능적 능력이 부족하여 의사결정시 사용자의 개입을 요구하고 있다. 또한 사용자가 매매활동에서 중요하게 고려하는 항목들을 충분히 수용하지 못한 상태에서 서로 연결되는 수준에 머무르고 있다. 본 논문에서는 이러한 단점들을 극복하는 매매 프로세스를 위한 멀티에이전트 기반의 비즈니스 모형을 제안한다. 제안된 모형에서는 기존의 특정 항목을 중심으로 한 중개의 단점을 극복하고 사용자의 다양하고 차별적인 요구사항들을 만족시키면서 최적의 중개가 이루어지도록 하기 위하여 중개 프로세스에 CSP 기법을 적용한다. 또한 매매후보 에이전트들이 서로의 의견을 조정하면서 매매계약을 체결하기 위하여 게임이론에서의 협상모형을 응용한 에이전트들의 자동 협상 메커니즘을 제안한다. 이러한 중개 프로세스의 최적화 및 자동 협상을 위하여 제안 된 모형에서는 에이전트들이 경쟁계층, 제약만족계층, 협상계층을 통과하면서 매매계약 활동을 수행하도록 한다 이 때 에이전트 간 통신을 위하여 본 모형에서는 자체적으로 정의한 메시지 기반 통신 프로토콜을 설계 및 구현하였다. 본 논문에서는 제안한 모형을 기반으로 한 응용시스템들을 구현하고 다양한 실험 및 평가를 수행한다.

  • PDF

신주(新株)의 저가상장현상(低價上場現象)과 투자(投資)의 효율성(效率成)에 대한 연구(硏究) (Underpricing of Initial Offerings and the Efficiency of Investments)

  • 남일총
    • KDI Journal of Economic Policy
    • /
    • 제12권2호
    • /
    • pp.95-120
    • /
    • 1990
  • 비상장기업(非上場企業)이 최초로 주식시장(株式市場)에 발행하는 신주(新株)가 실제가치에 비해 낮은 가격(價格)에 상장(上場)되는 신주(新株)의 저평가현상(低評價現象)이 번번히 일어나고 있으나 아직 그 원인(原因)이 명확히 밝혀지고 있지 않다. 또한 신주발행(新株發行)을 통한 자본조달(資本調達)의 효율성(效率性)에 관한 기존(旣存)의 연구도 전무(前無)하다. 본고(本稿)에서는 기업(企業)의 수익성(收益性)에 관하여 기업주(企業主)의 우월(優越)한 정보(情報)를 가정한 신호경기적(信號競技的) 모델의 분석(分析)을 통하여 신주(新株)의 저가상장(低價上場) 원인(原因)을 밝혀내고 아울러 신주발행(新株發行)을 통한 자본조달(資本調達)의 효율성(效率性)을 검토해 보았다. 모델의 분리균형(分離均衡)의 분석(分析)을 통해 밝혀진 주요 결과는 다음과 같다. 고수익성(高收益性)프로젝트를 가진 기업주(企業主)는 프로젝트가 저수익성(低收益性)인 경우에는 선택할 유인(誘因)이 없는 발행조건 중 자신에게 가장 유리한 조건을 선택함으로써 투자자들에게 기업이 고수익성(高收益性)임을 입증(立證)하고자 하며 이 과정에서 선택된 고수익성기업(高收益性企業)의 발행조건의 성격은 다음과 같다. 첫째, 넓은 범위와 모수(母數)값에 대해 신주가격(新株價格)은 판매대금(販賣代金)이 기업(企業)에 유입(流入)된 이후 1주(株)에 해당하는 기업(企業)의 가치에 미달한다. 둘째, 기업(企業)에 유입(流入)되는 자본(資本)은 프로젝트로부터의 잠재적(潛在的) 이윤(利潤)을 극대화(極大化)하는 액수에 미달한다. 따라서 신주(新株)의 저가상장(低價上場)은 고수익성기업주(高收益性企業主)의 신호행위(信號行爲)의 결과이며 또한 신주(新株)의 저가상장(低價上場)은 저투자(低投資)를 의미한다.

  • PDF

시장 환경이 인터넷 경로를 포함한 다중 경로 관리에 미치는 영향에 관한 연구: 게임 이론적 접근방법 (The Impact of Market Environments on Optimal Channel Strategy Involving an Internet Channel: A Game Theoretic Approach)

  • 유원상
    • 한국유통학회지:유통연구
    • /
    • 제16권2호
    • /
    • pp.119-138
    • /
    • 2011
  • 지난 십년동안 인터넷을 통한 전자상거래는 빠른 속도로 성장해 왔다. 이러한 인터넷의 발달은 기업들의 사업방식에 많은 변화를 유도했으며, 그 중에서도 마케팅경로의 구조와 경로 구성원들 사이의 관계에 중요한 변화를 초래하고 있다. 각 기업이 처한 시장환경은 다양하며 이 다양한 시장 환경은 인터넷 경로가 각 시장에 미치는 효과를 조절하는 역할을 한다. 이러한 시장의 다양성에도 불구하고 지금까지의 선행연구들은 각기 특정한 하나의 시장상황(unique setting)을 상정하여 인터넷경로 도입이 그 시장에 미치는 영향을 분석하는데 그쳐왔다. 이러한 기존 연구의 공백을 채우기 위해 본 연구는 시장의 다양성을 소비자의 지리적 분포, 시장의 인터넷 수용도의 측면에서 살펴보고 이러한 시장 환경이 인터넷 경로 도입 효과에 미치는 영향에 관하여 조사해 보고자 한다. 이를 위해 본 연구는 다양한 소비자들의 지리적 분포, 경쟁강도, 소비자의 인터넷 상거래에 대한 수용도 등을 포함한 다양한 시장 환경을 수요모형에 반영시켜 그 영향력 분석을 가능하도록 하였다. 그러나, 다양한 시장 요소를 모형에 반영하는 과정에서 수요모형이 복잡한 구조를 가지게 되었다. 이 문제를 극복하고 게임이론의 균형해를 도출하기 위해 Newton-Raphson algorithm을 사용한 numerical search 방법을 사용하였다. 분석결과 두 종류의 경로에 대한 소비자선호의 분포에 따라 생산자의 가격차별정도, 생산자와 독립소매상 간의 경로이윤 배분율, 그리고 인터넷경로 도입이 각 경로주체의 이윤 향상에 도움이 되는지의 여부, 소비자잉여 등이 달라질 수 있음을 발견하였다. 끝으로 연구의 학술적, 실무적 시사점과 한계점 및 향후 연구방향도 논의되었다.

  • PDF

뇌졸중 환자의 로봇 재활 치료를 위한 실시간, 동시 및 비례형 근전도 제어 (Real-Time, Simultaneous and Proportional Myoelectric Control for Robotic Rehabilitation Therapy of Stroke Survivors)

  • 정영진;박혜연
    • 재활치료과학
    • /
    • 제7권1호
    • /
    • pp.79-88
    • /
    • 2018
  • 목적 : 본 연구에서는 뇌졸중 환자의 치료 효과를 증진시키기 위한 방법으로, 로봇 기반에 연속적이며, 실시간으로 환자의 의지에 따른 표면 근전도 신호에 비례한 제어가 가능한 최적 알고리즘을 구현 및 재활로봇과 PC소프트웨어에 적용기술을 개발하였다. 연구방법 : 뇌졸중 환자의 치료를 위한 재활로봇 제어 알고리즘 개발을 위해서 본 연구에서는 선형 재귀모델을 이용하였다. 또한, 이를 PC 소프트웨어에 적용하여 실제 근전도 신호에 비례하여 게임을 진행할 수 있도록 환경을 구축하였으며, 이를 활용하여 모의 훈련을 진행하였다. 결과 : 모의실험 결과 실제 움직인 위치와 선형 재귀모델로부터 추정된 위치의 결과가 상당히 유사하게 나타나는 것을 확인할 수 있었다. 또한 3명의 피험자를 대상으로 실험 한 결과, 3번의 각기 다른 시도에 따라 훈련이 진행되면서 그 결과가 좋아짐을 확인할 수 있었다. 결론 : 본 연구에서는 재활로봇에 적용 가능한 실시간으로 동작하는 근전도에 비례한 움직임을 유도해 낼 수 있는 선형 재귀 모델을 개발하였다. 또한, 이를 활용한 소프트웨어도 함께 구축하여 그 활용 가능성이 높음을 확인하였다. 향후 실제 재활로봇에 적용하여 자가-재활 및 원격재활 로봇에 기본 알고리즘으로 널리 활용될 수 있을 것이라 기대된다.

VR 콘텐츠의 사이버 멀미 유발 요인: 시점과 움직임의 효과에 대한 실험 연구 (Causes of Cyber Sickness of VR Contents: An Experimental Study on the Viewpoint and Movement)

  • 정지영;조광수;최진해;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제17권4호
    • /
    • pp.200-208
    • /
    • 2017
  • 가상현실 시장의 빠른 성장에도 불구하고 사이버멀미(Cyber sickness) 증상은 여전히 사용자 경험 차원에서 가장 심각한 문제점이다. 본 연구의 목적은 VR 콘텐츠의 시점과 움직임에 따라 사용자가 느끼는 멀미증상에 차이가 있는지 확인하는 것이다. 실험 설계를 통해 VR 헤드셋을 착용하고 게임 콘텐츠를 수행할 때 1인칭-3인칭의 시점 조건과 수직축-수평축의 머리 움직임 조건이 사이버 멀미에 영향을 미치는지 검증하였다. 분석 결과 3인칭보다 1인칭 시점에서, 수직축보다 수평축 회전 움직임 조건에서 멀미 증상이 더 심했다. VR 착용시의 시점과 움직임은 사이버 멀미에 영향을 미치지만, 시점과 움직임간의 상호작용은 나타나지 않았다. 이러한 결과에 기반하여 멀미감 감소와 함께 균형있는 VR 사용자 경험을 구축하기 위해 콘텐츠 기획에서 고려해야 실무적 요소들을 제시하였다. 적절 수준의 콘텐츠 몰입을 위한 시각적 디자인, 다중감각 인터페이스 디자인, 체험 마케팅 전략을 통해 VR의 긍정적 경험을 강화할 수 있다. 다양한 VR 콘텐츠 장르 개발을 위한 좌우 이동축에 대한 후속 연구를 제안하였다.

Formation of a Professional Communication Culture Among the Students Using Information Technologies

  • Vakulyk, Iryna;Koval, Valentyna;Lukiianchuk, Inna;Romanenko, Nataliia;Grygorenko, Tetyana;Balalaieva, Olena;Oros, Ildiko
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.75-82
    • /
    • 2022
  • Analyzing the psychological and pedagogical literature, we found the researchers' interest in the problem posed. The concept of "culture of professional communication» is considered, which is interpreted as the level of realization of creative abilities, exchange of messages, organization of mutual understanding, mutual knowledge in the process of professionally directed interaction between subjects, in which interpersonal relationships arise, manifest and form. The concept of "professional culture of communication of a teacher" is interpreted. The motives that are socially significant in the professional communication of the teacher are highlighted. The necessity of forming a culture of professional communication among students, in particular by means of information technologies in the present, is clarified. The interactive component of professional communication is considered. The types of interactions between people in everyday life (ritual and entertainment interaction, joint purposeful activity, no interaction, game and interpersonal interaction) are identified. Traditional and specific forms and methods of teaching are written out. All interactive technologies carried out by means of information technologies are conventionally divided into four groups, depending on the form of educational activity appropriate for their use (pair (work of the subject with the teacher or peers one on one by means of Information Technologies); frontal (the teacher simultaneously teaches a group of subjects by means of Information Technologies); group or cooperative (all subjects teach each other by means of Information Technologies); individual (independent work of the subject using Information Technologies)). In the higher education institution, future specialists should learn knowledge, acquire skills on the basic rules of the culture of professional communication and methods of interaction and their effective use, which is possible with the use of Information Technologies. Recommendations for optimal professional communication have been developed that help you express your thoughts easily and beautifully, and conduct a dialogue in a relaxed and harmonious way.