DOI QR코드

DOI QR Code

State Normalization and Dense Reward Based Reinforcement Learning Method in Basketball Game.

농구 게임에서 상태 정규화 및 Dense 보상 기반 강화 학습 기법

  • Choi, Taehyeok (Dept of Multimedia Engineering, Dongguk University) ;
  • Cho, Kyungeun (Dept of Multimedia Engineering, Dongguk University)
  • 최태혁 (동국대학교 멀티미디어공학과) ;
  • 조경은 (동국대학교 멀티미디어공학과)
  • Published : 2022.11.21

Abstract

최근 강화 학습을 적용한 게임 AI 에 대한 연구가 활발히 진행되고 있다. 하지만 대부분 상용게임은 유한 상태 머신(Finite State Machine, FSM)을 이용한 스크립트 기반 AI 를 사용하기 때문에 복잡한 환경의 게임에서 불안정한 상태로 인해 적절한 강화 학습의 수행이 어렵다. 따라서 본 논문에서는 상용 게임 강화 학습 적용을 위하여 상태 정규화 및 Dense 보상 기반 강화 학습 기법을 제안한다. 제안한 기법을 상용 농구 게임에 적용하고 학습된 모델의 성능을 기존 FSM 기반 AI 와 비교를 통해 성능이 약 80% 증가한 결과를 확인하였다.

Keywords

Acknowledgement

본 연구는 문화체육관광부 및 한국콘텐츠진흥원의 2022 년도 문화기술 연구개발 사업으로 수행되었음(과제명 : 스포츠 게임 분야 첨단 AI 기술 R&D 전문인력 양성, 과제번호 : R2022020003, 기여율: 00%)