DOI QR코드

DOI QR Code

Simple Q-learning using heuristic strategies

휴리스틱 전략을 이용한 Q러닝의 학습 간단화

  • Published : 2018.10.31

Abstract

강화학습은 게임의 인공지능을 대체할 수 있는 수단이지만 불완전한 게임에서 학습하기 힘들다. 학습하기 복잡한 불완전안 카드게임에서 휴리스틱한 전략을 만들고 비슷한 상태끼리 묶으면서 학습의 복잡성을 낮추었다. 인공신경망 없이 Q-러닝만으로 게임을 5만판을 통해서 상태에 따른 전략을 학습하였다. 그 결과 동일한 전략만을 사용하는 대결보다 승률이 높게 나왔고, 다양한 상태에서 다른 전략을 선택하는 것을 관찰하였다.

Keywords

Acknowledgement

Supported by : 한국연구재단