Simple Q-learning using heuristic strategies

Park, Jong-cheol;Kim, Hyeon-cheol;

doi:10.3745/PKIPS.y2018m10a.708

Annual Conference of KIPS (한국정보처리학회:학술대회논문집)

2018.10a
/
Pages.708-710
/
2018
/
2005-0011(pISSN)
/
2671-7298(eISSN)

Korea Information Processing Society (한국정보처리학회)

DOI QR Code

Simple Q-learning using heuristic strategies

휴리스틱 전략을 이용한 Q러닝의 학습 간단화

Park, Jong-cheol (Dept. of Computer Science, Korea University) ;
Kim, Hyeon-cheol (Dept. of Computer Science, Korea University)

박종철 (고려대학교 컴퓨터학과) ;
김현철 (고려대학교 컴퓨터학과)

Published : 2018.10.31

https://doi.org/10.3745/PKIPS.y2018m10a.708 Citation PDF

Download PDF

⟨ Previous Next ⟩

Abstract

강화학습은 게임의 인공지능을 대체할 수 있는 수단이지만 불완전한 게임에서 학습하기 힘들다. 학습하기 복잡한 불완전안 카드게임에서 휴리스틱한 전략을 만들고 비슷한 상태끼리 묶으면서 학습의 복잡성을 낮추었다. 인공신경망 없이 Q-러닝만으로 게임을 5만판을 통해서 상태에 따른 전략을 학습하였다. 그 결과 동일한 전략만을 사용하는 대결보다 승률이 높게 나왔고, 다양한 상태에서 다른 전략을 선택하는 것을 관찰하였다.

Keywords

Acknowledgement

Supported by : 한국연구재단

Annual Conference of KIPS (한국정보처리학회:학술대회논문집)

Simple Q-learning using heuristic strategies

휴리스틱 전략을 이용한 Q러닝의 학습 간단화

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)