Relative Feedback with Reinforcement Learning

강화학습을 사용한 연관성 피드백

  • 이승준 (서울대학교 전기컴퓨터공학부) ;
  • 장병탁 (서울대학교 전기컴퓨터공학부)
  • Published : 2002.04.01

Abstract

본 논문은 웹 문서 여과시 사용자 모델링을 위해 사용되는 연관성 피드백 방법을 강화 학습 프레임웍에서 분석하고 강화학습 기반의 새로운 연관성 피드백 알고리즘을 제안한다. 제안된 방법은 강화 학습 프레임책상에서 기존의 방법을 일반화한 것으로 기존의 연관성 피드백 방법이 현재의 프로파일만을 상태로 사용하는 데 비해 과거 history부터 얻는 추가 정보를 사용하는 방법이다

Keywords