통합 검색 | Korea Science

정석일;이연정
- 한국지능시스템학회논문지
- /
- 제11권5호
- /
- pp.388-394
- /
- 2001
강화학습은 에이전트가 환경과의 상호작용을 통해 획득한 경험으로부터 제어 규칙을 학습하는 방법이다. 강화학습의 중요한 문제 중의 하나인 신뢰 할당 문제를 해결하기 위해 기여도가 사용되는데, 누적 기여도나 대체 기여도와 같은 기존의 기여도를 이용한 방법은 방문한 상태에서 수행된 행위만을 학습시키기 때문에 학습 자정에서 획득된 보답 신호를 효과적으로 사용하지 못한다. 본 논문에서는 방문한 상태에서 수행된 행위뿐만 아니라 인접 행위들도 학습될 수 있도록 하는 새로운 기여도로써 분포 기여도를 제안한다. 제안된 기여도를 이용한 퍼지 Q-learning 알고리즘을 역진자 시스템에 적용하여 학습 속도면에서 기존의 방법에 비해 우수함을 보인다.
PDF

이현우;우상철;윤종호
- 한국통신학회논문지
- /
- 제22권9호
- /
- pp.2027-2034
- /
- 1997
프레임 릴레이는 망에서의 오류제어와 흐름제어 기능을 제거하여, TI 또는 EI의 속도로 원거리에서 다양한 길이를 갖는 프레임을 전송하고 다중화하는 고속 패킷 교환 기술이다. 그리고 오류제어와 흐름제어의 생략의 결과로 발생하는 망에서의 혼잡을 피하고 복구하기 위해서는 일반적으로 몇가지의 혼잡제어 방식이 쓰이는데, 본 연구에서는 프레임 릴레이망에서 DE비트를 사용하여 전송률을 강제적으로 조정하는 혼잡제어 방식에 대해서 수치적으로 성능해석을 수행하였다. 수치적인 해석을 위하여 각각의 프레임이 Poisson 분포를 따르며 지수분포 길이로 도착한다고 가정하고 시스템의 크기가 K인 경우, 프레임 릴레이 교환기를 하나의 서버와 K-1(1
PDF