[关闭]
@natsumi 2017-09-14T04:48:08.000000Z 字数 362 阅读 814

【论文】An Algorithm for Distributed Reinforement Learning in Cooperative Multi-Agent Systems

机器学习


摘要

本文关注多智能体协作决策过程中的分布式强化学习。多个智能体同时独立执行动作,以达到最大的return(discounted sum of rewards)。假设每个agent不知道其他agent的行为。但是和单Agent的强化学习不同,每个agent必须考虑其他agent的行为,来找到协作的策略。本文针对多智能体协作决策过程提出一个model-free的分布式q学习算法。可以证明在确定性环境下,这个算法能找到最优策略。相比集中式的强化学习没有任何额外的开销。不需要agent间进行额外的通信。

翻完摘要发现是确定性环境。。感觉可以不用继续下去了。。再见。。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注