Udacity-Deep-Reinforcement-Learning-p3-collaborati

文件名称: Udacity-Deep-Reinforcement-Learning-p3-collaboration-and-competition-源码

所属分类: 其它

开发工具:

文件大小: 1mb

下载次数: 0

上传时间: 2021-03-06

提供者: weixin_********

下载 (1mb)

不能下载？报告错误

详细说明：Udacity深度强化学习p3合作与竞争该项目的目标是训练网球环境。该环境基于Unity ML代理。问题描述在这种环境下，两名特工控制球拍在球网上弹跳球。如果探员将球击中网，则得到+0.1的奖励。如果探员让一个球击中地面或将球击出界外，则其获得的奖励为-0.01。因此，每个特工的目标是保持比赛中的球权。观察空间由8个变量组成，分别对应于球和球拍的位置和速度。每个代理都会收到自己的本地观察结果。有两个连续的动作可用，分别对应于朝向（或远离）网络的运动和跳跃。该任务是情节性的，并且为了解决环境，您的特工必须获得+0.5的平均分数（在两个特工均取得最高分后，连续100次以上）。具体来说，在每个情节之后，我们将每个代理商获得的奖励加起来（不打折），以获得每个代理商的得分。这将产生2个（可能不同）的分数。然后，我们取这两个分数中的最大值。这为每个情节产生一个单一

(系统自动生成,下载前可以参看下载内容)