DRLND-Navigation：基于价值的方法。将深度学习架构应用于强化学习任务。训练自己的代

文件名称: DRLND-Navigation：基于价值的方法。将深度学习架构应用于强化学习任务。训练自己的代理，从感官数据导航虚拟世界-源码

所属分类: 其它

开发工具:

文件大小: 27mb

下载次数: 0

上传时间: 2021-02-20

提供者: weixin_********

下载 (27mb)

不能下载？报告错误

详细说明：项目1：导航介绍对于此项目，您将训练一个代理商在一个大而方形的世界中导航（并收集香蕉！）。提供+1的奖励以收集黄色香蕉，提供-1的奖励以收集蓝色香蕉。因此，代理商的目标是尽可能多地收集黄色香蕉，同时避免使用蓝色香蕉。状态空间具有37个维度，并包含主体的速度以及围绕主体前进方向的对象的基于射线的感知。有了这些信息，代理必须学习如何最好地选择动作。提供了四个离散操作，分别对应于： 0前进。 1向后移动。 2向左转。 3向右转。该任务是情节性的，并且为了解决环境，您的代理必须在100个连续情节中平均得分为+13。入门从下面的链接之一下载环境。您只需要选择与您的操作

(系统自动生成,下载前可以参看下载内容)