您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. DRLND-Navigation:基于价值的方法。 将深度学习架构应用于强化学习任务。 训练自己的代理,从感官数据导航虚拟世界-源码

  2. 项目1:导航 介绍 对于此项目,您将训练一个代理商在一个大而方形的世界中导航(并收集香蕉!)。 提供+1的奖励以收集黄色香蕉,提供-1的奖励以收集蓝色香蕉。 因此,代理商的目标是尽可能多地收集黄色香蕉,同时避免使用蓝色香蕉。 状态空间具有37个维度,并包含主体的速度以及围绕主体前进方向的对象的基于射线的感知。 有了这些信息,代理必须学习如何最好地选择动作。 提供了四个离散操作,分别对应于: 0前进。 1向后移动。 2向左转。 3向右转。 该任务是情节性的,并且为了解决环境,您的代理
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:27mb
    • 提供者:weixin_42143806