您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Udacity-Deep-Reinforcement-Learning-p3-collaboration-and-competition-源码

  2. Udacity深度强化学习p3合作与竞争 该项目的目标是训练网球环境。 该环境基于Unity ML代理。 问题描述 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或将球击出界外,则其获得的奖励为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性
  3. 所属分类:其它

  1. ML-Competition-源码

  2. ML竞争 [亚历克斯·朱拉多(Alex Jurado),菲利普·萨米蒂尔(Felip Samitier)和卡洛斯·马丁内斯(Carlos Martinez) [2021年3月,巴塞罗那,全职数据分析训练营] 比赛说明 在训练营期间,我们进行了一次机器学习竞赛,我们不得不预测Cookie的质量。 我们在第一天就得到了一个数据集,我们有一天半的时间来处理这些数据集,以找到具有最佳参数的最佳模型。 具有最佳状态的球队获胜。 组织与流程 我们首先使用一些可视化工具探索数据,然后清理和格式化数据集以对其
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:151kb
    • 提供者:weixin_42114041
  1. udacity-drlnd-project-3-Collaboration-and-Competition:深度强化学习纳米学位项目3-源码

  2. 项目3:合作与竞争 该存储库包含项目3的实现。 项目详情 待定 入门 Python环境 如果您在自己的环境中运行该项目,则需要安装一些软件包。 的Python == 3.6 pytorch == 0.4 mlagents == 0.4(Unity ML代理) 或者,您可以在jupyter笔记本上运行该项目。 依存关系 要设置您的python环境(使用conda)以在项目中运行代码,请遵循以下说明。 使用Python 3.6创建并激活新环境 conda create --name pro
  3. 所属分类:其它