您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 模仿学习限制螺栓-源码

  2. 带有约束螺栓的异物仿制学习 额外的学习案例 在强化学习中,发现建模精确的奖励函数(导致代理商的期望行为)具有挑战性是一个常见的问题。 逆向强化学习旨在从专家代理提供的一组动作和观察中提取奖励功能,这可以是另一种训练有素的模型,基于模型的方法甚至是人类。 模仿学习是学习者从专家的行为中尝试的技术。 在该存储库中,探索了“约束螺栓”方法,该方法在一文中有详细描述 (De Giacomo等,2020年)。 环境:突围 特征 目标:卸下所有砖柱。 至少有1行3列砖 专家在左边。 用火作为摧毁砖块的行动
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:160mb
    • 提供者:weixin_42155721
  1. 突围克隆-源码

  2. 突围克隆 使用Udemy corse在C#和Unity中创建的Block Breaker“完成C#Unity游戏开发人员2D”第5节
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:30mb
    • 提供者:weixin_42099151
  1. frontend_breakout-源码

  2. 键盘突围 键盘突围是一款小型浏览器游戏,使用Javascr ipt前端和Ruby on Rails后端构建。 如何使用 Keyboard Breakout建立在Ruby 2.6.1之上,并使用npm安装节点模块。您可能需要类似的设置才能使其正确运行。 安装 首先,克隆或下载和 将两个文件都放入一个名为keyboard_breakout的目录中 cd进入frontend_breakout目录并运行npm install以安装所有必需的模块。 cd ..安装完成后,返回到keyboard_brea
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:167kb
    • 提供者:weixin_42151599