您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. OpenAI gym

  2. 在下载gym并安装完成后,可通过上述代码测试,python的版本要求3.5.x以上,运行python之后,复制文档中的代码即可运行。
  3. 所属分类:机器学习

    • 发布日期:2018-03-22
    • 文件大小:24kb
    • 提供者:qq_32218875
  1. 使用50行Python代码从零开始实现一个AI平衡小游戏

  2. 集智导读: 本文会为大家展示机器学习专家 Mike Shi 如何用 50 行 Python 代码创建一个 AI,使用增强学习技术,玩耍一个保持杆子平衡的小游戏。所用环境为标准的 OpenAI Gym,只使用 Numpy 来创建 agent。 各位看官好,我(作者 Mike Shi——译者注)将在本文教大家如何用 50 行 Python 代码,教会 AI 玩一个简单的平衡游戏。我们会用到标准的 OpenAI Gym 作为测试环境,仅用 Numpy 创建我们的 AI,别的不用。 这个小游戏就是经典
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:284kb
    • 提供者:weixin_38704386
  1. Upside-Down-Reinforcement-Learning:PyTorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文-源码

  2. 颠倒的强化学习 Pytorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文: 该存储库包含一个离散动作空间以及一个针对OpenAI Gym CartPole环境(该环境的版本)的连续动作空间实现。 笔记本包括行为功能的培训以及评估部分,您可以在其中测试经过培训的行为功能。 用代理人在期望的时间范围内可以达到的期望的报酬来喂养它。 离散CartPole环境的图: 连续CartPole环境的图: LunarLander环境的图: 去做: 测试论文中提到
  3. 所属分类:其它

  1. neurips2020-procgen-starter-kit:NeurIPS 2020入门套件-AIcrowd上的Procgen竞赛-源码

  2. NeurIPS 2020-Procgen入门套件 这是该入门套件托管在 :detective: 关于ProcGen基准测试 16个易于使用的程序生成的环境,可以直接衡量强化学习代理学习通用技能的速度。 这些环境在单个内核上高速运行(每秒数千步)。 这些环境与论文《。 与相比,这些环境是: 更快:Gym Retro环境已经快了,但是Procgen环境的运行速度快了4倍。 不确定性:“健身房复古”环境始终是相同的,因此您可以记住一系列动作,这些动作将获得最高的回报。 Procgen环境是随
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:54kb
    • 提供者:weixin_42128141
  1. GYM-project-源码

  2. GYM-一个展示我们健身房所有优点和功能的网站。 这是我到目前为止使用的GYM网站,使用了本课程中的技能和代码(喜欢跑步,简历,威士忌酒等等)。 该网站的创建考虑到了已经建立的体育馆。 我试图制作一个易于访问的网站,并且整个网站都具有相似的视觉/色彩主题。 我一生中曾去过多个体育馆,并尝试将所有我认为至关重要的信息都鼓励使用。 我已经请一些朋友和家人提供他们的意见,并且由于这种互动而增加了一些额外的功能。 在项目开始之前创建线框。 在Balsamiq上创建。 网站在不同媒体上的外观视图。 测
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:55mb
    • 提供者:weixin_42178688
  1. 767最终IR-源码

  2. 767最终IR COMP 767最终项目 Alex Hoffman和Nikhil Podila 麦吉尔大学 我们从创建了重要性重采样算法的Python实现 我们还尝试了在重采样算法中添加优先体验重播 该代码需要以下软件包:numpy,gym,tensorflow,matplotlib。 如果使用anaconda,则可以通过pip install或conda install进行安装。 运行文件“ OffPolicyAgent_testing.py”将生成图,具体取决于在文件底部注释掉的函数。
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:107kb
    • 提供者:weixin_42157188
  1. 灵巧的健身房:适用于OpenAI Gym环境的神经进化-源码

  2. 关于 该存储库包含允许您使用算法及其变体来训练,测试和可视化环境(游戏)的代码。 该项目的两个目标是 通过配置文件使此工作尽可能简单。 通过同时评估多处理器计算机上的总体适应性,使代码快速运行。 快速开始 首先,您应该从源代码安装和 。 然后执行以下操作: % python3 neat-evolve.py config/cartpole 这将使用在环境中运行整洁的python,因此您可以利用计算机上的所有核心。 演进完成后,您可以通过以下方法尝试演进网络: % python3 neat
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:432kb
    • 提供者:weixin_42122988
  1. 带有火炬的深度增强学习:DQN,AC,ACER,A2C,A3C,PG,DDPG,TRPO,PPO,SAC,TD3和PyTorch实施...-源码

  2. 状态:活动(在活动开发中,可能会发生重大更改) 该存储库将实现经典且最新的深度强化学习算法。 该存储库的目的是为人们提供清晰的pytorch代码,以供他们学习深度强化学习算法。 将来,将添加更多最先进的算法,并且还将保留现有代码。 要求 python = 0.10 火炬> = 0.4 请注意,tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败: 安装健身房 pip install gym 安装pytorc
  3. 所属分类:其它