您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. reinforcement-learning-tutorials-源码

  2. 强化学习教程 此内容通过几行代码向您展示了典型的强化学习(RL)方法的工作。 通过此存储库中的这些内容,CartPole环境用于运行RL。有关此环境的规格(动作空间,观察空间和奖励),请参见下文。 样例代码 import gym import random def pick_sample(): return random.randint(0, 1) env = gym.make("CartPole-v0") for i in range(1): print("start episode
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:111kb
    • 提供者:weixin_42114645
  1. reinforcement-learning-tutorials:强化学习的基本算法-源码

  2. 写在前面 本项目用于学习RL基础算法,尽量做到: 注释详细 结构清晰 代码结构清晰,主要分为以下几个脚本: env.py用于重建强化学习环境,也可以重新归一化环境,例如给动作加噪声 model.py强化学习算法的基本模型,局部神经网络,演员,评论家等 memory.py保存重放缓冲区,用于off-policy agent.py RL核心算法,某种dqn等,主要包含update和select_action两个方法, main.py运行主函数 params.py保存各种参数 plot.py利用
  3. 所属分类:其它