您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. SAC:软演员评论家的实施-源码

  2. 软演员评论家(SAC) Descllione dell'algoritmo 软演员评论家深度强化学习DQN(Deep Q Learning)的非政策派生,也可以从以下方面进行分类: La Q函数视图的神经网络输入(输入:(stato,azione),输出:valore) 非因果关系的公司 L'agente conosce lo stato in cui si trova(communque una descrizione parziale dello stato attuale) L'a
  3. 所属分类:其它

  1. 软演员关键和扩展:软演员关键和优先体验重播(PER)的PyTorch实施+强调最新经验(ERE)+蒙克豪森RL + D2RL和并行环境-源码

  2. 软演员关键和扩展 PyTorch实施了具有扩展性PER + ERE + Munchausen RL的Soft-Actor-Critic ,并提供了用于并行数据收集和更快训练的多环境选项。 该存储库包括最新的Soft-Actor-Critic版本( )以及SAC的扩展: P rioritizedËxperienceřeplay( ) Èmphasizing最近几个Ë没有忘记过去(xperience ) Munchausen强化学习 D2RL:强化学习深密度架构 N步自举 平行环境 在
  3. 所属分类:其它

  1. 强化学习算法:此存储库包含大多数基于pytorch实现的经典深度强化学习算法,包括-DQN,DDQN,Dualling Network,DDPG,SAC,A2C,PPO,TRPO。 (更多算法仍在进行中)-源码

  2. 深度强化学习算法 该存储库将使用PyTorch实现经典的深度强化学习算法。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度强化学习算法。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangu
  3. 所属分类:其它