您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. ReAgent:推理系统的平台(强化学习,语境匪徒等)-源码

  2. 应用强化学习 Facebook 概述 ReAgent是一个用于Facebook上开发和使用的应用强化学习(RL)的开源端到端平台。 ReAgent是用Python构建的,并使用PyTorch进行建模和培训,并使用Torchscr ipt进行模型服务。 该平台包含用于训练流行的深度RL算法的工作流,包括数据预处理,功能转换,分布式训练,反事实策略评估和优化服务。 有关ReAgent的更多详细信息,请参见的白皮书。 该平台曾被命名为“ Horizo​​n”,但最近我们采用了“ ReAgent”这个
  3. 所属分类:其它