您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. rllab-微调-源码

  2. 实验室 分层强化学习的子策略适应 要运行针对“分层强化学习的子策略调整”的论文的实验,请导航至sandbox/finetuning/README.md以查看说明。 引用子策略适应以进行分层强化学习 如果您将我们的代码用于学术研究,强烈建议您引用以下文章: 亚历山大·李(Alex C. “。”。 2020年第八届国际学习代表大会(ICLR)会议录。 贷记项目代码 我们以原始rllab代码以及由 (UC Berkeley / Covariant)开发的代码为。 (加州大学伯克利分校/ CMU)
  3. 所属分类:其它