说明:实验室
分层强化学习的子策略适应
要运行针对“分层强化学习的子策略调整”的论文的实验,请导航至sandbox/finetuning/README.md以查看说明。
引用子策略适应以进行分层强化学习
如果您将我们的代码用于学术研究,强烈建议您引用以下文章:
亚历山大·李(Alex C. “。”。 2020年第八届国际学习代表大会(ICLR)会议录。
贷记项目代码
我们以原始rllab代码以及由 (UC Berkeley / Covariant)开发的代码为。 (加州大学伯克利分校/ CMU)
<weixin_42106765> 上传 | 大小:1mb