您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. stats701-winter2021:强化学习理论-源码

  2. 欢迎使用STATS 701 WI 2021 这是关于强化学习理论(RL)的特殊主题课程。 我们将从在线算法的遗憾分析,浓度不等式和随机逼近等工具着重于RL算法的设计和分析。 本课程的“核心”将基于有限状态下的在线RL(通常称为“表格”设置)马尔可夫决策过程(MDP),并将以传统的授课方式进行授课(由于COVID-19而完全遥不可及) )。 本课程的“高级”部分将根据受众的兴趣来选择主题,并且将以更多的讨论为基础。 学生将自愿阅读一篇论文(或一小组相关论文),并在课堂上主持讨论。 高级部分的主题
  3. 所属分类:其它