您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 机器学习-强化学习-汤普森采样-源码

  2. 机器学习-强化学习-汤普森采样 强化学习: 汤普森采样: 我们需要在有效的勘探与开发之间找到适当的平衡。 与UCB算法不同,汤普森采样算法是一种概率算法。 该算法具有代表我们对世界的感知以及我们认为这些机器中的每台机器的实际预期收益可能位于的分布。 与UCB相比,Thomas采样的优点之一是它可以适应延迟的反馈。 我将使用与UCB算法相同的数据集。 与UCB算法相比,汤普森采样算法产生了更好的结果(能够在尽可能少的回合中确定最佳广告)。 该算法的工作原理如下: 在第n轮中,我们为每个
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:27kb
    • 提供者:weixin_42125770