您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 统计学习方法_李航

  2. 统计学习是计算机及其应用领域的一门重要的学科。本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。 《统计学习方法
  3. 所属分类:机器学习

  1. 1707.02038.pdf

  2. 本教程涵盖了算法及其应用,通过一系列的例子来说明概念,包括伯努利*问题、最短路径问题、产品分类、推荐、使用神经网络的主动学习和马尔可夫决策过程中的强化学习。
  3. 所属分类:机器学习

  1. 马尔可夫决策过程实例讲解.pdf

  2. 中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
  3. 所属分类:深度学习

    • 发布日期:2020-10-26
    • 文件大小:1mb
    • 提供者:ligary2002
  1. SMDP 基于Actor网络的统一NDP方法

  2. 研究半马尔可夫决策过程(SMDP )基于性能势学习和策略逼近的神经元动态规划(NDP)方法.通过SMDP 的一致马尔可夫链的单个样本轨道,给出了折扣和平均准则下统一的性能势TD(λ)学习算法,进行逼近策略评估.利用一个神经元网络逼近结构作为行动器(Actor)表示策略,并根据性能势的学习值给出策略参数改进的两种方法.最后通过数值例子说明了有关算法的有效性.
  3. 所属分类:其它

    • 发布日期:2021-01-15
    • 文件大小:401kb
    • 提供者:weixin_38673738