您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 强化学习原理_算法及应用

  2. 强化学习原理_算法及应用,里面有各种算法
  3. 所属分类:其它

    • 发布日期:2009-05-30
    • 文件大小:177.62kb
    • 提供者:llqqgg
  1. 各种强化学习算法

  2. 各种强化学习算法
  3. 所属分类:C/C++

    • 发布日期:2012-03-28
    • 文件大小:109kb
    • 提供者:gudumeke
  1. Q学习sarsa学习代码包

  2. 从各种网站在下载到的Q学习算法集成包,有matlab示例,有C示例,有Java示例,有C++示例。总有一个算法是你需要模拟和借鉴的,需要研究强化学习或增强学习算法的人不容错过。。。真心话,要不是我需要下载别的资源需要积分,不会无私奉献。。。我的强化学习就是在这里面修改实现的,需要的顶起来。。
  3. 所属分类:C/C++

    • 发布日期:2013-05-17
    • 文件大小:260kb
    • 提供者:sysuywc
  1. 用一句话总结各种机器学习算法

  2. 浓缩就是精华。想要把书写厚很容易,想要写薄却非常难。现在已经有这么多经典的机器学习算法,如果能抓住它们的核心本质,无论是对于理解还是对于记忆都有很大的帮助,还能让你更可能通过面试。在本文中,SIGAI将用一句话来总结每种典型的机器学习算法,帮你抓住问题的本质,强化理解和记忆。下面我们就开始了。
  3. 所属分类:机器学习

    • 发布日期:2018-06-26
    • 文件大小:659kb
    • 提供者:sigai_csdn
  1. 最全强化学习路径规划Reinforcement-learning-with-tensorflow-master.zip

  2. 用强化学习进行路径规划,各种强化学习的算法,适合从一开始进行学习,加实践代码哦
  3. 所属分类:机器学习

    • 发布日期:2019-10-01
    • 文件大小:11mb
    • 提供者:u012132448
  1. 基于值函数和策略梯度的深度强化学习综述_刘建伟.pdf

  2. 作为人工智能领域的热门研究问题,深度强化学习自提出以来,就受到人们越来越多的关注。目前,深度强化学 习能够解决很多以前难以解决的问题,比如直接从原始像素中学习如何玩视频游戏和针对机器人问题学习控制策略,深度强 化学习通过不断优化控制策略,建立一个对视觉世界有更高层次理解的自治系统。其中,基于值函数和策略梯度的深度强化 学习是核心的基础方法和研究重点。本文对这两类深度强化学习方法进行了系统的阐述和总结,包括用到的求解算法和网络 结构。首先,概述了基于值函数的深度强化学习方法,包括开山鼻祖深度Q 网
  3. 所属分类:机器学习

    • 发布日期:2020-09-01
    • 文件大小:1mb
    • 提供者:SparkQiang
  1. 强化学习方法,用于在腔滤波器中学习人类经验

  2. 由于通信行业的快速发展,对各种射频组件的需求量很大并已投入量产。其中,无源器件,例如微波腔滤波器,双工器合并器经历了快速而出乎意料的升级。但是,这些产品的调校过程始终是手动操作的,由于难以提取人的经验,因此似乎仍然很难自动更换或改进。在这项研究中,我们对以前的一些自动空腔滤波器调谐解决方案进行了深入研究,尤其是使用智能算法的解决方案。此外,我们提出了一种基于强化学习算法的智能调整方法,该算法可在调整过程中动态提取人的策略。实验结果证明了强化学习在掌握人类技能方面的强大表现。
  3. 所属分类:其它

  1. reinforcement-learning-tutorials:强化学习的基本算法-源码

  2. 写在前面 本项目用于学习RL基础算法,尽量做到: 注释详细 结构清晰 代码结构清晰,主要分为以下几个脚本: env.py用于重建强化学习环境,也可以重新归一化环境,例如给动作加噪声 model.py强化学习算法的基本模型,局部神经网络,演员,评论家等 memory.py保存重放缓冲区,用于off-policy agent.py RL核心算法,某种dqn等,主要包含update和select_action两个方法, main.py运行主函数 params.py保存各种参数 plot.py利用
  3. 所属分类:其它

  1. 基于注意力的分层深度强化学习在自动驾驶变道行为中的应用

  2. 执行安全高效的车道变更是创建全自动驾驶汽车的关键功能。最近的先进技术已经证明了使用深度强化学习的成功车道跟随行为,但很少考虑与其他车辆在道路上进行交互以改变车道的行为。本文设计了一种分层的深度强化学习(DRL)算法来学习密集交通中的车道变化行为。通过将整体行为分解为子策略,可以了解更快,更安全的车道变更动作。我们还将时空注意应用于DRL架构,这有助于车辆将更多的注意力集中在周围的车辆上,并导致更平滑的车道变换行为。我们在TORCS模拟器中进行实验,其结果在各种车道变更场景中均优于最新的深度强化学
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:660kb
    • 提供者:weixin_38639747
  1. atari-model-zoo:以Atari机器学习基准进行训练的经过训练的深度强化学习模型的二进制版本,以及使模型的可视化和分析易于进行以及跨训练算法进行比较的软件版本-源码

  2. 雅达利动物园 该项目的目的是传播由各种算法训练的深度强化学习代理,并使其易于分析,比较和可视化。 希望减少摩擦,以便进一步研究了解强化学习主体。 该项目利用了出色的神经网络可视化库,并与集成。 在IJCAI 2019上发表了一篇介绍这项工作的论文:。 关于 该软件包附带二进制发行版,其中包括(1)通过各种深度强化学习方法在Atari游戏上训练的冻结模型,以及(2)在网络上托管的那些特工在其训练环境中的缓存游戏体验。 安装与设定 依存关系: (版本> 0.8 <2.0;我们目前不
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:20mb
    • 提供者:weixin_42107374
  1. David-Silver-Reinforcement-learning:David Silver的“强化学习”课程注释以及各种算法的实现-源码

  2. David-Silver强化学习 这个软件库包含了强化学习笔记由与各种算法的讨论,无论是在Keras的实现(与TensorFlow后端),并沿的框架。 教学大纲: 第一周:强化学习简介[] [ ] 第2周:马尔可夫决策过程[] [ ] 第3周:通过动态编程进行规划[] [ ] 第4周:无模型预测[] [ ] 第5周:无模型控制[] [ ] 第6周:价值函数逼近[] [ ] 第7周:政策梯度方法[] [ ] 第8周:学习与计划整合[] [ ] 第9周:探索与开发[] [ ]
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:19mb
    • 提供者:weixin_42144201
  1. DeepRL-TensorFlow2:using使用TensorFlow2轻松实现各种流行的深度强化学习算法-源码

  2. TensorFlow2中的深度强化学习 是一个使用实现各种流行的深度强化学习算法的存储库。 该存储库的关键是易于理解的代码。 因此,如果您是学生或研究深度强化学习的研究人员,我认为这是使用此存储库学习的最佳选择。 一种算法仅依赖于一个python脚本文件。 因此,您不必进出不同的文件即可研究特定的算法。 该存储库将不断更新,并将继续添加新的“深度强化学习”算法。 演算法 DQN 纸上 作者Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:378kb
    • 提供者:weixin_42146888
  1. tf2rl:TensorFlow2强化学习-源码

  2. TF2RL TF2RL是一个深度强化学习库,它使用TensorFlow 2.x实现了各种深度强化学习算法。 演算法 支持以下算法: 算法 分立行动 持续动作 支持 类别 , ✓ ✓ 免模型按策略RL (包括 , , , , ) ✓ -- 免模型离网RL (包括和 ) -- ✓ 免模型离网RL ✓ ✓ 免模型离网RL -- ✓ -- 免模型离网RL , ✓ ✓ -- 基于模型的RL , , (包括) ✓ ✓ -- 模仿学习 以下文
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:128kb
    • 提供者:weixin_42160278
  1. 强化学习:在60天内学习深度强化学习! Python讲座和代码。 强化学习+深度学习-源码

  2. 深度强化学习课程 探索神经网络和强化学习的结合。 Python和PyTorch中的算法和示例 您是否听说过和的取得了惊人的结果? 这都是关于深度神经网络和强化学习的。 您是否想了解更多? 这是您最终学习Deep RL并将其用于新的令人兴奋的项目和应用程序的正确机会。 在这里,您将找到这些算法的深入介绍。 您将学习q学习,q学习,PPO,演员评论家,并使用Python和PyTorch实施它们。 最终目的是使用这些通用技术并将其应用于各种重要的现实世界问题。 德米斯·哈萨比斯(Demis Has
  3. 所属分类:其它

  1. ml-algorithms-scikit-and-keras:Scikit-learn和Keras上机器学习算法的实现脚本,适合新手使用。-源码

  2. 使用Scikit的机器学习算法学习和学习 该存储库包含在Scikit-Learn中实现的各种机器学习算法。 在Scikit-Learn和Keras中实现了有监督,无监督,简单强化学习,自然语言处理中的情感分析,有监督的简单深度学习算法,降维,装袋,增强等机器学习算法。 Numpy,Pandas,Matplotlib教程笔记本文件中的Pdf及其实现。 监督学习算法 回归算法 线性回归 多元线性回归 多项式回归 支持向量机 决策树 随机森林 使用正则化评估回归模型 分类算法 逻辑回归 K最近邻居
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:27mb
    • 提供者:weixin_42138788
  1. reinforce-js:[INACTIVE]各种机器学习求解器的集合。 该库是一种面向对象的方法(与Typescript结合使用),并尝试提供简化的接口,这些接口使使用算法非常简单-源码

  2. 强化js 征集志愿者:由于时间紧缺,我急切地寻求自愿帮助。 如果您对建立加固代理人感兴趣(即使您是新手),并愿意进一步发展此教育项目,请与我联系:)议程上有一些要点,我仍然希望看到实现使该项目成为用于抽象教育目的的漂亮图书馆。 不活跃:由于缺乏时间和帮助 reinforce-js –各种简单的强化学习求解器的集合。 该库仅用于教育目的。 该库是一种面向对象的方法,它试图提供简化的接口,这些接口使使用算法变得非常容易(使用烘焙)。 此外,它是Andrej Karpathy的强化学习库的扩展,该
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:40kb
    • 提供者:weixin_42157166
  1. chainerrl:ChainerRL是建立在Chainer之上的深度强化学习库-源码

  2. ChainerRL ChainerRL是一个深度强化学习库,它使用灵活的深度学习框架在Python中实现了各种最新的深度强化算法。 安装 ChainerRL已通过3.6测试。 有关其他要求,请参见 。 可以通过PyPI安装ChainerRL: pip install chainerrl 也可以从源代码安装: python setup.py install 有关的更多信息,请参阅安装。 入门 您可以先尝试《 ,或查看适用于Atari 2600和Open AI Gym的。 有关更多信息,
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:10mb
    • 提供者:weixin_42120563
  1. maro:多代理资源优化(MARO)平台是针对现实资源优化问题的强化学习即服务(RaaS)的一个实例-源码

  2. 多代理资源优化(MARO)平台是强化学习即服务(RaaS)的实例,用于现实世界中的资源优化。 它可以应用于许多重要的工业领域,例如物流中的,运输中的,数据中心中的配置以及金融中的资产管理。 除了(RL),它还支持其他计划/决策机制,例如。 MARO的关键组件: 模拟工具包:它提供了一些预定义的方案,以及用于构建新方案的可重复使用的轮子。 RL工具包:它为RL提供了全栈抽象,例如代理管理器,代理,RL算法,学习者,参与者和各种成形者。 分布式工具箱:它提供了分布式通信组件,用于消息自动处理
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:31mb
    • 提供者:weixin_42098104
  1. 基于注意力的分层深度强化学习在自动驾驶变道行为中的应用

  2. 执行安全高效的车道变更是创建全自动驾驶汽车的关键功能。最近的先进技术已经证明了使用深度强化学习的成功车道跟随行为,但很少考虑与其他车辆在道路上进行交互以改变车道的行为。本文设计了一种分层的深度强化学习(DRL)算法来学习密集交通中的车道变化行为。通过将整体行为分解为子策略,可以了解更快,更安全的车道变更动作。我们还将时空注意应用于DRL架构,这有助于车辆将更多的注意力集中在周围的车辆上,并导致更平滑的车道变换行为。我们在TORCS模拟器中进行实验,其结果在各种车道变更场景中均优于最新的深度强化学
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:660kb
    • 提供者:weixin_38617335
  1. JAX-RL:各种强化学习算法的JAX实现-源码

  2. JAX-RL 各种深度强化学习算法的JAX实现。 使用的主要库: JAX-主要框架 ku句-神经网络 Optax-基于梯度的优化 算法: | 近端策略优化(PPO)| 1 | | 深度Q网络(DQN)| 1 | | 双深度Q网络(DDQN)| 1 | | 深度递归Q网络(DRQN)| 1 | | 深度确定性策略梯度(DDPG)| 1 | 政策: psi贪婪 玻尔兹曼 去做: 每种算法的完整测试 其他基于PPO的算法? 优先体验重播 多代理DQN和DDPG
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:14kb
    • 提供者:weixin_42138525
« 12 3 »