您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Q-Learning更新公式

  2. 强化学习的参数更新公式。Q-Learning更新公式: Qnew(st-1,at-1)=(1-α)‧Q(st-1,at-1)+α(rt+γ‧maxQ(st,a)) 其中maxQ(st,a)用于查找st 下期望回报最好的行为。α∈(0,1],γ∈[0,1],rt 是t时刻的奖赏。
  3. 所属分类:机器学习

    • 发布日期:2019-02-28
    • 文件大小:9216
    • 提供者:sinat_35576477
  1. Q-Learning算法模拟环境程序模拟环境.zip

  2. Q-Learning算法模拟环境程序模拟环境.zip
  3. 所属分类:机器学习

    • 发布日期:2019-06-18
    • 文件大小:44040192
    • 提供者:wanghaifeng0608
  1. Deep-Q-Learning-SON-Perf-Improvement-master.zip

  2. 深度Q学习改善自适应自组织网络案例 # Deep-Q-Learning-SON-Perf-Improvement The requirement for running this code is to obtain license and access of the Vienna LTE-A simulator, found at: https://www.nt.tuwien.ac.at/research/mobile-communications/vccs/vienna-lte-a-simu
  3. 所属分类:深度学习

    • 发布日期:2019-07-18
    • 文件大小:12288
    • 提供者:yuanyuan_wu
  1. Continuous Deep Q-Learning with Model-based Acceleration

  2. 深度Q-Learning与model-based方法结合来解决连续动作问题 Model-free reinforcement learning has been successfully applied to a range of challenging problems, and has recently been extended to handle large neural network policies and value functions. However, the sample
  3. 所属分类:机器学习

    • 发布日期:2020-03-02
    • 文件大小:1048576
    • 提供者:oldxacorn
  1. Q学习,matlab

  2. Q学习,很有帮助.jie shao le Q-learning de ji ben shiyong Q学习,很有帮助.jie shao le Q-learning de ji ben shiyong
  3. 所属分类:其它

    • 发布日期:2020-02-22
    • 文件大小:2048
    • 提供者:panxiang162497
  1. Q学习,matlab

  2. Q学习,很有帮助.jie shao le Q-learning de ji ben shiyong Q学习,很有帮助.jie shao le Q-learning de ji ben shiyong
  3. 所属分类:其它

    • 发布日期:2020-01-21
    • 文件大小:2048
    • 提供者:cym30
  1. Deep.Reinforcement.Learning.Han.-.Maxim.Lapan.pdf

  2. Deep Reinforcement Learning Hands-On by Maxim LapanTable of contents Deep reinforcement Learning Hands-On Why subscribe? Packtpub.com Contributors about the author about the reviewers Packt is Searching for Authors Like You Preface Who this book is f
  3. 所属分类:深度学习

    • 发布日期:2019-08-18
    • 文件大小:12582912
    • 提供者:wanghui499917270
  1. 基于改进RBF的Q算法路径规划仿真MATLAB

  2. 采用强化学习中的Q-learning算法实现移动机器人的局部路径规划,并引入资格迹,修改神经网络RBF的权值,使算法更有效地利用未知环境信息特征,以提高迭代过程中的收敛速度。
  3. 所属分类:机器学习

    • 发布日期:2020-06-15
    • 文件大小:119808
    • 提供者:qq_40666149
  1. Q学习,matlab

  2. Q学习,很有帮助.jie shao le Q-learning de ji ben shiyong
  3. 所属分类:其它

    • 发布日期:2020-06-28
    • 文件大小:2048
    • 提供者:wanglang3081
  1. barasingga-ai:为barasingga游戏实现了minimax和q-learning-源码

  2. 巴拉辛加和人工智能 Barasingga是一款简单的两人民间游戏 规则: 每位玩家12件 任何一块都只能向与其连接的邻居中的任何一个移动一步 仅通过跳过对手的棋子(仅在一个棋子上)进行捕获 每转一圈允许移动 如果仅一次拍摄同一张照片,则可以进行两次或更多次连续拍摄(参见图3) 该规则尚未实施 初始位置 动作 捕获 垂直捕获 对角线捕捉 一圈两次捕获
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:102400
    • 提供者:weixin_42117224
  1. 基于分布式Q学习的区域交通协调控制的研究

  2. The basic theory of reinforcement and the idea of distributed Q-Learning are introduced in this paper. Based on the analysis of distributed Q-Learning in the urban traffic coordination control, reward function and weight function are presented. The e
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:366592
    • 提供者:weixin_38538224
  1. Q学习中基于模糊规则的强化函数设计方法

  2. Q-learning is a reinforcement learning method to solve Markovian decision problems with incomplete information. The design of reward function is an important factor that affects the learning results of Q-learning. A method to design the reward functi
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:453632
    • 提供者:weixin_38620734
  1. 动态网络上的增强学习到分组路由的方法:使用最短路径路由,Q学习和深度Q学习的动态网络上的分组路由仿真-源码

  2. 动态路由 项目描述: 为了测试动态网络上各种路由算法的性能,我们在网络上创建了一个数据包路由仿真,该仿真在一系列时间步长上进行离散更新。 在整个仿真过程中,随机选择边缘以消失并在每个时间步进行恢复。 另外,在整个情节中,边缘权重以正弦形式波动。 在每个情节的开始,网络上都会生成许多数据包(网络负载),每个数据包都有一个随机的起始节点和目标节点。 每次传送数据包时,都会在一些时间步长后初始化一个新数据包。 一旦生成了一定数量的数据包并在网络上传递,该情节就结束了。 然后计算平均分组传送时间和各
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:43008
    • 提供者:weixin_42137032
  1. Q学习山车v0-源码

  2. 带Q学习和SARSA的MountainCar-v0 该项目包含用于培训代理商以解决。 Q-Learning和SARSA 山地车环境 环境是二维的,由两座山丘之间的汽车组成。 汽车的目标是到达右侧山顶的旗帜。 丘陵太陡峭,以至于仅通过向同一方向移动就无法缩放汽车,它必须后退并第四次建立足够的动力才能向上行驶。 观察空间: 这是两个确定环境当前状态的变量。 赛车在赛道上的位置,从-1.2到0.6 轿厢速度,从-0.07到0.07。 左为负,右为正。 动作: 汽车可以采取以下三种不同的动作之
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:288768
    • 提供者:weixin_42109178
  1. Research on Q-learning based channel access control algorithm for Internet of Vehicles

  2. Research on Q-learning based channel access control algorithm for Internet of Vehicles
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:595968
    • 提供者:weixin_38502183
  1. Multipath TCP Path Scheduling Optimization Based on Q-Learning in Vehicular Heterogeneous Networks

  2. Multipath TCP Path Scheduling Optimization Based on Q-Learning in Vehicular Heterogeneous Networks
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:1028096
    • 提供者:weixin_38589812
  1. Pathfinder-AI:具有Q学习AI算法的Flask RESTful应用-源码

  2. 探路者AI 项目概况 Q-Learning算法在寻路问题上的实际应用。 此外,项目还包含可在8x8网格中生成所有可能移动的数组的算法,可轻松调整。 特拉维斯CI: 测试文件: /tests 工具,模块和技术 Web开发: 烧瓶RESTful | 码头工人| Heroku | 引导带| 实现Javascr ipt | jQuery查询 Python – AI: 脾气暴躁的 Python –机器学习: sklearn | scipy | 熊猫| numpy | 泡菜 数据库开发: SQL
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:1048576
    • 提供者:weixin_42151305
  1. Q-Learning.zip

  2. Python工程,pycharm打开即用
  3. 所属分类:机器学习

    • 发布日期:2021-01-21
    • 文件大小:4194304
    • 提供者:weixin_54445841
  1. 一份从代码出发的强化学习Q-Learning入门教程,请笑纳!

  2. 本文由机器之心编译(ID:almosthuman2014) 强化学习(RL) 强化学习是机器学习的一个重要领域,其中智能体通过对状态的感知、对行动的选择以及接受奖励和环境相连接。在每一步,智能体都要观察状态、选择并执行一个行动,这会改变它的状态并产生一个奖励。 马尔科夫决策过程(MDP) 我们将要解决「forest fire」的马尔科夫决策问题,这个在 python 的 MDP 工具箱(http://pymdptoolbox.readthedocs.io/en/latest/api/ex
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:367616
    • 提供者:weixin_38544075
  1. 面向5G雾计算中基于Q-learning的安全中继节点选择方法

  2. 提出了一种基于 Q-learning 的最优双中继节点选择方法。首先构建了基于社会意识的安全雾计算结构模型,然后在该模型下设计了基于 Q-learning 算法的最优双中继节点选择方法,实现了在动态环境下对最优双中继节点的选择,最后对密钥生成速率、双中继节点选择速度和动态环境中双中继节点的选择准确率进行了分析。实验结果表明,该方案能有效地在动态环境中选择最优双中继节点,算法迅速收敛达到稳定,最优中继节点选择速度得到有效提升。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38663452
« 1 2 3 45 6 7 8 9 10 ... 14 »