搜索资源 - Q-Learning - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - Q-Learning

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

Q-Learning更新公式
强化学习的参数更新公式。Q-Learning更新公式： Qnew(st-1,at-1)=(1-α)‧Q(st-1,at-1)+α(rt+γ‧maxQ(st,a)) 其中maxQ(st,a)用于查找st 下期望回报最好的行为。α∈(0,1]，γ∈[0,1]，rt 是t时刻的奖赏。
所属分类：机器学习
- 发布日期：2019-02-28
- 文件大小：9216
- 提供者：sinat_35576477

Q-Learning算法模拟环境程序模拟环境.zip
Q-Learning算法模拟环境程序模拟环境.zip
所属分类：机器学习
- 发布日期：2019-06-18
- 文件大小：44040192
- 提供者：wanghaifeng0608

Deep-Q-Learning-SON-Perf-Improvement-master.zip
深度Q学习改善自适应自组织网络案例 # Deep-Q-Learning-SON-Perf-Improvement The requirement for running this code is to obtain license and access of the Vienna LTE-A simulator, found at: https://www.nt.tuwien.ac.at/research/mobile-communications/vccs/vienna-lte-a-simu
所属分类：深度学习
- 发布日期：2019-07-18
- 文件大小：12288
- 提供者：yuanyuan_wu

Continuous Deep Q-Learning with Model-based Acceleration
深度Q-Learning与model-based方法结合来解决连续动作问题 Model-free reinforcement learning has been successfully applied to a range of challenging problems, and has recently been extended to handle large neural network policies and value functions. However, the sample
所属分类：机器学习
- 发布日期：2020-03-02
- 文件大小：1048576
- 提供者：oldxacorn

Q学习，matlab
Q学习，很有帮助.jie shao le Q-learning de ji ben shiyong Q学习，很有帮助.jie shao le Q-learning de ji ben shiyong
所属分类：其它
- 发布日期：2020-02-22
- 文件大小：2048
- 提供者：panxiang162497

Q学习，matlab
Q学习，很有帮助.jie shao le Q-learning de ji ben shiyong Q学习，很有帮助.jie shao le Q-learning de ji ben shiyong
所属分类：其它
- 发布日期：2020-01-21
- 文件大小：2048
- 提供者：cym30

Deep.Reinforcement.Learning.Han.-.Maxim.Lapan.pdf
Deep Reinforcement Learning Hands-On by Maxim LapanTable of contents Deep reinforcement Learning Hands-On Why subscribe? Packtpub.com Contributors about the author about the reviewers Packt is Searching for Authors Like You Preface Who this book is f
所属分类：深度学习
- 发布日期：2019-08-18
- 文件大小：12582912
- 提供者：wanghui499917270

基于改进RBF的Q算法路径规划仿真MATLAB
采用强化学习中的Q-learning算法实现移动机器人的局部路径规划，并引入资格迹，修改神经网络RBF的权值，使算法更有效地利用未知环境信息特征，以提高迭代过程中的收敛速度。
所属分类：机器学习
- 发布日期：2020-06-15
- 文件大小：119808
- 提供者：qq_40666149

Q学习，matlab
Q学习，很有帮助.jie shao le Q-learning de ji ben shiyong
所属分类：其它
- 发布日期：2020-06-28
- 文件大小：2048
- 提供者：wanglang3081

barasingga-ai:为barasingga游戏实现了minimax和q-learning-源码
巴拉辛加和人工智能 Barasingga是一款简单的两人民间游戏规则：每位玩家12件任何一块都只能向与其连接的邻居中的任何一个移动一步仅通过跳过对手的棋子（仅在一个棋子上）进行捕获每转一圈允许移动如果仅一次拍摄同一张照片，则可以进行两次或更多次连续拍摄（参见图3）该规则尚未实施初始位置动作捕获垂直捕获对角线捕捉一圈两次捕获
所属分类：其它
- 发布日期：2021-03-20
- 文件大小：102400
- 提供者：weixin_42117224

基于分布式Q学习的区域交通协调控制的研究
The basic theory of reinforcement and the idea of distributed Q-Learning are introduced in this paper. Based on the analysis of distributed Q-Learning in the urban traffic coordination control, reward function and weight function are presented. The e
所属分类：其它
- 发布日期：2021-02-22
- 文件大小：366592
- 提供者：weixin_38538224

Q学习中基于模糊规则的强化函数设计方法
Q-learning is a reinforcement learning method to solve Markovian decision problems with incomplete information. The design of reward function is an important factor that affects the learning results of Q-learning. A method to design the reward functi
所属分类：其它
- 发布日期：2021-02-22
- 文件大小：453632
- 提供者：weixin_38620734

动态网络上的增强学习到分组路由的方法：使用最短路径路由，Q学习和深度Q学习的动态网络上的分组路由仿真-源码
动态路由项目描述：为了测试动态网络上各种路由算法的性能，我们在网络上创建了一个数据包路由仿真，该仿真在一系列时间步长上进行离散更新。在整个仿真过程中，随机选择边缘以消失并在每个时间步进行恢复。另外，在整个情节中，边缘权重以正弦形式波动。在每个情节的开始，网络上都会生成许多数据包（网络负载），每个数据包都有一个随机的起始节点和目标节点。每次传送数据包时，都会在一些时间步长后初始化一个新数据包。一旦生成了一定数量的数据包并在网络上传递，该情节就结束了。然后计算平均分组传送时间和各
所属分类：其它
- 发布日期：2021-02-17
- 文件大小：43008
- 提供者：weixin_42137032

Q学习山车v0-源码
带Q学习和SARSA的MountainCar-v0 该项目包含用于培训代理商以解决。 Q-Learning和SARSA 山地车环境环境是二维的，由两座山丘之间的汽车组成。汽车的目标是到达右侧山顶的旗帜。丘陵太陡峭，以至于仅通过向同一方向移动就无法缩放汽车，它必须后退并第四次建立足够的动力才能向上行驶。观察空间：这是两个确定环境当前状态的变量。赛车在赛道上的位置，从-1.2到0.6 轿厢速度，从-0.07到0.07。左为负，右为正。动作：汽车可以采取以下三种不同的动作之
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：288768
- 提供者：weixin_42109178

Research on Q-learning based channel access control algorithm for Internet of Vehicles
Research on Q-learning based channel access control algorithm for Internet of Vehicles
所属分类：其它
- 发布日期：2021-02-07
- 文件大小：595968
- 提供者：weixin_38502183

Multipath TCP Path Scheduling Optimization Based on Q-Learning in Vehicular Heterogeneous Networks
Multipath TCP Path Scheduling Optimization Based on Q-Learning in Vehicular Heterogeneous Networks
所属分类：其它
- 发布日期：2021-02-07
- 文件大小：1028096
- 提供者：weixin_38589812

Pathfinder-AI：具有Q学习AI算法的Flask RESTful应用-源码
探路者AI 项目概况 Q-Learning算法在寻路问题上的实际应用。此外，项目还包含可在8x8网格中生成所有可能移动的数组的算法，可轻松调整。特拉维斯CI：测试文件： /tests 工具，模块和技术 Web开发：烧瓶RESTful | 码头工人| Heroku | 引导带| 实现Javascr ipt | jQuery查询 Python – AI：脾气暴躁的 Python –机器学习： sklearn | scipy | 熊猫| numpy | 泡菜数据库开发： SQL
所属分类：其它
- 发布日期：2021-01-30
- 文件大小：1048576
- 提供者：weixin_42151305

Q-Learning.zip
Python工程，pycharm打开即用
所属分类：机器学习
- 发布日期：2021-01-21
- 文件大小：4194304
- 提供者：weixin_54445841

一份从代码出发的强化学习Q-Learning入门教程，请笑纳！
本文由机器之心编译（ID：almosthuman2014）强化学习（RL）强化学习是机器学习的一个重要领域，其中智能体通过对状态的感知、对行动的选择以及接受奖励和环境相连接。在每一步，智能体都要观察状态、选择并执行一个行动，这会改变它的状态并产生一个奖励。马尔科夫决策过程（MDP）我们将要解决「forest fire」的马尔科夫决策问题，这个在 python 的 MDP 工具箱（http://pymdptoolbox.readthedocs.io/en/latest/api/ex
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：367616
- 提供者：weixin_38544075

面向5G雾计算中基于Q-learning的安全中继节点选择方法
提出了一种基于 Q-learning 的最优双中继节点选择方法。首先构建了基于社会意识的安全雾计算结构模型，然后在该模型下设计了基于 Q-learning 算法的最优双中继节点选择方法，实现了在动态环境下对最优双中继节点的选择，最后对密钥生成速率、双中继节点选择速度和动态环境中双中继节点的选择准确率进行了分析。实验结果表明，该方案能有效地在动态环境中选择最优双中继节点，算法迅速收敛达到稳定，最优中继节点选择速度得到有效提升。
所属分类：其它
- 发布日期：2021-01-19
- 文件大小：1048576
- 提供者：weixin_38663452

« 1 2 3 45 6 7 8 9 10 ... 14 »