您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于Q-learning的应用算法

  2. 在介绍了Qlearning的基础上,利用此方法解决实际问题
  3. 所属分类:其它

    • 发布日期:2010-10-25
    • 文件大小:197632
    • 提供者:wuxinyu392
  1. Q learning algorithm

  2. 刚才那个程序需要用到一个算法 继续续传 希望能对大家有用
  3. 所属分类:其它

    • 发布日期:2010-12-29
    • 文件大小:931
    • 提供者:dreamtraveler
  1. Q learning算法的实现

  2. 本程序利用C#实现Q学习算法,能够实现Q学习算法的基本思想,仅供参考,谢谢支持
  3. 所属分类:其它

    • 发布日期:2011-02-20
    • 文件大小:29696
    • 提供者:kingshrimp
  1. 城市交通信号智能控制方法研究

  2. 用Q学习和BP算法解决交通信号控制问题的过程如下: 步骤1:在决策时间点,观察当前的交通状态s; 步骤2:通过Q值存储网络计算每种行为对应的Q值; 步骤3:管理Agent根据一定的策略选择行为a,并分别交由各个路口 Agent执行; 步骤4:执行行为a后,收到回报r; 步骤5:观察新的交通状态s',
  3. 所属分类:其它

    • 发布日期:2011-05-16
    • 文件大小:2097152
    • 提供者:dm19871126
  1. Q-learning算法

  2. Q学习的代码,用于实现算法,仅供参考,感谢论坛。
  3. 所属分类:其它

    • 发布日期:2014-11-17
    • 文件大小:2048
    • 提供者:qq_23385865
  1. 斯坦福吴恩达强化学习例程

  2. 斯坦福公开课吴恩达老师提供的强化学习例程,比较好理解,Q学习的例程
  3. 所属分类:专业指导

    • 发布日期:2016-05-31
    • 文件大小:679936
    • 提供者:zhaoxuan120
  1. reinforcement learning: an introduction

  2. reinforcement learning的权威之作。关于加强学习、Q-learning、马尔科夫决策算法等。
  3. 所属分类:机器学习

    • 发布日期:2017-11-02
    • 文件大小:3145728
    • 提供者:bidie6361
  1. deep q_learning

  2. # Deep Reinforcement Learning for Keras [![Build Status](https://api.travis-ci.org/matthiasplappert/keras-rl.svg?branch=master)](https://travis-ci.org/matthiasplappert/keras-rl) [![Documentation](https://readthedocs.org/projects/keras-rl/badge/)](ht
  3. 所属分类:深度学习

    • 发布日期:2018-06-19
    • 文件大小:10485760
    • 提供者:weixin_37949195
  1. 源码+书TensorFlow 1.x Deep Learning Cookbook

  2. In this book, you will learn how to efficiently use TensorFlow, Google's open source framework for deep learning. You will implement different deep learning networks such as Convolutional Neural Networks (CNNs), Recurrent Neural Networks (RNNs), Dee
  3. 所属分类:深度学习

    • 发布日期:2018-07-29
    • 文件大小:92274688
    • 提供者:wang1062807258
  1. Reinforcement Learning.pdf

  2. This book is primarily based on a Machine Learning subset known as Reinforcement Learning. We cover the basics of Reinforcement Learning with the help of the Python programming language and touch on several aspects, such as Q learning, MDP, RL with
  3. 所属分类:深度学习

    • 发布日期:2018-09-26
    • 文件大小:9437184
    • 提供者:guojingdaxia
  1. Keras Reinforcement Learning Projects Giuseppe Ciaburro 2018

  2. The book begins with getting you up and running with the concepts of reinforcement learning using Keras. You’ll learn how to simulate a random walk using Markov chains and select the best portfolio using dynamic programming (DP) and Python. You’ll al
  3. 所属分类:深度学习

    • 发布日期:2018-12-16
    • 文件大小:7340032
    • 提供者:u010652219
  1. Python Reinforcement Learning Projects Sean Saito 2018

  2. In this book, you will learn about the core concepts of RL including Q-learning, policy gradients, Monte Carlo processes, and several deep reinforcement learning algorithms. As you make your way through the book, you'll work on projects with datasets
  3. 所属分类:深度学习

    • 发布日期:2018-12-16
    • 文件大小:22020096
    • 提供者:u010652219
  1. 基于改进RBF的Q算法路径规划仿真MATLAB、

  2. 采用强化学习中的Q-learning算法实现移动机器人的局部路径规划,并引入资格迹,修改神经网络RBF的权值,使算法更有效地利用未知环境信息特征,以提高迭代过程中的收敛速度。
  3. 所属分类:机器学习

    • 发布日期:2019-01-17
    • 文件大小:118784
    • 提供者:qq_28396365
  1. Q学习,matlab

  2. Q学习,很有帮助.jie shao le Q-learning de ji ben shiyong
  3. 所属分类:其它

    • 发布日期:2019-02-22
    • 文件大小:2048
    • 提供者:treesouth
  1. 18. 强化学习(Q Learning) python代码实现

  2. Q函数、greedy策略,强化学习基础实例,采用python语言代码实现
  3. 所属分类:Python

    • 发布日期:2019-05-08
    • 文件大小:4096
    • 提供者:weixin_43471818
  1. Q-algorithm.rar

  2. 本程序适合做机器学习的人员使用,特别是用Q学习算法研究移动机器人路径规划或者导航的研究人员。本算法是经典的Q-Learning算法,可以在此基础上进行改进和仿真。
  3. 所属分类:机器学习

  1. 基于Q-learning的HTTP自适应流码率控制方法研究

  2. 基于HTTP的自适应流HAS已经成为自适应视频流服务的标准。在HAS客户端网络状态多变的情况下,硬编码形式的码率决策方法灵活性偏低,对用户体验考虑不足。为了优化用户体验质量(QoE),提出一种基于Q-Learning 的码率控制算法,结合 HTTP 自适应视频流客户端环境进行建模并定义状态转移规则;量化与用户QoE相关的参数,构建新的回报函数;实验表明引入Q-Learning进行码率调整的自适应算法在码率切换的稳定性方面表现较好。
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:817152
    • 提供者:weixin_38606041
  1. 基于Q-learning的跨域服务链映射机制

  2. 针对软件定义网络功能虚拟化环境下跨域服务链映射问题,提出了一种区域集中管理、全局协同调度的虚拟服务资源管控架构。在此基础上,建立了一种有效的跨域服务链映射框架,在此框架下将跨域服务链映射问题建模为以最小化映射开销为目标的整数线性规划问题,并基于Q-learning机制设计跨域服务链构建请求分割算法进行优化求解。仿真实验表明该方法在平均分割时间、平均映射开销和服务链构建请求接受率等方面相较传统方法具有更优的表现。
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:1048576
    • 提供者:weixin_38678255
  1. 基于不完全信息随机博弈与Q-learning的防御决策方法

  2. 针对现有随机博弈大多以完全信息假设为前提,且与网络攻防实际不符的问题,将防御者对攻击者收益的不确定性转化为对攻击者类型的不确定性,构建不完全信息随机博弈模型。针对网络状态转移概率难以确定,导致无法确定求解均衡所需参数的问题,将Q-learning引入随机博弈中,使防御者在攻防对抗中通过学习得到的相关参数求解贝叶斯纳什均衡。在此基础上,设计了能够在线学习的防御决策算法。仿真实验验证了所提方法的有效性。
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:1048576
    • 提供者:weixin_38706603
  1. heart_of_crown:王冠之心Q-Learning-源码

  2. heart_of_crown:王冠之心Q-Learning
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:1048576
    • 提供者:weixin_42123456
« 1 2 3 4 56 7 8 9 10 ... 14 »