您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于多智能体的交通控制与交通诱导协同理论和方法研究

  2. 交通管理在城市交通问题治理中十分重要,其目的是提供一个畅通、有序的交通环境。建立智能交通管理系统,广泛应用科学技术手段,全面提高管理水平和管理效益,是解决当前道路交通拥堵、事故频繁发生和环境污染严重的有效途径。在交通管理实施中涉及到很多管理策略的制定,包括交通诱导和控制策略的制定。由于交通系统本身的复杂性,在交通管理中涉及的决策数据的信息量巨大,完全依靠人工来完成城市交通控制和诱导策略的制定存在很大困难,难以实现。基于多智能体的智能决策支持技术的出现,可以满足交通管理中的决策需求。本文深入剖析
  3. 所属分类:专业指导

    • 发布日期:2013-07-14
    • 文件大小:8mb
    • 提供者:shi198369
  1. 基于模型的强化学习的博弈论框架

  2. 基于模型的强化学习(MBRL)最近获得了极大的兴趣,因为它具有潜在的样本效率和合并非策略数据的能力。然而,使用富函数逼近器设计稳定、高效的MBRL算法仍然具有挑战性。
  3. 所属分类:机器学习

    • 发布日期:2020-04-21
    • 文件大小:3mb
    • 提供者:syp_net
  1. 强化学习和最优控制的《十个关键点》【81页PPT汇总】.pdf

  2. 强化学习和最优控制的《十个关键点》81页PPT汇总。本实验室主要面向于深度强化学习领域,分享包括但不限于深度强化学习Environment、理论推导与算法实现、前沿技术与论文解读、开源项目、应用场景、业界资讯等,同时包括基础数学、经典控制、博弈论、交叉学科等领域知识。
  3. 所属分类:机器学习

    • 发布日期:2020-03-03
    • 文件大小:4mb
    • 提供者:syp_net
  1. Multi-Agent Reinforcement Learning.pdf

  2. 分享一种强化学习的建模过程,它是将通信当中的资源分配问题建立成强化学习方法,资源分配是指通信网络中,频谱资源、信道、带宽、天线功率等等是有限的,怎么管理这些资源来保证能够通信的同时优化整个网络吞吐量、功耗,这个就是网络资源分配。这里多智能体就是涉及博弈论的思想。
  3. 所属分类:机器学习

    • 发布日期:2020-06-14
    • 文件大小:935kb
    • 提供者:u010442908
  1. matlab实验课程综合实验.zip

  2. 群体随机决策系统的研究近年来得到了应用数学、博弈论、控制论、系统论、计算机科学等领域专家学者的广泛关注。相关研究对强化学习、群体智能、智能决策、群体行为预测与分析,多智能体协作等问题的研究具有重要的理论意义和应用价值。群体随机决策系统的仿真模拟是该前沿课题研究的重要组成部分,涉及数学实验中循环语句、随机数的生成、蒙特卡罗方法等内容。群体随机决策系统的仿真模拟可以加深对数学实验课程相关内容的理解和掌握,同时帮助学生了解人工智能领域的相关前沿课题研究。
  3. 所属分类:教育

    • 发布日期:2020-12-10
    • 文件大小:98kb
    • 提供者:qq_44682905
  1. Reinforcement-Learning-Materials-源码

  2. 强化学习材料 AAMAS 2020 4任务分配策略的异构机器人队[ ] [英文博客] 5多代理协议的提炼[ ] 多代理 代理建模代理 169深度强化学习中的对手建模[ ] 170在多智能体强化学习中对他人进行自我建模[ ] 171用于多Agent系统的深度策略推理Q网络[ ] 173自我学习中的深度强化学习[ ] 174心理机器理论[ ] 175致力于针对复杂性的有效检测和最佳响应[ ] 183健壮的多智能体强化学习[ ] 184针对[ ]的深层贝叶斯政策重用方
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:82mb
    • 提供者:weixin_42136477
  1. Udacity-Algorithms:Udacity-Intro_to_Algorithms-源码

  2. Udacity算法 Udacity算法 Udacity 1.介绍算法 2.可计算性,复杂性和算法 3. Python中的数据结构和算法 4.研究生算法导论 其他 1.使用Python的数据结构和算法 1. Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师:Michael Littman 迈克尔·莱德曼·利特曼(Michael Lederman Littman)(1966年8月30日出生)是计算机科学家。 他主要从事强化
  3. 所属分类:其它

  1. Udacity-Intro_to_Algorithms:Udacity-Intro_to_Algorithms-源码

  2. Udacity算法 Udacity算法 Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师:Michael Littman 迈克尔·莱德曼·里特曼(Michael Lederman Littman)(1966年8月30日出生)是计算机科学家。 他主要从事强化学习,但在机器学习,博弈论,计算机网络,部分可观的马尔可夫决策过程求解,类比问题的计算机求解等领域从事过工作。 他目前是布朗大学的计算机科学教授。 教学大纲 第1课
  3. 所属分类:其它

  1. Papers-Literature-ML-DL-RL-AI:与机器学习,深度学习,AI,博弈论,强化学习有关的高引用和有用论文-源码

  2. Papers-Literature-ML-DL-RL-AI:与机器学习,深度学习,AI,博弈论,强化学习有关的高引用和有用论文
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:421mb
    • 提供者:weixin_42168555