您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. C# 学习精彩例子100个(学习资料)

  2. 里面有100个C# 学习的精彩例子,都有源代码,可以运行,学习者中很好的模仿学习资料。。欢迎下载
  3. 所属分类:C#

    • 发布日期:2010-07-23
    • 文件大小:6mb
    • 提供者:lbggame213
  1. 2018openAI最新机器人模仿学习论文

  2. 基于VR的机器人模仿学习,厉害!!
  3. 所属分类:VR

  1. 模仿学习Imitation Learning最新论文2018

  2. 模仿学习就是希望机器能够通过观察模仿专家的行为来进行学习。OpenAI,DeepMind,Google Brain目前都在向这方面发展。
  3. 所属分类:深度学习

    • 发布日期:2018-12-31
    • 文件大小:21mb
    • 提供者:hxd3008
  1. Python-Tensorflow实现生成对抗模仿学习GAIL

  2. Tensorflow实现生成对抗模仿学习Generative Adversarial Imitation Learning
  3. 所属分类:其它

  1. Python-深度增强学习算法的PyTorch实现策略梯度生成对抗模仿学习

  2. 深度增强学习算法的PyTorch实现(策略梯度/生成对抗模仿学习)
  3. 所属分类:其它

  1. 深度强化学习视频.zip

  2. 模仿学习,深度强化学习领域视频合集
  3. 所属分类:机器学习

    • 发布日期:2020-05-10
    • 文件大小:135mb
    • 提供者:bornfree5511
  1. 模仿学习做证明题(Release)

  2. 机器学习模仿学习做证明题(Release)。
  3. 所属分类:Python

    • 发布日期:2020-03-19
    • 文件大小:6mb
    • 提供者:shouguan
  1. 基于生成对抗网络的模仿学习综述(计算机学报).pdf

  2. 最近,新的研究工作利用生成对抗网络技术和强化学习技术等分别对这些问题进行改进,并在观察机制、多智能体系统等方面对GAIL进行了拓展。本文综述了这些有代表性的工作,并探讨这类算法未来的发展趋势,最后进行了总结。
  3. 所属分类:机器学习

    • 发布日期:2020-02-24
    • 文件大小:1mb
    • 提供者:syp_net
  1. 空间演化囚徒困境基于环格与模仿的合作涌现

  2. 空间演化囚徒困境基于环格与模仿的合作涌现,余谦,罗黎,基于环格,构建了局部交互的社会网络,其中的个体分别与邻居进行空间囚徒困境博弈,并根据带模仿成本的模仿学习机制不断进行博弈
  3. 所属分类:其它

    • 发布日期:2020-02-07
    • 文件大小:222kb
    • 提供者:weixin_38645379
  1. 深度学习的最优化:理论和算法综述论文【包含257篇文献】.zip

  2. 深度学习理论是当下研究的热点之一。最近来自UIUC计算机助理教授Sun Ruoyu撰写一篇深度学习最优化理论和算法的综述论文,共60页257篇文献,概述了神经网络的优化算法和训练理论《Optimization for deep learning: theory and algorithms》,并得到众多大佬的推荐,比如模仿学习带头人加州理工Yisong Yue,欢迎大家阅览,需要一番数学理论功底,方能扛过。
  3. 所属分类:机器学习

    • 发布日期:2019-12-30
    • 文件大小:789kb
    • 提供者:syp_net
  1. 模仿学习(Imitation Learning)

  2. Imitation Learning(模仿学习)是强化学习的一个分支,因其能很好的解决强化学习中的多步决策(sequential decision)问题,近段时间得到了广泛关注。那么模仿学习近期的前沿进展如何呢,来自加州理工大学的Yisong Yue,昨天在芝加哥大学,做了名为《New Frontiers in Imitation Learning》讲座。
  3. 所属分类:机器学习

    • 发布日期:2020-08-22
    • 文件大小:908kb
    • 提供者:syp_net
  1. 最新《模仿学习(Imitation Learning》进展报告

  2. 随着时空跟踪和传感数据的不断增长,现在人们可以在大范围内分析和建模细粒度行为。例如,收集每一场NBA篮球比赛的跟踪数据,包括球员、裁判和以25hz频率跟踪的球,以及带注释的比赛事件,如传球、投篮和犯规。
  3. 所属分类:机器学习

    • 发布日期:2020-12-06
    • 文件大小:63mb
    • 提供者:syp_net
  1. slimevolleygym:用于单人和多人强化学习的简单OpenAI Gym环境-源码

  2. 史莱姆排球体育馆环境 史莱姆排球是由一位不知名的作家在2000年代初期创建的游戏。 “游戏的物理原理有点'狡猾',但其简单的游戏玩法却立即使人上瘾。” SlimeVolleyGym是一个简单的健身房环境,用于测试单人和多人强化学习算法。 游戏非常简单:代理人的目标是使球着陆在对手方的地面上,从而使对手丧生。每个特工从五个生命开始。当任何一个特工失去全部五个生命时,或者经过3000个时间步长后,情节结束。座席失去对手时会获得+1的奖励,而失去生命则会获得-1的奖励。 该环境基于我于创建Java
  3. 所属分类:其它

  1. QWOP_RL_GAME-:使用强化学习和模仿学习-源码

  2. 所属分类:其它

  1. NTU-ReinforcementLearning-Notes:国立台湾大学李宏毅老师讲解的深度强化学习学习笔记-源码

  2. 李宏毅深度强化学习笔记 课程主页: 视频: 李宏毅老师讲这门课不是从MDP开始讲起,而是从如何获得最佳奖励出发,直接引出政策梯度(以及PPO),再讲Q-learning(原始Q-learning,DQN,各种DQN的升级),然后是A2C(以及A3C,DDPG),紧接着介绍了一些Reward Shaping的方法(主要是好奇心,课程学习,分层学习) ,,最后介绍模仿学习(逆RL)。比较全面的展现了深度强化学习的核心内容,也比较直观。跟伯克利学派的课类似,与UCL上来就讲MDP,解各种值迭代的思路
  3. 所属分类:其它

  1. LearningByCheating:使用航点预测和两阶段模仿学习在CARLA中驾驶-源码

  2. 通过作弊学习 此回购协议是CARLA 0.9.6中论文“通过作弊学习”的实现。 陈点,周雷迪,弗拉德伦·科尔图,菲利普·克拉伦布, (CoRL 2019) arXiv 1912.12294 CARLA 0.9.5中的代码即将推出。 参考 如果您发现此存储库对您的研究有用,请考虑引用我们的工作 inproceedings{chen2019lbc, author = {Dian Chen and Brady Zhou and Vladlen Koltun and Philipp Kr\
  3. 所属分类:其它

  1. 干预:学习从干预中获取动力-源码

  2. 用法 有关常规用法信息,请参阅intervention-learning --help 。 要从专家驱动程序收集模仿学习数据,请首先从下载专家模型: $ wget http://www.cs.utexas.edu/~dchen/lbc_release/ckpts/privileged/model-128.th 运行CARLA模拟器。 然后运行: $ intervention-learning collect-teacher-examples \ --teacher-checkpo
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:196kb
    • 提供者:weixin_42151599
  1. 模仿学习限制螺栓-源码

  2. 带有约束螺栓的异物仿制学习 额外的学习案例 在强化学习中,发现建模精确的奖励函数(导致代理商的期望行为)具有挑战性是一个常见的问题。 逆向强化学习旨在从专家代理提供的一组动作和观察中提取奖励功能,这可以是另一种训练有素的模型,基于模型的方法甚至是人类。 模仿学习是学习者从专家的行为中尝试的技术。 在该存储库中,探索了“约束螺栓”方法,该方法在一文中有详细描述 (De Giacomo等,2020年)。 环境:突围 特征 目标:卸下所有砖柱。 至少有1行3列砖 专家在左边。 用火作为摧毁砖块的行动
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:160mb
    • 提供者:weixin_42155721
  1. MPC_RL_Car:2020Spring,ECE239AS(强化学习)的作业和课程项目存储库-源码

  2. MaP,CaP,RaLly! 随机环境中UGV计划和控制的混合架构 2020年Spring,ECE239AS(强化学习)的作业和课程项目资料库。讲师:Lin Yang博士。 (c)2020年Swapnil Sayan Saha(欧洲经济委员会,UCE系,NESL),Nathaniel Snyder(美国加利福尼亚大学洛杉矶分校,MAE系)和Brian Wang(美国,NESL,UCLA CS系) 随着无人地面车辆(UGV)的出现和商业化,在操作环境中安全,但实时地优化随机性将带来计算和实现的复
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:17mb
    • 提供者:weixin_42160398
  1. 很棒的模仿学习:精选的很棒的模仿学习资源和出版物清单-源码

  2. 很棒的模仿学习:精选的很棒的模仿学习资源和出版物清单
  3. 所属分类:其它

« 12 3 4 5 6 7 8 9 10 ... 50 »