搜索资源 - RL-源码 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - RL-源码

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

learning-rl:我执行与RL有关的事情的笔记本-源码
learning-rl 我执行与RL有关的事情的笔记本我正在从Barto和Suttons RL书中学习RL。这是我实现的东西。
所属分类：其它
- 发布日期：2021-03-26
- 文件大小：8kb
- 提供者：weixin_42144707

o_jogo:Joguinho pra RL-源码
o_jogo:Joguinho pra RL
所属分类：其它
- 发布日期：2021-03-26
- 文件大小：2kb
- 提供者：weixin_42164534

mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制-源码
概述这是pytorch中基于模型的RL算法MBPO的重新实现，如下文所述：。该代码基于的使用张量流集成模型重现了结果，但使用pytorch集成模型却表现出明显的性能下降。这段代码使用pytorch重新实现了集成动力学模型，并缩小了差距。转载结果比较是在两个任务上完成的，而其他任务没有经过测试。但是在经过测试的两个任务上，与官方的tensorflow代码相比，pytorch实现获得了类似的性能。依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mb
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：172kb
- 提供者：weixin_42168830

Trabajo-de-investigacion-3-源码
Trabajo-de-investigacion-3 奥贝杰蒂沃斯普通物品：在操作过程中存在着两种形式的变化。 ObjetivosEspecíficos：分析和演绎分析。确定中性变质体或变质体高程。增强抗性的Analizar las公式matesáticasy los despejes para la抵制。马可·特里科（MARCOTEÓRICO） LISTA DE COMPONENTES EXPLICACIÓN DCACLAB的电路图，模拟的结果，模拟的结果。医
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：326kb
- 提供者：weixin_42132325

Principles-of-ML-源码
机器学习原理该存储库是我关于机器学习的阅读笔记的集合，其中包括以下经典教科书： ISL =统计学习入门，James，Witten，Hastie和Tibshirani DM =数据挖掘简介，作者Tan，Steinbach，Karpatne和Kumar Bishop，PRML =模式识别和机器学习 DL =深度学习，Goodfellow，Bengio和Courville撰写 RL =强化学习：简介，萨顿和巴托
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：3kb
- 提供者：weixin_42146230

rl-agents:tensorflow 2.0中的RL代理集合-源码
rl代理 tensorflow 2.0中的RL代理集合有用的定义 PPO 什么该算法并在OpenAI的旋转起来的文档中描述了很好的解释：“谁的最新间接最大限度地提高性能，通过代替最大化替代的目标函数给出多少\（j（πθ）\）将改变保守估计更新的结果” 策略上的算法每次更新仅使用根据最新版本的策略执行操作时收集的数据。非政策算法每次更新都可以使用培训期间任何时候记录的数据，而不考虑代理当时的环境如何。
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：39kb
- 提供者：weixin_42107491

rl:强化学习代码示例-源码
rl 强化学习代码示例
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：363kb
- 提供者：weixin_42133969

rl-todo:一个基本的应用程序-源码
RL待办事项清单眼镜您被要求开发一个待办事项列表应用程序，该应用程序允许用户创建和管理任务。该应用程序具有以下功能：•添加和查看任务•删除任务•完成任务•为我的任务设置优先级•查看按优先级和名称排序的任务•查看总数和已完成任务的数量指示请提供您实施的相关源代码，以及您认为合适的任何文档和其他假设。请使用以下信息来帮助您成功完成挑战：•挑战的意图是使我们有机会判断您的问题解决，设计和开发技能。重要的是提供一种解决方案，以突出您在这些领域的技能。 •使用最新的Web技术开发系统。 •不需要服
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：355kb
- 提供者：weixin_42131439

EasyRL:EasyRL-源码
EasyRL 概述近年来，我们目睹了强化学习（RL）的许多令人瞩目的进步，包括AlphaGo，OpenAI Five等。对于实际应用，我们已经成功地将RL应用到了许多电子商务场景中，例如基于会话的学习进行排名，与有监督的学习范式相比，RL的交互性提高了其应用的门槛，因为从业者必须实现复杂的学习算法，而不是简单地从TensorFlow（TF）/ PyTorch中选择一种损失，模型和优化器当考虑分布式设置时，处理数据（状态，动作，奖励等）和模型参数的通信此仓库以独立和分布式模式提供了许多广泛
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：708kb
- 提供者：weixin_42139252

alpha-bomber:我们正在开发最先进的强化学习技术，以解决Bomberman的古老游戏-源码
机器学习基础知识2020/2021的最终项目代码模板：：我们的任务：我们正在开发最先进的强化学习技术，以解决Bomberman的古老游戏。强化学习-快速概述：常见的RL方法可以分为基于策略和基于价值的方法。值方法输出代表当前状态质量的值，并在值迭代过程中学习。从选择随机值函数开始，此过程将迭代地改进该函数，直到达到最佳值函数为止。然后可以从该函数中得出最佳策略。另一方面，基于策略的方法旨在直接改善代理的策略，即状态与行为之间的映射。流行的方法有：（深度）Q学习（值方法）策略梯
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：4mb
- 提供者：weixin_42127754

floodlight-api-look-ahead-rl-源码
Floodlight API Api Look-Ahead-rl 流量功能 /wm/core/switch/all/flow/json上每个流的数据格式： "priority": "1", "hard_timeout_s": "0", "byte_count": "294", "idle_timeout_s": "5", "duration_nsec": "608000000", "packet_count": "3", "duration_sec": "3", "version": "OF_
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：74mb
- 提供者：weixin_42168745

RL-源码
RL
所属分类：其它
- 发布日期：2021-03-16
- 文件大小：63mb
- 提供者：weixin_42129412

market-rl-源码
强化学习的股票预测（纽约机器学习研讨会）安装安装Anaconda环境，然后： conda create -n rl python=3 jupyterlab numpy pandas matplotlib conda activate rl Q-Learning简介笔记本电脑 jupyter lab 打开笔记本： reinforcement-learning-1.ipynb reinforcement-learning-2.ipynb 高级-深度强化学习 conda install -c
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：4mb
- 提供者：weixin_42105816

RL-源码
RL
所属分类：其它
- 发布日期：2021-03-05
- 文件大小：1kb
- 提供者：weixin_42112658

股票交易RL-源码
股票交易环境一个定制的OpenAI体育馆环境，用于根据历史价格数据模拟股票交易。基于以下媒体文章中详细介绍的的工作： :
所属分类：其它
- 发布日期：2021-02-18
- 文件大小：102kb
- 提供者：weixin_42160425

marketing-rl-源码
marketing-rl
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：532kb
- 提供者：weixin_42135754

RL-SSSP：Djikstra算法的简单RL-源码
RL-SSSP Djikstra算法的RL-单一来源最短路径
所属分类：其它
- 发布日期：2021-02-13
- 文件大小：739kb
- 提供者：weixin_42153691

CSCI3302-RL-源码
CSCI3302-RL
所属分类：其它
- 发布日期：2021-02-13
- 文件大小：7mb
- 提供者：weixin_42133969

RL-源码
该存储库包含ipynb格式的RL训练算法。这个仓库有许多不相关的代码，因为它是在我不熟悉github时创建的。请访问以获得统一的ml-agent项目。
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：710mb
- 提供者：weixin_42131785

基于C#实现网络爬虫 C#抓取网页Html源码
最近刚完成一个简单的网络爬虫，开始的时候很迷茫，不知道如何入手，后来发现了很多的资料，不过真正能达到我需要，有用的资料–代码很难找。所以我想发这篇文章让一些要做这个功能的朋友少走一些弯路。首先是抓取Html源码，并选择节点的href：要添加using System.IO;using System.Net; private void Search(string url) { string rl; WebRequest Request = WebRequest.Create(url.T
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：45kb
- 提供者：weixin_38743054

« 12 3 4 5 6 7 8 9 10 ... 16 »