点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - RL-源码
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
learning-rl:我执行与RL有关的事情的笔记本-源码
learning-rl 我执行与RL有关的事情的笔记本 我正在从Barto和Suttons RL书中学习RL。 这是我实现的东西。
所属分类:
其它
发布日期:2021-03-26
文件大小:8kb
提供者:
weixin_42144707
o_jogo:Joguinho pra RL-源码
o_jogo:Joguinho pra RL
所属分类:
其它
发布日期:2021-03-26
文件大小:2kb
提供者:
weixin_42164534
mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制-源码
概述 这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。 该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。 这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。 转载结果 比较是在两个任务上完成的,而其他任务没有经过测试。 但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。 依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mb
所属分类:
其它
发布日期:2021-03-25
文件大小:172kb
提供者:
weixin_42168830
Trabajo-de-investigacion-3-源码
Trabajo-de-investigacion-3 奥贝杰蒂沃斯 普通物品: 在操作过程中存在着两种形式的变化。 ObjetivosEspecíficos: 分析和演绎分析。 确定中性变质体或变质体高程。 增强抗性的Analizar las公式matesáticasy los despejes para la抵制。 马可·特里科(MARCOTEÓRICO) LISTA DE COMPONENTES EXPLICACIÓN DCACLAB的电路图,模拟的结果,模拟的结果。 医
所属分类:
其它
发布日期:2021-03-25
文件大小:326kb
提供者:
weixin_42132325
Principles-of-ML-源码
机器学习原理 该存储库是我关于机器学习的阅读笔记的集合,其中包括以下经典教科书: ISL =统计学习入门,James,Witten,Hastie和Tibshirani DM =数据挖掘简介,作者Tan,Steinbach,Karpatne和Kumar Bishop,PRML =模式识别和机器学习 DL =深度学习,Goodfellow,Bengio和Courville撰写 RL =强化学习:简介,萨顿和巴托
所属分类:
其它
发布日期:2021-03-22
文件大小:3kb
提供者:
weixin_42146230
rl-agents:tensorflow 2.0中的RL代理集合-源码
rl代理 tensorflow 2.0中的RL代理集合 有用的定义 PPO 什么该算法并在OpenAI的旋转起来的文档中描述了很好的解释:“谁的最新间接最大限度地提高性能,通过代替最大化替代的目标函数给出多少\(j(πθ)\)将改变保守估计更新的结果” 策略上的算法 每次更新仅使用根据最新版本的策略执行操作时收集的数据。 非政策算法 每次更新都可以使用培训期间任何时候记录的数据,而不考虑代理当时的环境如何。
所属分类:
其它
发布日期:2021-03-22
文件大小:39kb
提供者:
weixin_42107491
rl:强化学习代码示例-源码
rl 强化学习代码示例
所属分类:
其它
发布日期:2021-03-22
文件大小:363kb
提供者:
weixin_42133969
rl-todo:一个基本的应用程序-源码
RL待办事项清单 眼镜 您被要求开发一个待办事项列表应用程序,该应用程序允许用户创建和管理任务。该应用程序具有以下功能:•添加和查看任务•删除任务•完成任务•为我的任务设置优先级•查看按优先级和名称排序的任务•查看总数和已完成任务的数量 指示 请提供您实施的相关源代码,以及您认为合适的任何文档和其他假设。请使用以下信息来帮助您成功完成挑战:•挑战的意图是使我们有机会判断您的问题解决,设计和开发技能。重要的是提供一种解决方案,以突出您在这些领域的技能。 •使用最新的Web技术开发系统。 •不需要服
所属分类:
其它
发布日期:2021-03-22
文件大小:355kb
提供者:
weixin_42131439
EasyRL:EasyRL-源码
EasyRL 概述 近年来,我们目睹了强化学习(RL)的许多令人瞩目的进步,包括AlphaGo,OpenAI Five等。对于实际应用,我们已经成功地将RL应用到了许多电子商务场景中,例如基于会话的学习进行排名,与有监督的学习范式相比,RL的交互性提高了其应用的门槛,因为从业者必须 实现复杂的学习算法,而不是简单地从TensorFlow(TF)/ PyTorch中选择一种损失,模型和优化器 当考虑分布式设置时,处理数据(状态,动作,奖励等)和模型参数的通信 此仓库以独立和分布式模式提供了许多广泛
所属分类:
其它
发布日期:2021-03-22
文件大小:708kb
提供者:
weixin_42139252
alpha-bomber:我们正在开发最先进的强化学习技术,以解决Bomberman的古老游戏-源码
机器学习基础知识2020/2021的最终项目代码模板: : 我们的任务:我们正在开发最先进的强化学习技术,以解决Bomberman的古老游戏。 强化学习-快速概述: 常见的RL方法可以分为基于策略和基于价值的方法。值方法输出代表当前状态质量的值,并在值迭代过程中学习。从选择随机值函数开始,此过程将迭代地改进该函数,直到达到最佳值函数为止。然后可以从该函数中得出最佳策略。 另一方面,基于策略的方法旨在直接改善代理的策略,即状态与行为之间的映射。 流行的方法有: (深度)Q学习(值方法) 策略梯
所属分类:
其它
发布日期:2021-03-22
文件大小:4mb
提供者:
weixin_42127754
floodlight-api-look-ahead-rl-源码
Floodlight API Api Look-Ahead-rl 流量功能 /wm/core/switch/all/flow/json上每个流的数据格式: "priority": "1", "hard_timeout_s": "0", "byte_count": "294", "idle_timeout_s": "5", "duration_nsec": "608000000", "packet_count": "3", "duration_sec": "3", "version": "OF_
所属分类:
其它
发布日期:2021-03-19
文件大小:74mb
提供者:
weixin_42168745
RL-源码
RL
所属分类:
其它
发布日期:2021-03-16
文件大小:63mb
提供者:
weixin_42129412
market-rl-源码
强化学习的股票预测 (纽约机器学习研讨会) 安装 安装Anaconda环境,然后: conda create -n rl python=3 jupyterlab numpy pandas matplotlib conda activate rl Q-Learning简介 笔记本电脑 jupyter lab 打开笔记本: reinforcement-learning-1.ipynb reinforcement-learning-2.ipynb 高级-深度强化学习 conda install -c
所属分类:
其它
发布日期:2021-03-08
文件大小:4mb
提供者:
weixin_42105816
RL-源码
RL
所属分类:
其它
发布日期:2021-03-05
文件大小:1kb
提供者:
weixin_42112658
股票交易RL-源码
股票交易环境 一个定制的OpenAI体育馆环境,用于根据历史价格数据模拟股票交易。 基于以下媒体文章中详细介绍的的工作: :
所属分类:
其它
发布日期:2021-02-18
文件大小:102kb
提供者:
weixin_42160425
marketing-rl-源码
marketing-rl
所属分类:
其它
发布日期:2021-02-14
文件大小:532kb
提供者:
weixin_42135754
RL-SSSP:Djikstra算法的简单RL-源码
RL-SSSP Djikstra算法的RL-单一来源最短路径
所属分类:
其它
发布日期:2021-02-13
文件大小:739kb
提供者:
weixin_42153691
CSCI3302-RL-源码
CSCI3302-RL
所属分类:
其它
发布日期:2021-02-13
文件大小:7mb
提供者:
weixin_42133969
RL-源码
该存储库包含ipynb格式的RL训练算法。 这个仓库有许多不相关的代码,因为它是在我不熟悉github时创建的。 请访问以获得统一的ml-agent项目。
所属分类:
其它
发布日期:2021-02-04
文件大小:710mb
提供者:
weixin_42131785
基于C#实现网络爬虫 C#抓取网页Html源码
最近刚完成一个简单的网络爬虫,开始的时候很迷茫,不知道如何入手,后来发现了很多的资料,不过真正能达到我需要,有用的资料–代码很难找。所以我想发这篇文章让一些要做这个功能的朋友少走一些弯路。 首先是抓取Html源码,并选择 节点的href:要添加using System.IO;using System.Net; private void Search(string url) { string rl; WebRequest Request = WebRequest.Create(url.T
所属分类:
其它
发布日期:2021-01-20
文件大小:45kb
提供者:
weixin_38743054
«
1
2
3
4
5
6
7
8
9
10
...
16
»