文件名称:
libvineyard:libvineyard-源码
开发工具:
文件大小: 1mb
下载次数: 0
上传时间: 2021-03-18
详细说明:内存中不变数据管理器
Vineyard是一个内存中不变数据管理器,可为大数据任务(例如图形分析(例如 ),数值计算)中的分布式数据提供开箱即用的高级抽象和零拷贝内存中共享(例如,)和机器学习。
Vineyard旨在实现大数据系统之间的零拷贝数据共享。让我们从进行的典型机器学习任务开始。我们可以看到该任务分为多个工作步骤:首先,我们以pandas.DataFrame从文件系统中读取数据。然后,我们应用一些预处理作业,例如消除数据框的空值。之后,我们定义模型,并在PyTorch中的已处理数据帧上训练模型。最后,评估模型的性能。
在单台机器上,尽管pandas和PyTorch是针对不同任务的两个不同系统,但可以在它们之间高效地共享数据,而无需支付额外费用,而所有事情都可以在单个python脚本中端到端进行。
如果输入数据太大而无法在一台计算机上处理该怎么办?如该图左侧所示,一种常见的做法
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.