您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第367页

« 1 2 ... .62 .63 .64 .65 .66 367.68 .69 .70 .71 .72 ... 1412 »

[spark] Spark ml pipline交叉验证之决策树回归.docx

说明: Spark ml pipline交叉验证之决策树回归 //ML的VectorAssembler是一个transformer,要求数据类型不能是string,将多列数据转化为单列的向量列,比如把age、income等等字段列合并成一个 userFea 向量列,方便后续训练 //创建机器学习工作流 //创建回归评估器,用于基于训练集的多次训练后的模型选择 //获取最大迭代次数和正则参数,一共可以训练出(maxDepths*maxBins)个模型 //创建交叉验证器,他会把训练集分成NumFolds
<q18729096963> 上传 | 大小:21kb

[spark] Spark ml pipline交叉验证之线性回归.docx

说明: Spark ml pipline交叉验证之线性回归 工具开发 //创建回归评估器,用于基于训练集的多次训练后的模型选择 //创建交叉验证器,他会把训练集分成NumFolds份,然后在其中(NumFolds-1)份里进行训练 //在其中一份里进行测试,针对上面的每一组参数都会训练出NumFolds个模型,最后选择一个最优的模型 //对最优的模型做一个模型评估
<q18729096963> 上传 | 大小:218kb

[spark] Spark MLlib机器学习

说明: Spark MLlib机器学习 黄美灵,网名:sunbow,Spark爱好者,现从事移动互联网的计算广告和数据变现工作。  《Spark MLlib机器学习:算法、源码及实战详解》作者
<yxbbjxy> 上传 | 大小:837kb

[Hadoop] 第二章 HDFS的Shell操作.pptx

说明: HDFS的Shell操作,bin/hadoop fs 具体命令 OR bin/hdfs dfs 具体命令 dfs是fs的实现类等等。
<xyy_xyy_xyy> 上传 | 大小:680kb

[Hadoop] 第一章 HDFS概述.pptx

说明: 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。
<xyy_xyy_xyy> 上传 | 大小:804kb

[算法与数据结构] elasticsearch-analysis-ik-5.2.0.zip

说明: 分词搜索算法源码 elasticsearch-analysis-ik-5.2.0.zip
<jyf009> 上传 | 大小:4mb

[Hadoop] 金蝶主数据管理解决方案.pdf

说明: 金蝶主数据管理解决方案.pdf 金蝶主数据管理解决方案.pdf
<itshu> 上传 | 大小:5mb

[Hadoop] 华为大数据解决方案汇报V2.0.pptx

说明: 华为大数据解决方案汇报V2.0.pptx
<itshu> 上传 | 大小:5mb

[Hadoop] 云平台及大数据建设思路.pptx

说明: 云平台及大数据建设思路 云平台及大数据建设思路 云平台及大数据建设思路
<itshu> 上传 | 大小:14mb

[Hadoop] 大数据平台规划方案汇报(PPT-22张).ppt

说明: 大数据平台规划方案汇报(PPT-22张).ppt 所谓“大数据”,指的是所涉及的数据量规模巨大到无法通过目前主流软件工具,在合理时间内达到截取、管理、处理、并整理成为帮助企业经营决策更积极目的的信息
<itshu> 上传 | 大小:1mb

[spark] spark大数据商业实战三部曲源码及资料.zip

说明: spark大数据商业实战三部曲源码及资料,包含书中各个章节所用到的文件、资料、代码
<weixin_41624645> 上传 | 大小:10mb

[Hadoop] 3.x编译包.zip

说明: 源码编译azkaban,使用源码编译,编译后可以直接安装使用
<onionm> 上传 | 大小:94mb
« 1 2 ... .62 .63 .64 .65 .66 367.68 .69 .70 .71 .72 ... 1412 »