您好,欢迎光临本网站![请登录][注册会员]  

大数据下载,spark下载列表 第46页

« 1 2 ... 41 42 43 44 45 4647 48 49 50 51 ... 202 »

[spark] README.md文档

说明: spark入门联系wordcount等相关操作文档~ Spark is a fast and general cluster computing system for Big Data. It provides high-level APIs in Scala, Java, Python, and R, and an optimized engine that supports general computation graphs for data analysis. It also supp
<cymy001> 在 上传 | 大小:4096

[spark] apache-spark-best-practices-and-tuning

说明: Spark最佳实践以及性能调试实战。PDF格式。Spark最佳实践以及性能调试实战。PDF格式。
<ljq1018> 在 上传 | 大小:1048576

[spark] 2018京东大数据技术白皮书.pdf

说明: 2018年12月7日,京东大数据与智能供应链事业部发布《2018京东大数据技术白皮书》。众所周知,大数据是企业的基本生产资料,数据信息是企业宝贵的资产。不同于其他资产,数据资产主要在企业运营过程中产生,较易获取,但要持续积累、沉淀和做好管理却并不容易,这是一项长期且系统性的工程。未经“雕琢”的数据是一组无序、混乱的数字,并不能给企业带来何种价值,从庞杂晦涩的数据中挖掘出“宝藏”充满着挑战,这需要将业务、技术与管理三者相互融合起来进行创新。 京东作为一家业内领先的互联网科技公司,完整的产业链条带
<weixin_45435074> 在 上传 | 大小:4194304

[spark] scala-intellij-bin-2019.2.20.zip

说明: intellij 的scala插件,最新版本,官网下载太慢了,现在贡献出来。
<qq_18177927> 在 上传 | 大小:57671680

[spark] mastering-apache-spark2.4.2.pdf

说明: 讲的是spark内部架构原理,略深,不适合初学者,需要结合源码一起学习
<cyfmw> 在 上传 | 大小:17825792

[spark] DATA Science简史.png

说明: 大数据简史,一图便可了解大数据发展史和简谱。供大家参考。
<weixin_39409791> 在 上传 | 大小:239616

[spark] CDH安装文档详细基础

说明: CDH集群安装的详细步骤,带截图比较详细,适合初学者进行学习
<qq_41028958> 在 上传 | 大小:7340032

[spark] SQL 数据库面试题__最主要文档_好好总结看看.pdf

说明: 这是一个大数据的常见面试题的总结,里面包含hadoop和spark等等的内容
<asd1456732891> 在 上传 | 大小:5242880

[spark] 录信数据库技术白皮书.pdf

说明: 录信数据库一款基于分布式架构下实时的、多维的、交互式的查询、统计、分析数据库;录信数据库是为探索性分析与即席分析而设计的数据库,使用索引+大数据技术,可以对万亿级别的数据做到秒级数据检索及统计分析服务。 录信数据库支持万亿秒查;数据规模超大,数据时效性高,可节约千倍IO,可对接外部数据源Oracle、Mysql、Kafka、Hive、Hbase、File、HDFS File等,可以与接口层Hive SQL、JDBC、WebService直接进行交互;同时支持跨集群数据同步,支持多种不同硬件平台
<cnlucene> 在 上传 | 大小:1048576

[spark] Spark ml pipline交叉验证之决策树回归.docx

说明: Spark ml pipline交叉验证之决策树回归 //ML的VectorAssembler是一个transformer,要求数据类型不能是string,将多列数据转化为单列的向量列,比如把age、income等等字段列合并成一个 userFea 向量列,方便后续训练 //创建机器学习工作流 //创建回归评估器,用于基于训练集的多次训练后的模型选择 //获取最大迭代次数和正则参数,一共可以训练出(maxDepths*maxBins)个模型 //创建交叉验证器,他会把训练集分成NumFolds
<q18729096963> 在 上传 | 大小:21504

[spark] Spark ml pipline交叉验证之线性回归.docx

说明: Spark ml pipline交叉验证之线性回归 工具开发 //创建回归评估器,用于基于训练集的多次训练后的模型选择 //创建交叉验证器,他会把训练集分成NumFolds份,然后在其中(NumFolds-1)份里进行训练 //在其中一份里进行测试,针对上面的每一组参数都会训练出NumFolds个模型,最后选择一个最优的模型 //对最优的模型做一个模型评估
<q18729096963> 在 上传 | 大小:223232

[spark] Spark MLlib机器学习

说明: Spark MLlib机器学习 黄美灵,网名:sunbow,Spark爱好者,现从事移动互联网的计算广告和数据变现工作。  《Spark MLlib机器学习:算法、源码及实战详解》作者
<yxbbjxy> 在 上传 | 大小:857088
« 1 2 ... 41 42 43 44 45 4647 48 49 50 51 ... 202 »