大数据下载,spark下载列表第138页

[spark] spark2.3的配置文件log4j.properties

说明： spark2.3的配置文件log4j.properties，修改部分是为了只显示ERROR信息，隐藏INFO信息
<cc1949> 上传 | 大小：2kb

[spark] 大数据Spark企业级实战版 - 王家林

说明：《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容，涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等，并且结合Spark源码细致的解析了Spark内核和四大子框架，最后在附录中提供了的Spark的开发语言Scala快速入门实战内容，学习完此书即可胜任绝大多数的企业级Spark开发需要。
<wyl07122028> 上传 | 大小：110mb

[spark] Spark面试2000题(1~6期外加60题)

说明： Spark面试2000题(1~6期外加60题) Spark面试2000题(1~6期外加60题)
<sysocc> 上传 | 大小：11mb

[spark] Python语言使用Spark集群

说明： Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架。可以通过Python构建Spark任务。
<weixin_37686376> 上传 | 大小：4mb

[spark] spark-2.3.0 api 文档

说明： spark 2.3.0 api 文档。 Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala, Python and R, and an optimized engine that supports general execution graphs. It also supports a rich set of higher-
<ktlinker1119> 上传 | 大小：13mb

[spark] 大数据技术综述

说明：本文总结了最近几年大数据技术发展的趋势与解决的问题，重点阐述了如何解决大数据遇到的存储问题，计算问题，以及当前主流的大数据分析模型，包括统计模型与机器学习算法，以及最新的深度学习与强化学习等。
<kenan716> 上传 | 大小：2mb

[spark] spark,hadoop生态圈总结

说明：详细描述了spark,hadoop生态圈的各个组建，能充分了解各个组建的原理以及使用
<u013385018> 上传 | 大小：1mb

[spark] 关于影响力最大化的CELF算法的Scala程序

说明：该程序是用Scala编写的关于影响力最大化经典算法中的celf算法的简单实现，其中使用到了spark GraphX的Pregel框架来对节点中消息的搜集、处理、合并操作，
<qk_conor> 上传 | 大小：4kb

[spark] libevent-2.0.18-stable.tar.gz

说明：安装PowerGraph所需的压缩包，libevent-2.0.18-stable.tar.gz。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
<nice_wen> 上传 | 大小：821kb

[spark] Spark学习笔记

说明：本人学习Spark过程中记录的笔记，从基础到优化基本上都包括了。虽然受限于本人技术，本笔记还是有些简单！但是也是比较全面的！
<han_lin_> 上传 | 大小：9mb

[spark] spark 朴素贝叶斯实现股票预测数据+代码

说明：这个主要是利用spark的api，朴素贝叶斯算法，来预测股票，其中包含的股票的原始数据和处理后适合spark api处理的训练模型
<qq_32021523> 上传 | 大小：36mb

[spark] Spark技术内幕

说明：本书以源码为基础，深入分析Spark内核的设计理念和架构实现，系统讲解各个核心模块的实现，为性能调优、二次开发和系统运维提供理论支持；本文最后以项目实战的方式，系统讲解生产环境下Spark应用的开发、部署和性能调优。
<u012261082> 上传 | 大小：6mb