大数据下载,spark下载列表第172页

[spark] Apache Spark源码读解

说明： class WordCount{ def main(args:Array[String]):Unit={ val conf =new SparkConf().setAppName("test").setMaster("local") val sc =new SparkContext(conf) sc.textFile(“”) .flatMap(_.split(", ")) .map((_.1)) .reduceByKey(_+_) .saveAsText("") } } ...展开收缩
<cvzhanshi> 上传 | 大小：401kb

[spark] Spark学习笔记三

说明： Spark 共享变量——累加器（accumulator）与广播变量（broadcast variable）广播变量累加器 RDD持久化 Spark中的checkpoint作用与用法 Spark的运行模式任务提交宽赖窄依赖 Spark任务调度
<cvzhanshi> 上传 | 大小：554kb

[spark] Spark学习笔记一

说明： Spark简介spark的四大特性 Speed Ease of Use Generality Runs Everywhere
<cvzhanshi> 上传 | 大小：206kb

[spark] 腾讯大数据2017年第一季度移动行业数据报告

说明：腾讯大数据2017年第一季度移动行业数据报告，腾讯大数据2017年第一季度移动行业数据报告
<brucezhao619> 上传 | 大小：5mb

[spark] Spark技术内幕

说明：
<mr_liyang> 上传 | 大小：3mb

[spark] Spark学习笔记

说明： spark 可以很容易和yarn结合，直接调用HDFS、Hbase上面的数据，和hadoop结合。配置很容易。 spark发展迅猛，框架比hadoop更加灵活实用。减少了延时处理，提高性能效率实用灵活性。也可以与hadoop切实相互结合。 spark核心部分分为RDD。Spark SQL、Spark Streaming、MLlib、GraphX、Spark R等核心组件解决了很多的大数据问题，其完美的框架日受欢迎。其相应的生态环境包括zepplin等可视化方面，正日益壮大。大型公司争相实用sp
<mr_liyang> 上传 | 大小：33mb

[spark] Spark学习总结-入门

说明： Spark是一个高效的分布式计算系统，发源于美国加州大学伯克利分校AMPLab的集群计算平台。Spark立足于内存计算，相比Hadoop MapReduce，Spark在性能上要高100倍，而且Spark提供了比Hadoop更上层的API，同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。
<mr_liyang> 上传 | 大小：6mb