您好,欢迎光临本网站![请登录][注册会员]  

大数据下载,spark下载列表 第172页

« 1 2 ... .67 .68 .69 .70 .71 172.73 .74 .75 .76 .77 ... 198 »

[spark] Apache Spark源码读解

说明: class WordCount{ def main(args:Array[String]):Unit={ val conf =new SparkConf().setAppName("test").setMaster("local") val sc =new SparkContext(conf) sc.textFile(“”) .flatMap(_.split(", ")) .map((_.1)) .reduceByKey(_+_) .saveAsText("") } } ...展开收缩
<cvzhanshi> 上传 | 大小:401kb

[spark] Spark学习笔记三

说明: Spark 共享变量——累加器(accumulator)与广播变量(broadcast variable) 广播变量 累加器 RDD持久化 Spark中的checkpoint作用与用法 Spark的运行模式 任务提交 宽赖窄依赖 Spark任务调度
<cvzhanshi> 上传 | 大小:554kb

[spark] Spark学习笔记一

说明: Spark简介spark的四大特性 Speed Ease of Use Generality Runs Everywhere
<cvzhanshi> 上传 | 大小:206kb

[spark] 腾讯大数据2017年第一季度移动行业数据报告

说明: 腾讯大数据2017年第一季度移动行业数据报告,腾讯大数据2017年第一季度移动行业数据报告
<brucezhao619> 上传 | 大小:5mb

[spark] Spark技术内幕

说明:
<mr_liyang> 上传 | 大小:3mb

[spark] Spark学习笔记

说明: spark 可以很容易和yarn结合,直接调用HDFS、Hbase上面的数据,和hadoop结合。配置很容易。 spark发展迅猛,框架比hadoop更加灵活实用。减少了延时处理,提高性能效率实用灵活性。也可以与hadoop切实相互结合。 spark核心部分分为RDD。Spark SQL、Spark Streaming、MLlib、GraphX、Spark R等核心组件解决了很多的大数据问题,其完美的框架日受欢迎。其相应的生态环境包括zepplin等可视化方面,正日益壮大。大型公司争相实用sp
<mr_liyang> 上传 | 大小:33mb

[spark] Spark学习总结-入门

说明: Spark是一个高效的分布式计算系统,发源于美国加州大学伯克利分校AMPLab的集群计算平台。Spark立足于内存计算,相比Hadoop MapReduce,Spark在性能上要高100倍,而且Spark提供了比Hadoop更上层的API,同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。
<mr_liyang> 上传 | 大小:6mb

[spark] 大数据流式处理技术

说明: 大数据流式处理技术大数据流式处理技术大数据流式处理技术大数据流式处理技术
<ljone> 上传 | 大小:3mb

[spark] SparkSQL小结

说明: Spark的一些笔记,包含Spark SQL的使用和一些函数的使用
<shicongvv> 上传 | 大小:5mb

[spark] spark streaming

说明: spark streaming spark流式计算 Spark Streaming 是Spark核心API的一个扩展,可以实现高吞吐量的、具备容错机制的实时流数据的处理。支持从多种数据源获取数据
<u014372225> 上传 | 大小:7mb

[spark] spark操作hive表源码

说明: 应用spark2.1的api对hive对进行读写,代码中有明确的操作步骤。
<hyh012356789> 上传 | 大小:13kb

[spark] scala hadoop spark服务器环境部署

说明: Spark2.1.0完全分布式环境搭建 Hadoop2.7.4完全分布式搭建 Scala2.12.4环境搭建
<flashzhy> 上传 | 大小:81kb
« 1 2 ... .67 .68 .69 .70 .71 172.73 .74 .75 .76 .77 ... 198 »