您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 大数据处理与Spark计算框架.pptx

  2. spark 基础讲解
  3. 所属分类:其它

    • 发布日期:2016-12-26
    • 文件大小:14680064
    • 提供者:xsdxs
  1. spark 入门学习教程

  2. Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处,Spark以其先进的设计理念,迅速成为社区的热门项目,围绕着Spark推出了Spark SQL、Spark Streaming、MLLib和GraphX等组件,也就是BDAS(伯克利数据分析栈),这些组件逐渐形成大数据处理一站式解决平台。从各
  3. 所属分类:其它

    • 发布日期:2017-03-05
    • 文件大小:33554432
    • 提供者:claram
  1. Livy - 基于Apache Spark之上的REST服务

  2. Livy是构建于Apache Spark之上的REST服务,它提供了安全、高可用、灵活的REST API使用户可以以交互式、批处理以及编程式API的方式操作Spark。本演讲将为大家介绍Livy的基本功能、高阶特性以及与其他类似框架的比较
  3. 所属分类:讲义

    • 发布日期:2017-03-30
    • 文件大小:1048576
    • 提供者:erjin_ren
  1. MALK:一种高效处理大规模键值的MapReduce框架.pdf

  2. 大数据,Spark,MapReduce 本资料共包含以下附件: MALK:一种高效处理大规模键值的MapReduce框架.pdf
  3. 所属分类:其它

    • 发布日期:2017-04-07
    • 文件大小:5242880
    • 提供者:jiangsucsdn
  1. spark π计算的java实现

  2. spark 是基于内存的计算框架,在集群中即使计算10000次pi也很快,这是他的java实现,希望对大家有所帮助
  3. 所属分类:Java

    • 发布日期:2017-05-18
    • 文件大小:2048
    • 提供者:white_java522
  1. 大数据框架

  2. 压缩包中包括基于Hadoop的Saprk正规版本的下载链接以及Scala语言的入门,看完这个压缩包里面的内容后,基本可以入门大数据。Scala是进行Spark开发的语言,文档仔细讲解了Scala预言的入门,以及如何搭建Hadoop和Saprk平台。
  3. 所属分类:spark

    • 发布日期:2017-06-25
    • 文件大小:40894464
    • 提供者:xiao_shan_ge
  1. Apache Spark的设计与实现 PDF中文版

  2. 本文主要讨论 Apache Spark 的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析”,因为本文的主要目的不是去解读实现代码,而是尽量有逻辑地,从设计与实现原理的角度,来理解 job 从产生到执行完成的整个过程,进而去理解整个系统。 讨论系统的设计与实现有很多方法,本文选择 问题驱动 的方式,一开始引入问题,然后分问题逐步深入。从一个典型的 job 例子入手,逐渐讨论 job
  3. 所属分类:spark

    • 发布日期:2017-07-12
    • 文件大小:26214400
    • 提供者:whulovely
  1. Spark快速数据处理 带书签目录 完整版.pdf

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等各大公司等。
  3. 所属分类:spark

    • 发布日期:2017-09-20
    • 文件大小:18874368
    • 提供者:tanziyang1990
  1. spark 统计图表【在已有集群环境下】操作

  2. 我这是在已有的集群环境下,做的一个简单统计查询,图标显示,简单介绍了hdfs的作用,还有spark的rdd操作,使用vaadin框架,highchart插件显示图表
  3. 所属分类:spark

    • 发布日期:2017-10-11
    • 文件大小:1048576
    • 提供者:ysblogs
  1. 大数据Spark企业级实战版

  2. 《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。
  3. 所属分类:spark

    • 发布日期:2017-10-12
    • 文件大小:145752064
    • 提供者:liusiqingsong
  1. 基于Spark1.6使用Spark SQL和sqlite数据库进行诗歌浏览查询和集句的Scala工程源码

  2. 基于Spark1.6,使用Spark SQL框架和sqlite数据库,把唐诗三百首,宋诗三百首和元明清诗精选导入数据库,可以按来源,体裁及作者,方便地查出诗句或试题中包含某个关键字的作品,还可以在选中作品后,进行五绝,七绝和五律,七律的自动集句的尝试。
  3. 所属分类:spark

    • 发布日期:2017-10-15
    • 文件大小:49283072
    • 提供者:yangdanbo1975
  1. Spark安装文档

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
  3. 所属分类:spark

    • 发布日期:2017-10-17
    • 文件大小:529408
    • 提供者:weixin_40179437
  1. Spark学习笔记

  2. spark 可以很容易和yarn结合,直接调用HDFS、Hbase上面的数据,和hadoop结合。配置很容易。 spark发展迅猛,框架比hadoop更加灵活实用。减少了延时处理,提高性能效率实用灵活性。也可以与hadoop切实相互结合。 spark核心部分分为RDD。Spark SQL、Spark Streaming、MLlib、GraphX、Spark R等核心组件解决了很多的大数据问题,其完美的框架日受欢迎。其相应的生态环境包括zepplin等可视化方面,正日益壮大。大型公司争相实用sp
  3. 所属分类:spark

    • 发布日期:2017-11-06
    • 文件大小:34603008
    • 提供者:mr_liyang
  1. spark-2.2.1-bin-hadoop2.7.tgz

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
  3. 所属分类:spark

    • 发布日期:2017-12-13
    • 文件大小:200278016
    • 提供者:qq_22488571
  1. 7步学会apache spark

  2. Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。本文档用7步让你上手spark,节省学习时间
  3. 所属分类:spark

    • 发布日期:2017-12-18
    • 文件大小:4194304
    • 提供者:song_zhanlong
  1. 大数据Spark企业级实战版

  2. 《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。
  3. 所属分类:spark

    • 发布日期:2018-03-23
    • 文件大小:118489088
    • 提供者:hfut_ustcinfo
  1. Spark技术内幕-深入解析Spark内核架构设计与实现原理(高清书签版)

  2. Spark是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布式数据集的处理提供一个有效框架,而且以高效的方式处理分布式数据集。它支持实时处理、流处理和批处理,提供了AllinOne的统一解决方案,使得Spark极具竞争力。《Spark技术内幕:深入解析Spark内核架构设计与实现原理》以源码为基础,深入分析Spark内核的设计理念和架构实现,系统讲解各个核心模块的实现,为性能调优、二次开发和系统运维提供理论支持;本文最后以项目实战的方式,系统讲解生产环境下Spark应用的开发
  3. 所属分类:spark

    • 发布日期:2018-03-23
    • 文件大小:22020096
    • 提供者:qq_28178971
  1. spark Core RDD持久化详解

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark 是一种与 Hadoop
  3. 所属分类:spark

    • 发布日期:2018-03-23
    • 文件大小:3072
    • 提供者:qq_37162911
  1. Spark入门(完整版)

  2. Spark入门完整版 PDF版,从生态圈 部署安装 编程模型 运行框架 stream sql mllib graphx tachyon安装部署介绍
  3. 所属分类:spark

    • 发布日期:2018-04-03
    • 文件大小:33554432
    • 提供者:fmyhust
  1. 大数据Spark企业级实战版

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
  3. 所属分类:spark

    • 发布日期:2018-04-05
    • 文件大小:145752064
    • 提供者:qq_20001941
« 1 2 34 5 6 7 8 9 10 ... 27 »