您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Yarn框架代码详细分析V0.5

  2. Hadoop的2.0版本的yarn的框架介绍啊 Hadoop yarnYARN 本身框架的优势是扩展性与支持多计算模型。对于扩展性目前主要体现在计算节点规模上,以前 JobTracker-TaskTracker 模型下最多大约在 5000 台机器左右,对于 YARN,官方说可以支持大约 10w 台机器,当然这个目前还没有一家公司去试用过,连 300 台机器目前估计也是测试阶段。 对于支持多计算模型,目前 YARN 理论是可以支持更多的计算模型的,如: MAP-REDUCE、 MPI、 Gira
  3. 所属分类:讲义

    • 发布日期:2014-08-15
    • 文件大小:1048576
    • 提供者:u011440440
  1. Hadoop从业者为什么需要Spark?

  2. Hadoop从业者为什么需要Spark?答案是Hadoop已死,Spark称霸。 而Hadoop的死亡过程在2012年已经开始: 1,由于Hadoop自身架构的导致了在离线数据存储分析意外的一切领域都力不从心,理论已经证明MapReduce模型可以模拟一切分布式计算,但是效率成为其死穴,而Spark基于RDD的计算图可以轻松、完整地表达MapReduce模型,并且能极为容易的处理实时流计算、机器学习、图计算、误差查询等; 2,2012年以来Hadoop本身架构臃肿并未得到本质性的改善,很多修改
  3. 所属分类:虚拟化

    • 发布日期:2014-09-22
    • 文件大小:421888
    • 提供者:javaniceyou
  1. Spark Introduction

  2. Spark Introduction.Spark当前最流行的大数据开发框架。
  3. 所属分类:硬件开发

  1. spark安装文档

  2. 在ubuntu环境中搭建spark基础框架
  3. 所属分类:互联网

    • 发布日期:2015-01-19
    • 文件大小:172032
    • 提供者:xiawuyouyang
  1. Spark快速数据处理

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。   《Spark快速数据处理》系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群
  3. 所属分类:Java

    • 发布日期:2015-01-22
    • 文件大小:18874368
    • 提供者:xcgh
  1. Spark一个高效的分布式计算系统

  2. Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。
  3. 所属分类:其它

    • 发布日期:2015-02-02
    • 文件大小:259072
    • 提供者:stockjava
  1. Spark——基于内存的下一代大数据分析框架

  2. Spark——基于内存的下一代大数据分析框架
  3. 所属分类:Java

    • 发布日期:2015-03-22
    • 文件大小:1048576
    • 提供者:zlfing
  1. Spark和Hadoop的集成

  2. Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。Storm是一个分布式的、容错的实时计算系统。两者整合,优势互补。
  3. 所属分类:群集服务

    • 发布日期:2015-05-07
    • 文件大小:1048576
    • 提供者:u010409394
  1. Spark快速数据处理-前三章

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。
  3. 所属分类:Java

    • 发布日期:2015-05-25
    • 文件大小:2097152
    • 提供者:aa_moon
  1. Spark快速数据处理完整版

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立
  3. 所属分类:其它

    • 发布日期:2015-05-30
    • 文件大小:18874368
    • 提供者:qianru2011
  1. Spark快速数据处理 完整版

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范
  3. 所属分类:其它

    • 发布日期:2015-08-21
    • 文件大小:18874368
    • 提供者:lihongxi
  1. Spark快速数据处理

  2. Spark是一个通用的并行分布式计算框架,由UCBerkeley的AMP实验室开发。Spark使得程序员更容易地编写分布式应用,并且能够根据自己的喜好使用Scala、Java或者Python作为开发语言。本书系统讲解了Spark的应用方法,包括如下内容:第1章介绍如何在多种机器上安装Spark,以及如何配置一个Spark集群。第2章介绍如何在交互模式下运行第一个Spark作业。第3章介绍如何在Spark集群上构建一个生产级的脱机\独立作业。第4章介绍如何与Spark集群建立连接,以及Spark
  3. 所属分类:其它

    • 发布日期:2015-08-31
    • 文件大小:24117248
    • 提供者:hx0_0_8
  1. spark高手之路-实战Scala

  2. spark框架是采用Scala语言编写的,精致而优雅,要想成为spark高手,你就必须阅读spark的源代码,就必须掌握Scala.....
  3. 所属分类:Java

    • 发布日期:2015-11-06
    • 文件大小:10485760
    • 提供者:zhtzh312
  1. spark高手之路-内核揭秘

  2. 此阶段主要是通过Spark框架的源码研读来深入Spark内核部分 1.通过源码掌握Spark的任务提交过程 2.通过源码掌握spark集群的任务调度; 3.尤其要精通DAGScheduler,TaskScheduler和worker节点内部的工作的每一步的细节;
  3. 所属分类:Java

    • 发布日期:2015-11-06
    • 文件大小:12582912
    • 提供者:zhtzh312
  1. Apache Spark 的设计与实现

  2. 本文主要讨论 Apache Spark 的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析”,因为本文的主要目的不是去解读实现代码,而是尽量有逻辑地,从设计与实现原理的角度,来理解 job 从产生到执行完成的整个过程,进而去理解整个系统。 讨论系统的设计与实现有很多方法,本文选择 问题驱动 的方式,一开始引入问题,然后分问题逐步深入。从一个典型的 job 例子入手,逐渐讨论 job
  3. 所属分类:其它

    • 发布日期:2016-03-07
    • 文件大小:24117248
    • 提供者:u011500720
  1. Learning Spark

  2. Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。
  3. 所属分类:其它

    • 发布日期:2016-04-01
    • 文件大小:7340032
    • 提供者:laowei2011
  1. Spark javaweb框架

  2. Spark是一个可像Node.js的Express那样快速Web框架,它虽然和大数据处理框架Spark同名,但是它是基于Java的,受Ruby的Sinatra框架鼓舞,用于Java的Web快速开发,使用Java 8 Lambda编写。本例是可运行至tomcat等应用服务器上的简单例子,纯java开发,为源码
  3. 所属分类:Web开发

    • 发布日期:2016-04-11
    • 文件大小:1048576
    • 提供者:yedaoling
  1. Flink和Spark比较

  2. 详细介绍了大数据库框架spark和flink的区别
  3. 所属分类:群集服务

    • 发布日期:2016-06-20
    • 文件大小:362496
    • 提供者:shishi6146
  1. Spark 展望&应用开发 - 亚马逊AWS首席云计算技术顾问 - 费良宏

  2. Spark 这个诞生了7年的开源框架已经成为了今天大数据市场上最炙手可热的词汇。而即将到来的Spark 2.0 将会成为这个项目的一个重大的里程碑。也许你会感兴趣新的版本中那些激动人心的特性:DataFrame、SparkR、StreamingML 以及Dataset API,那么我将在这个议题里面与你一同展望。此外,作为开发者的你或许希望可以了解围绕Spark 应用开发的一切。 我将以Python 为例, 聊一聊如何Spark 引擎开发诸如实时数据流或者批任务这一类数据密集性应用。
  3. 所属分类:专业指导

    • 发布日期:2016-07-18
    • 文件大小:18874368
    • 提供者:jason5186
  1. Spark大数据案例分析和介绍

  2. hadoop spark parameter server 框架介绍,案例:计算广告、智慧城市、大数据背景下的金融产品定价
  3. 所属分类:Web开发

    • 发布日期:2016-11-24
    • 文件大小:39845888
    • 提供者:nndhyp
« 1 23 4 5 6 7 8 9 10 ... 27 »