您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Spark 入门实战系列

  2. Spark 入门实战系列,适合初学者,文档包括十部分内容,质量很好,为了感谢文档作者,也为了帮助更多的人入门,传播作者的心血,特此友情转贴: 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.
  3. 所属分类:spark

    • 发布日期:2018-01-18
    • 文件大小:32mb
    • 提供者:zy205
  1. Spark Streaming的系统架构

  2. 本节首先分析传统流处理系统架构存在的问题,然后介绍 Spark Streaming 的系统架构及其工作原理和优势。 传统流处理系统架构 流处理架构的分布式流处理管道执行方式是,首先用数据采集系统接收来自数据源的流数据,然后在集群上并行处理数据,最后将处理结果存放至下游系统。 为了处理这些数据,传统的流处理系统被设计为连续算子模型,其工作方式如图 1 所示。 系统包含一系列的工作结点,每组结点上运行一至多个连续算子。对于流数据,每个连续算子(ContinuousOperator)一次处理一条记录
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:336kb
    • 提供者:weixin_38655011
  1. Spark技术解析及在百度开放云BMR应用实践

  2. 2015年1月10日,一场基于Spark的高性能应用实践盛宴由Databricks软件工程师连城、百度高级工程师甄鹏、百度架构师孙垚光、百度美国研发中心高级架构师刘少山四位专家联手打造。2014年,Spark开源生态系统得到了大幅增长,已成为大数据领域最人气的开源项目之一,活跃在Hortonworks、IBM、Cloudera、MapR和Pivotal等众多知名大数据公司,更拥有SparkSQL、SparkStreaming、MLlib、GraphX等多个相关项目。同时值得一提的是,Spark贡
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:740kb
    • 提供者:weixin_38672794
  1. 深入理解SparkStreaming执行模型

  2. SparkStreaming是Spark中最常用的组件之一,将会有越来越多的有流处理需求的用户踏上Spark的使用之路。本文描述了SparkStreaming的架构并解释如何去提供上述优势,以及一些目前进行的令大家感兴趣的相关后续工作。正如市面上存在众多可用的流处理引擎,人们经常询问我们SparkStreaming有何独特的优势?那么首先要说的就是ApacheSpark在批处理以及流处理上提供了原生支持。这与别的系统不同之处在于其他系统的处理引擎要么只专注于流处理,要么只负责批处理且仅提供需要外
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:320kb
    • 提供者:weixin_38653602
  1. Flink完美搭档:数据存储层上的Pravega

  2. 本文将从大数据架构变迁历史,Pravega简介,Pravega进阶特性以及车联网使用场景这四个方面介绍Pravega,重点介绍DellEMC为何要研发Pravega,Pravega解决了大数据处理平台的哪些痛点以及与Flink结合会碰撞出怎样的火花。对于实时处理来说,来自传感器,移动设备或者应用日志的数据通常写入消息队列系统(如Kafka),消息队列负责为流处理应用提供数据的临时缓冲。然后再使用SparkStreaming从Kafka中读取数据做实时的流计算。但由于Kafka不会一直保存历史数据
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:723kb
    • 提供者:weixin_38528086
  1. 深入理解SparkStreaming执行模型

  2. SparkStreaming是Spark中最常用的组件之一,将会有越来越多的有流处理需求的用户踏上Spark的使用之路。本文描述了SparkStreaming的架构并解释如何去提供上述优势,以及一些目前进行的令大家感兴趣的相关后续工作。正如市面上存在众多可用的流处理引擎,人们经常询问我们SparkStreaming有何独特的优势?那么首先要说的就是ApacheSpark在批处理以及流处理上提供了原生支持。这与别的系统不同之处在于其他系统的处理引擎要么只专注于流处理,要么只负责批处理且仅提供需要外
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:320kb
    • 提供者:weixin_38675777
  1. Flink完美搭档:数据存储层上的Pravega

  2. 本文将从大数据架构变迁历史,Pravega简介,Pravega进阶特性以及车联网使用场景这四个方面介绍Pravega,重点介绍DellEMC为何要研发Pravega,Pravega解决了大数据处理平台的哪些痛点以及与Flink结合会碰撞出怎样的火花。对于实时处理来说,来自传感器,移动设备或者应用日志的数据通常写入消息队列系统(如Kafka),消息队列负责为流处理应用提供数据的临时缓冲。然后再使用SparkStreaming从Kafka中读取数据做实时的流计算。但由于Kafka不会一直保存历史数据
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:723kb
    • 提供者:weixin_38593380
  1. Spark技术解析及在百度开放云BMR应用实践

  2. 2015年1月10日,一场基于Spark的高性能应用实践盛宴由Databricks软件工程师连城、百度高级工程师甄鹏、百度架构师孙垚光、百度美国研发中心高级架构师刘少山四位专家联手打造。2014年,Spark开源生态系统得到了大幅增长,已成为大数据领域最人气的开源项目之一,活跃在Hortonworks、IBM、Cloudera、MapR和Pivotal等众多知名大数据公司,更拥有SparkSQL、SparkStreaming、MLlib、GraphX等多个相关项目。同时值得一提的是,Spark贡
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:740kb
    • 提供者:weixin_38560275