您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. switch security.rar

  2. 二层安全: 一、MAC layer attacks 攻击方法: 1、MAC地址flooding攻击 2、MAC地址的欺骗攻击 解决方案: 1、基于源MAC地址允许流量:端口安全 2、基于源MAC地址限制流量:static CAM 3、阻止未知的单/组播帧 4、802.1x基于端口的认证 二、VLAN attacks 解决方案: 1、switch mode access 2、VACL 3、PVLAN 三、spoof attacks 1、DHCP spoof 解决方案:DHCP snooping
  3. 所属分类:网络基础

    • 发布日期:2012-07-25
    • 文件大小:15360
    • 提供者:a83992713
  1. Chapter8-厦门大学-林子雨-大数据技术原理与应用-第八章-流计算(新)

  2. 首先介绍流计算的基本概念和需求,分析了MapReduce框架为何不适合处理流数据;然后,阐述了流计算的处理流程和可应用的场景;接着介绍了流计算框架Storm的设计思想和架构设计;最后,通过实例来加深对Storm框架的了解
  3. 所属分类:讲义

    • 发布日期:2015-06-29
    • 文件大小:3145728
    • 提供者:qq97294972
  1. 开源力量——数据挖掘原理与实战

  2. 整套大数据课程从hadoop入门开始,由浅入深,内置“hadoop源码解析与企业应用开发实战”,“Hive开发实战”,“Hbase开发实战”,“Spark,mahout,sqoop,storm诸模块开发实战”,“数据挖掘基础。这个系列课程有几个板块组成,所以学员可以按照自己的实际情况选择学习。例如,对于只需要了解hadoop基本编程的人,只需要选择“hadoop源码解析与企业应用开发实战”模块就可以了;对于立志于从事大数据领域的零起点人员,可以选择四个板块依次学习;对于已经有一定基础的hado
  3. 所属分类:Java

  1. 厦门大学-林子雨-大数据技术原理与应用-上机练习-大数据技术与流量分析-流量异常检测

  2. 首先介绍流计算的基本概念和需求,分析了MapReduce框架为何不适合处理流数据;然后,阐述了流计算的处理流程和可应用的场景;接着介绍了流计算框架Storm的设计思想和架构设计;最后,通过实例来加深对Storm框架的了解
  3. 所属分类:专业指导

    • 发布日期:2016-01-21
    • 文件大小:1048576
    • 提供者:qq97294972
  1. Chapter8-厦门大学-林子雨-大数据技术原理与应用-章-流计算(2016年1月29日版本)

  2. 首先介绍流计算的基本概念和需求,分析了MapReduce框架为何不适合处理流数据;然后,阐述了流计算的处理流程和可应用的场景;接着介绍了流计算框架Storm的设计思想和架构设计;最后,通过实例来加深对Storm框架的了解
  3. 所属分类:讲义

    • 发布日期:2016-03-13
    • 文件大小:3145728
    • 提供者:qq97294972
  1. Storm笔记-PPT

  2. 详细介绍storm的概念 起源 架构 组件 原理已经应用场景描述
  3. 所属分类:Storm

    • 发布日期:2019-04-26
    • 文件大小:17825792
    • 提供者:cac2020
  1. Hadoop技术内幕深入解析YARN架构设计与实现原理

  2. 资源名称:Hadoop技术内幕深入解析YARN架构设计与实现原理内容简介:本书从应用角度系统讲解了YARN的基本库和组件用法、应用程序设计方法、YARN上流行的各种计算框架(MapReduce、Tez、Storm、Spark),以及多个类YARN的开源资源管理系统(Corona和Mesos);从源代码角度深入分析YARN的设计理念与基本架构、各个组件的实现原理,以及各种计算框架的实现细节。全书共四 资源太大,传百度网盘了,链接在附件中,有需要的同学自取。
  3. 所属分类:其它

  1. Spark工作原理

  2. ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势:1.运行速度快,Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是HadoopMapReduce的10倍以上,如果数据从内存中读取,速度可以高达100多倍。2.适用场景广泛,
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:1048576
    • 提供者:weixin_38624628
  1. ApacheFlink:特性、概念、组件栈、架构及原理分析

  2. ApacheFlink是一个面向分布式数据流处理和批量数据处理的开源计算平台,它能够基于同一个Flink运行时(FlinkRuntime),提供支持流处理和批处理两种类型应用的功能。现有的开源计算方案,会把流处理和批处理作为两种不同的应用类型,因为他们它们所提供的SLA是完全不相同的:流处理一般需要支持低延迟、Exactly-once保证,而批处理需要支持高吞吐、高效处理,所以在实现的时候通常是分别给出两套实现方法,或者通过一个独立的开源框架来实现其中每一种处理方案。例如,实现批处理的开源方案有
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:745472
    • 提供者:weixin_38627826
  1. Spark基本架构及原理

  2. ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势:Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求官方资料介绍Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚至
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:842752
    • 提供者:weixin_38712416
  1. flink开发实战之flink原理解析

  2. 我们知道目前流处理的主要流行的计算引擎有,Storm,SparkStreaming。但是这个两个计算引擎都有自己的局限性。Storm实现了低延迟,但是目前还没有实现高吞吐,也不能在故障发生的时候准确的处理计算状态(将数据从一个事件保存到另一个事件的,这些保留下来的是数据较计算状态),同时也不能实现exactly-once。SparkStreaming通过微批处理方法实现了高吞吐和容错性,但是牺牲了低延迟和实时处理的能力,也不能使用窗口与自然时间相匹配。Flink的出现完美的解决了以上问题,这也是
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:293888
    • 提供者:weixin_38725137
  1. 一文详解Spark基本架构原理

  2. 本文来自于简书,ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。文章主要通过八个方面全面介绍了spark的架构原理,更多内容请看全文。ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势:Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:804864
    • 提供者:weixin_38673812
  1. kafka架构原理

  2. Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。2.1解耦允许你独立的扩展或修改两边的处理过
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:267264
    • 提供者:weixin_38499503
  1. ApacheRanger原理与应用实践

  2. 大数据集群最基本的就是数据以及用于计算的资源,是一个公司的宝贵财富,我们需要将它们很好管理起来,将相应的数据和资源开放给对应的用户使用,防止被窃取、被破坏等,这就涉及到大数据安全。目前我们大数据集群的现状是处于裸奔状态,只要可以登录linux机器即可对集群继续相关操作所以集群安全对于我们来说迫在眉睫,主要需求有以下几个方面:支持多组件,最好能支持当前公司技术栈的主要组件,HDFS、HBASE、HIVE、YARN、STORM、KAFKA等支持细粒度的权限控制,可以达到HIVE列,HDFS目录,HB
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:350208
    • 提供者:weixin_38686267
  1. 消息队列Kafka高可靠性原理深度解读

  2. Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark等都支持与Kafka集成。Kafka凭借着自身的优势,越来越受到互联网企业的青睐,唯品会也采用Kafka作为其内部核心消息引擎之一。Kafka作为一个商业级消息中间件,消息可靠性的重要性可想而知。如何确保消息的精确传输?如何确保消息的准确存储?如何确保消息的正
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:523264
    • 提供者:weixin_38648037
  1. Spark基本架构及原理

  2. ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势:Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求 官方资料介绍Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:842752
    • 提供者:weixin_38748556
  1. flink开发实战之flink原理解析

  2. 我们知道目前流处理的主要流行的计算引擎有,Storm,SparkStreaming。但是这个两个计算引擎都有自己的局限性。Storm实现了低延迟,但是目前还没有实现高吞吐,也不能在故障发生的时候准确的处理计算状态(将数据从一个事件保存到另一个事件的,这些保留下来的是数据较计算状态),同时也不能实现exactly-once。SparkStreaming通过微批处理方法实现了高吞吐和容错性,但是牺牲了低延迟和实时处理的能力,也不能使用窗口与自然时间相匹配。Flink的出现完美的解决了以上问题,这也是
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:283648
    • 提供者:weixin_38691256
  1. Spark工作原理

  2. ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势: 1.运行速度快,Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是Hadoop MapReduce的10倍以上,如果数据从内存中读取,速度可以高达100
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:1048576
    • 提供者:weixin_38608055
  1. 一文详解Spark基本架构原理

  2. 本文来自于简书,Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。文章主要通过八个方面全面介绍了spark的架构原理,更多内容请看全文。ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势:Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:804864
    • 提供者:weixin_38507121
  1. kafka架构原理

  2. Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Linkedin于2010年贡献给了Apache基金会并成为顶级开源 项目。2.1解耦允许你独立的扩展或修改两边的处理
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:267264
    • 提供者:weixin_38570296
« 1 23 4 »