您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Hadoop部署脚本

  2. Apache Hadoop软件库是一个框架,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器提供本地计算和存储。该库本身不是依靠硬件来提供高可用性,而是设计用于在应用层检测和处理故障,从而在一组计算机之上提供高可用性服务,每个计算机都可能出现故障。 该项目包括这些模块: Hadoop Common:支持其他Hadoop模块的常用工具。 Hadoop分布式文件系统(HDFS™):一种分布式文件系统,可提供对应用程序数据的高吞吐量访问。 Had
  3. 所属分类:群集服务

    • 发布日期:2018-03-14
    • 文件大小:87kb
    • 提供者:weixin_38367675
  1. 大数据学习资料

  2. hadoop 2.x分为 mapreduce与hdfs与yarn hdfs:高吞吐率的分布式文件系统 yarn:集群资源管理和任务调度框架 mapreduce:基于yarn的对海量数据的并行处理框架
  3. 所属分类:Java

    • 发布日期:2018-07-31
    • 文件大小:163kb
    • 提供者:laughinghoho
  1. 大数技术据培训PPT.pptx

  2. 课时1:大数据技术介绍和RPC框架讲解 课时2:HDFS分布式文件存储系统 课时3:MapReduce计算框架和Yarn资源调度组件 课时4:列式存储数据库HBASE和资源协调组件Zookeeper 课时5:数据仓库HIVE 课时6:流式计算技术架构介绍 课时7:Kafka,Flink,ElasticSearch组件介绍(上) 课时8:Kafka,Flink,ElasticSearch组件介绍(下) 课时9:Spark组件介绍(一) 课时10:Spark组件介绍(二)
  3. 所属分类:flink

    • 发布日期:2020-01-13
    • 文件大小:12mb
    • 提供者:Anxin1984
  1. Kubernetes核心设计与实现-钟成.pdf

  2. Kubernetes核心设计与实现,华为2012实验室编写 • k8s主要解决什么问题? • 架构和设计思路 • 几个核心的机制 • 社区后续发展方向应用架构趋势:分布式、微服务是云原生( Cloud- Native)应用事实标准 传统银行、传统 °亚马逊、 Netflix、 Google、 运营商 facebook、淘宝、百度 蚂蚁金服、微众银行 传统T:粗粒度SOA架构■松耦合、有状态 互联网:分布式微服务 解耦:无状态、功能独立分离的 在大型、超大型企业中 服务组成 仍然流行 互联网公司、
  3. 所属分类:专业指导

    • 发布日期:2019-10-07
    • 文件大小:2mb
    • 提供者:rixingwusheng
  1. Hadoop与Spark 肖睿+PDF

  2. 大数据技术让我们以一种靠前的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,很终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统、Spark Core、Spark SQL、Spark Streaming等知识。本书
  3. 所属分类:其它

    • 发布日期:2019-08-18
    • 文件大小:164mb
    • 提供者:ermaoermao
  1. Ambari 开源软件.doc

  2. Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目。目前最新的发布版本是 2.0.1,未来不久将发布 2.1 版本。就 Ambari 的作用来说,就是创建、管理、监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。用一句话来说,Ambari 就是为了让 Hadoop 以及相
  3. 所属分类:Hadoop

    • 发布日期:2020-06-30
    • 文件大小:95kb
    • 提供者:u011913121
  1. Hadoop面试题(四)——YARN

  2. 1、简述hadoop1与hadoop2 的架构异同   1)加入了yarn解决了资源调度的问题。   2)加入了对zookeeper的支持实现比较可靠的高可用。 2、为什么会产生 yarn,它解决了什么问题,有什么优势?   1)Yarn最主要的功能就是解决运行的用户程序与yarn框架完全解耦。   2)Yarn上可以运行各种类型的分布式运算程序(mapreduce只是其中的一种),比如mapreduce、storm程序,spark程序…… 3、HDFS的数据压缩算法?(☆☆☆☆☆)   Had
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:95kb
    • 提供者:weixin_38609401
  1. Hadoop各组件详解(HDFS篇)

  2. 一、Hadoop三大组件 1.HDFS 分布式文件存储系统 2.MapReduce 分布式离线计算框架 ​3.Yarn Hadoop资源调度器 1.HDFS HDFS的设计特点是: 1、大数据文件,非常适合上T级别的大文件或者一堆大数据文件的存储,如果文件只有几个G甚至更小就没啥意思了 2、文件分块存储,HDFS会将一个完整的大文件平均分块存储到不同计算器上, 它的意义在于读取文件时可以同时从多个主机取不同区块的文件,多主机读取比单主机读取效率要高得多得都。 3、流式数据访问,一次写入多
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:732kb
    • 提供者:weixin_38609693
  1. 分布式资源调度——YARN框架

  2. 本文来自于51cto,ApacheHadoopYARN(YetAnotherResourceNegotiator,另一种资源协调者)是一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度.YARN是Hadoop2.x才有的,所以在介绍YARN之前,我们先看一下MapReduce1.x时所存在的问题:单点故障节点压力大不易扩展MapReduce1.x时的架构如下:分布式资源调度——YARN框架可以看到,1.x时也是Master/Slave这种主从结构,在集
  3. 所属分类:其它

  1. Hadoop大数据平台架构与实践

  2. 可靠的、可扩展的、分布式计算开源软件。ApacheHadoop软件库是一个框架,允许使用简单的编程模型,在计算机集群分布式地处理大型数据集。它可以从单个服务器扩展到数千台机器,每个机器都提供本地计算和存储。每一台计算机都容易出现故障,库本身的目的是检测和处理应用层的故障,因此在一组计算机上提供高可用性服务,而不是依靠硬件来提供高可用性。HadoopDistributedFileSystem(HDFS):一个分布式文件系统,它提供对应用程序数据的高吞吐量访问。HadoopYARN:作业调度和集群资
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:569kb
    • 提供者:weixin_38650629
  1. Hadoop之详解HDFS架构

  2. Hadoop包含三大基本组件:HDFS——分布式文件系统,用于数据存储YARN——统一资源管理和调度系统,用于管理集群的计算资源并根据计算框架的需求进行调度,支持包含MapReduce、Spark、Flink等多种计算框架。MRv2(Hadoop2.x)之后的新特性。MapReduce——分布式计算框架,运行于YARN之上这篇文章主要是对Hadoop三大基本组件之一的HDFS进行深入的学习。随着数据量越来越大,在一一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:546kb
    • 提供者:weixin_38613681
  1. 分布式资源调度——YARN框架

  2. 本文来自于51cto,Apache HadoopYARN(YetAnotherResourceNegotiator,另一种资源协调者)是一种新的 Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度. YARN是Hadoop2.x才有的,所以在介绍YARN之前,我们先看一下MapReduce1.x时所存在的问题:单点故障
  3. 所属分类:其它

  1. Hadoop之详解HDFS架构

  2. Hadoop包含三大基本组件:HDFS——分布式文件系统,用于数据存储YARN——统一资源管理和调度系统,用于管理集群的计算资源并根据计算框架的需求进行调度,支持包含MapReduce、Spark、Flink等多种计算框架。MRv2(Hadoop 2.x)之后的新特性。MapReduce——分布式计算框架,运行于YARN之上这篇文章主要是对Hadoop三大基本组件之一的HDFS进行深入的学习。随着数据量越来越大,在一一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:546kb
    • 提供者:weixin_38653691