您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 王家林的云计算实战:Hadoop大数据处理之生态系统和成功案例(面向CIO、CTO、DBA、架构师等).docx

  2. 王家林的云计算实战:Hadoop大数据处理之生态系统和成功案例(面向CIO、CTO、DBA、架构师等).docx
  3. 所属分类:Android

    • 发布日期:2013-03-21
    • 文件大小:21kb
    • 提供者:up_yfei
  1. Starred_Paper_Hadoop_Spark.docx

  2. 本篇英文论文通过三个具体实例(WordCount Sorted By Key, WordCount Sorted by Values 和 PageRank算法)来对比Hadoop 和 Spark 在大数据应用中运行时间,从而观察这些研究实例随着的迭代计算次数的增加,其时间性能比率的变化和趋势。该课题不仅系统的论述和比较Hadoop和Spark的系统结构、运行原理及各自的生态系统特点,也包括怎样逐步调优系统性能,例如数据压缩类型,内存分配控制,数据分割等手段。实验数据结果表明,由于Spark平台
  3. 所属分类:spark

  1. 01_选择Apache Hadoop.docx

  2. 选择Apache Hadoop 为什么需要Hadoop Hadoop 解决了什么问题 什么是Hadoop 和Hadoop 生态系统
  3. 所属分类:讲义

    • 发布日期:2020-02-24
    • 文件大小:483kb
    • 提供者:weixin_43250197
  1. hbase安装与配置.docx

  2. Linux下,基于Hadoop集群的Zookeeper、Hbase的安装及配置指导文档。 HBase作为Hadoop生态系统的一部分,是基于hadoop集群的HDFS之上的分布式数据库,HDFS为HBase提供了高可靠的底层存储支持和数据的持久化;hadoop集群的Mapreduce为HBase提供了高性能的计算能力;HBase为hadoop集群提供了强大的数据存储和处理能力。
  3. 所属分类:数据库

  1. 实验2 Hadoop基本操作.docx

  2. Hadoop 功能 • 适用于大数据分析 作为大数据在自然界中趋于分布和非结构化,Hadoop 集群最适合于大数据的分析。因为,它处理逻辑(未实际数据)流向计算节点,更少的网络带宽消耗。这个概念被称为数据区域性概念,它可以帮助提高基于 Hadoop 应用程序的效率。 • 可扩展性 HADOOP集群通过增加附加群集节点可以容易地扩展到任何程度,并允许大数据的增长。 另外,标度不要求修改到应用程序逻辑。 • 容错 HADOOP生态系统有一个规定,来复制输入数据到其他群集节点。这样一来,在集群某一节点
  3. 所属分类:平台管理

    • 发布日期:2019-07-27
    • 文件大小:138kb
    • 提供者:xiaotaocisoc
  1. Apache Hadoop---Atlas.docx

  2. Atlas是一组可扩展和可扩展的核心基础治理服务,使企业能够有效,高效地满足Hadoop中的合规性要求,并允许与整个企业数据生态系统集成。 Apache Atlas为组织提供了开放的元数据管理和治理功能,以建立其数据资产的目录,对这些资产进行分类和治理,并为数据科学家,分析师和数据治理团队提供围绕这些数据资产的协作功能。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:224kb
    • 提供者:qq_31641743
  1. HADOOP生态系统.docx

  2. hadoop大数据生态,大数据分布式引擎数据分析,思维导图,知识点总结,快速掌握,包括hadoop spark hive elasticsearch kafka
  3. 所属分类:互联网

    • 发布日期:2020-09-03
    • 文件大小:74kb
    • 提供者:xzpdxz
  1. hadoop大数据知识点及题型.docx

  2. Hadoop作为大数据业务的基础原因: (1)Hadoop底层的分布式文件系统具有高拓展性,通过数据冗余保证数据不丢失和提升计算效率,同时可以存储各种形式的数据,他还有多种计算框架,既可以进行离线计算也可以进行在线实时计算。 (2)Hadoop是架构在廉价的硬件服务器上,且产品是开源的,供开发者免费使用,开发成本和维护成本都降低很多。 (3)Hadoop具有成熟的多生态圈,有许多辅助系统对数据进行处理。 第一章 初识Hadoop 1.什么是大数据? (1)一种规模大到在获取、存储、管理、分析方
  3. 所属分类:Hadoop