您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 自己动手做大数据系统.azw3

  2. 目前很多想学习或正在学习大数据的人,大都面临一些问题或困惑,本书的第一个特点就是系统性,覆盖了如何利用爬虫、Sqoop等获取各种数据,如何利用HDFS、HBase等存储大数据,如何利用MapReduce、Hive、Pig、Python、Spark等技术来处理大数据,如何利用Spark及R分析展示大数据整个过程,而且这些过程我们都可以以实战项目的方式在云平台上完成,这又体现出本书的第二个特点,即操作的便捷性。 如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异
  3. 所属分类:Hadoop

    • 发布日期:2018-09-05
    • 文件大小:19mb
    • 提供者:u011669700
  1. 自己动手做大数据系统

  2. 本书从 OpenStack云平台搭建、软件部署、需求开发实现到结果展示,以纵向 角度讲解了生产性大数据项目上线的整个流程;以完成一个实际项目需 求贯穿各章节,讲述了Hadoop生态圈中互联网爬虫技术、Sqoop、 Hive、HBase组件协同工作流程,并展示了Spark计算框架、R制图软件 和SparkRHive组件的使用方法。本书的一大特色是提供了实际操作环 境,用户可以在线登录云平台来动手操作书中的数据和代码,登录网址 请参考http://www.feiguyun.com/support。
  3. 所属分类:Hadoop

    • 发布日期:2018-09-27
    • 文件大小:18mb
    • 提供者:baidu_22898855
  1. 深入理解hadoop

  2. 详细描述了hadoop生态圈组件,还涉及到分布式理论的基本知识
  3. 所属分类:Hadoop

    • 发布日期:2018-10-09
    • 文件大小:52mb
    • 提供者:qq_39126079
  1. Hadoop操作命令

  2. 本文档是关于大数据hadoop生态圈中hdfs组件的一些常用操作命令详解和使用方法
  3. 所属分类:Hadoop

    • 发布日期:2018-11-21
    • 文件大小:17kb
    • 提供者:qq_16589203
  1. hadoop数仓资料

  2. hadoop的构建数仓的资料,基本涵盖了大数据相关的生态圈的一些组件的用法,还有CDH的集群的一些常规操作
  3. 所属分类:Hadoop

    • 发布日期:2018-12-17
    • 文件大小:13mb
    • 提供者:flyinthesky111
  1. zookeeper集群部署文档.txt

  2. zookeeper是现在大数据领域不可或缺的组件,它用于Hadoop生态圈多个组件的HA配置,协调各个节点有序进行工作,在这里,我将一步一步教你搭建生产使用的zookeeper集群。
  3. 所属分类:Hadoop

  1. hadoop+Zookeeper工具包.zip

  2. hadooop环境所用的的工具包,是大数据生态圈的组件;另外:Zookeeper是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务,环境所运用到
  3. 所属分类:Hadoop

    • 发布日期:2020-04-04
    • 文件大小:204mb
    • 提供者:weixin_39868387
  1. Ambari 开源软件.doc

  2. Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目。目前最新的发布版本是 2.0.1,未来不久将发布 2.1 版本。就 Ambari 的作用来说,就是创建、管理、监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。用一句话来说,Ambari 就是为了让 Hadoop 以及相
  3. 所属分类:Hadoop

    • 发布日期:2020-06-30
    • 文件大小:95kb
    • 提供者:u011913121
  1. 大数据工程师部署.docx

  2. Hadoop生态圈部署 文档包括: Hadoop HA部署 Zookeeper安装 Hive组件部署 Hbase组件部署 Sqoop组件部署 Flume组件部署 spark组件部署 storm组件部署 kafka组件部署 MongoDB部署 可能会出现差错
  3. 所属分类:Linux

  1. 大数据技术原理

  2. HDFS:H是hadoop   分布式文件系统  分布式文件系统。   Hdfs是Hadoop分布式文件系统的简称,它是Hadoop实现的一个分布式文件系统。   纱线:管理资源调度   mycat:中间件   MapReduce的:分布式,并行处理的编译原理           伪分布式:纱和HDFS部署在同一台机器上   组件介绍:     Hadoop的核心组件 HDFS —- Hadoop生态圈的基本组成部分Hadoop分布式文件系统(HDFS).HDFS是数据分析式保存机制,数据被保存
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:142kb
    • 提供者:weixin_38678172
  1. 大数据-源码

  2. 此项目主要是对大数据生态圈组件进行一次系统了解,在每周日进行更新上传,也是针对大数据生态圈所有组件进行一次系统整理,此项目为数据采集及仓库,项目中绝大部分参考尚硅谷b站视频资源。 logcollector模块主要是模拟类别日志数据产生,以作为后续数据来源。生态圈组件简介为介绍大数据生态圈大部分组件,随后会每周更新,同时同步相应组件创建相应模块,模块,文件同时进行。 (由于上周工作上一些原因,导致替换准时提交文件,今天补回来,首先是项目hadoop部署安装部署,相关配置文件会在myhadoop模块
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:11mb
    • 提供者:weixin_42131628
  1. 安全有效地输出价值:大数据是这个游戏的名字

  2. Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况,回顾以前,激励以后。要建立一个大数据系统,我们需要从数据流的源头跟踪到最后有价值的输出,并在现有的Hadoop和大数据生态圈内根据实际需求挑选并整合各部分合适的组件来构建一个能够支撑多种
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:476kb
    • 提供者:weixin_38598745
  1. 安全有效地输出价值:大数据是这个游戏的名字

  2. Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况,回顾以前,激励以后。要建立一个大数据系统,我们需要从数据流的源头跟踪到最后有价值的输出,并在现有的Hadoop和大数据生态圈内根据实际需求挑选并整合各部分合适的组件来构建一个能够支撑多种
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:476kb
    • 提供者:weixin_38622827
  1. hadoop大数据生态圈组件

  2. hadoop大数据组件,包括hadoop,kafka,flume,hbase,hive,zookeeper,spark。可以满足基本使用需求。
  3. 所属分类:互联网

    • 发布日期:2021-01-20
    • 文件大小:834mb
    • 提供者:qq_36187564
  1. 拥抱大数据——初识Hadoop,轻松应对海量数据存储与分析所带来的挑战

  2. 目录 一、前言:什么是Hadoop? 二、Hadoop生态圈 2.1 Hadoop2.x的生态系统 2.2 Hadoop2.x各个组件 2.3 大数据与云计算 三、HDFS(分布式文件系统) 3.1 hdfs架构 3.2 hdfs存储 四、MapReduce(分布式计算框架) 4.1 Map+Reduce 4.2 MapReduce架构 4.3 MapReduce数据处理 4.3.1 job与task 4.3.2 MapReduce数据处理 五、YARN(资源管理系统) 5.1 YARN架构 六
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:888kb
    • 提供者:weixin_38649838