您好,欢迎光临本网站![请登录][注册会员]  

大数据下载,Hadoop下载列表 第46页

« 1 2 ... 41 42 43 44 45 4647 48 49 50 51 ... 465 »

[Hadoop] Apache Hadoop---Chukwa.docx

说明:Apache 的开源项目 hadoop, 作为一个分布式存储和计算系统,已经被业界广泛应用。很多大型企业都有了各自基于 hadoop 的应用和相关扩展。当 1000+ 以上个节点的 hadoop 集群变得常见时,集群自身的相关信息如何收集和分析呢?针对这个问题, Apache 同样提出了相应的解决方案,那就是 chukwa。
<qq_31641743> 在 上传 | 大小:101376

[Hadoop] Apache Hadoop---Crunch.docx

说明:Apache Crunch 是基于 FlumeJava 实现的,它是一个基于 MapReduce 的数据管道库。Apache Crunch是一个 Java 类库,它用于简化 MapReduce 作业的编写和执行,并且可以用于简化连接和数据聚合任务API的Java类库。与 Pig 和 Hive 一样,Crunch 是为了降低 MapReduce 的入门成本。它们的区别是:Pig 是一个基于管道的框架,而 Crunch 则是一个 Java 库,它提供比 Pig 更高级别的灵活性。
<qq_31641743> 在 上传 | 大小:19456

[Hadoop] Apache Hadoop---Elasticsearch.docx

说明:Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines
<qq_31641743> 在 上传 | 大小:442368

[Hadoop] Apache Hadoop---Falcon.docx

说明:Apache Falcon是一个开源的hadoop数据生命周期管理框架, 它提供了数据源 (Feed) 的管理服务,如生命周期管理,备份,存档到云等,通过Web UI可以很容易地配置这些预定义的策略, 能够大大简化hadoop集群的数据流管理. Hortonworks的hadoop发行版HDP中,数据治理包括Falcon和Atlas这两个组件.Atlas主要负责元数据的管理. Falcon主要负责数据生命周期的管理.
<qq_31641743> 在 上传 | 大小:284672

[Hadoop] Apache Hadoop---Flume.docx

说明:Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
<qq_31641743> 在 上传 | 大小:358400

[Hadoop] 开源Ceph10.2.1源码分析.docx

说明:Ceph作为一个开源的分布式存储系统,人人都可以免费获得其源代码,并能够安装部署,但是并不等于人人都能用起来,人人都能用好。用好一个开源分布式存储系统,首先要对其架构、功能原理等方面有比较好的了解,其次要有修复漏洞的能力。这些都是在采用开源分布式存储系统时所面临的挑战。 第1章 Ceph整体架构 1.1 Ceph的发展历程 1.2 Ceph的设计目标 1.3 Ceph基本架构图 1.4 Ceph客户端接口 1.4.1 RBD 1.4.2 CephFS 1.4.3 RadosGW 1.5 RADO
<dqflying> 在 上传 | 大小:5242880

[Hadoop] hadoop-2.4.rar

说明:Hadoop是存储海量数据和分析海量数据的工具。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
<m0_37980851> 在 上传 | 大小:9437184

[Hadoop] clickhouse-jdbc-0.2.4.jar

说明:clickhouse-jdbc-0.2.4.jar是clickhouse官方提供的最新版clickhouse驱动包,版本是0.2.4,欢迎下载。
<songyafei123> 在 上传 | 大小:211968

[Hadoop] Hadoop 2.10.0中文版API - 徐海蛟博士.CHM

说明:本资料是Hadoop大数据Java开发API中文版,互联网+大数据AI程序猿必备资料。徐海蛟老师的教学资料。Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。Hadoop实现了一个分布式文件系统,Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。
<helloabc99> 在 上传 | 大小:6291456

[Hadoop] HDFS体系架构汉化文档.pdf

说明:Hadoop分布式文件系统( HDFS )是一种旨在在商品硬件上运行的分布式文系统。它与现有的分布式文件系统许多相似之处。 但是,与其他分布式文件系统的区别很明显。 HDFS 具有高度的容错能力,旨在部署低成本硬件上。 具有高度的容错能力,旨在部署低成本硬件上。 具有高度的容错能力,旨在部署低成本硬件上。HDFS 放宽了一些 POSIX要求,以实现对文件系统数据的流式访问。 HDFS最初是作为 Apache Nutch Web搜索引擎项目的基础结构而构建的。 HDFS是 Apache Hadoo
<LUC_QI> 在 上传 | 大小:500736

[Hadoop] Apache Hadoop---Oozie.docx

说明:Oozie由Cloudera公司贡献给Apache的基于工作流引擎的开源框架,是用于Hadoop平台的开源的工作流调度引擎,是用来管理Hadoop作业,属于web应用程序,由Oozie client和Oozie Server两个组件构成,Oozie Server运行于Java Servlet容器(Tomcat)中的web程序。
<qq_31641743> 在 上传 | 大小:1048576

[Hadoop] Apache Hadoop---Phoenix.docx

说明:Phoenix最早是saleforce的一个开源项目,后来成为Apache基金的顶级项目。Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs而不是HBase客户端APIs来创建表,插入数据和对HBase数据进行查询。Phoenix本质其实是用Java写的基于JDBC API操作HBase的开源SQL引擎。
<qq_31641743> 在 上传 | 大小:463872
« 1 2 ... 41 42 43 44 45 4647 48 49 50 51 ... 465 »