您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第154页

« 1 2 ... .49 .50 .51 .52 .53 154.55 .56 .57 .58 .59 ... 1438 »

[kafka] 基于JAVA API方式使用Kafka——编写生产者客户端.docx

说明:基于JAVA API方式使用Kafka——编写生产者客户端 记录我的学习之旅,每份文档倾心倾力,带我成我大牛,回头观望满脸笑意,望大家多多给予意见,有问题或错误,请联系 我将及时改正;借鉴文章标明出处,谢谢
<fy_1852003327> 在 上传 | 大小:893952

[算法与数据结构] 如何从0到1构建用户画像系统.pdf

说明:维度建模理论的开篇之作,详细说明维度建模的申论,并附带有各个行业的具体实施案例,在实际工作中建设用户画像体系必备的理论储备
<u010634809> 在 上传 | 大小:4194304

[Hadoop] HDFS体系架构汉化文档.pdf

说明:Hadoop分布式文件系统( HDFS )是一种旨在在商品硬件上运行的分布式文系统。它与现有的分布式文件系统许多相似之处。 但是,与其他分布式文件系统的区别很明显。 HDFS 具有高度的容错能力,旨在部署低成本硬件上。 具有高度的容错能力,旨在部署低成本硬件上。 具有高度的容错能力,旨在部署低成本硬件上。HDFS 放宽了一些 POSIX要求,以实现对文件系统数据的流式访问。 HDFS最初是作为 Apache Nutch Web搜索引擎项目的基础结构而构建的。 HDFS是 Apache Hadoo
<LUC_QI> 在 上传 | 大小:500736

[Hive] Apache Hadoop---Hive.docx

说明:Hive是Hadoop中的一个重要子项目,最早由Facebook设计,是建立在Hadoop基础上的数据仓库架构,它为数据仓库的管理提供了许多功能,包括:数据ETL(抽取、转换和加载)工具、数据存储管理和大型数据集的查询和分析能力。Hive提供的是一种结构化数据的机制,定义了类似于传统关系数据库中的类SQL语言:HiveQL,通过该查询语言,数据分析人员可以很方便地运行数据分析业务(将SQL转化为MapReduce任务在Hadoop上执行)。
<qq_31641743> 在 上传 | 大小:133120

[Hadoop] Apache Hadoop---Oozie.docx

说明:Oozie由Cloudera公司贡献给Apache的基于工作流引擎的开源框架,是用于Hadoop平台的开源的工作流调度引擎,是用来管理Hadoop作业,属于web应用程序,由Oozie client和Oozie Server两个组件构成,Oozie Server运行于Java Servlet容器(Tomcat)中的web程序。
<qq_31641743> 在 上传 | 大小:1048576

[Hadoop] Apache Hadoop---Phoenix.docx

说明:Phoenix最早是saleforce的一个开源项目,后来成为Apache基金的顶级项目。Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs而不是HBase客户端APIs来创建表,插入数据和对HBase数据进行查询。Phoenix本质其实是用Java写的基于JDBC API操作HBase的开源SQL引擎。
<qq_31641743> 在 上传 | 大小:463872

[Hadoop] Apache Hadoop---Pig.docx

说明:Pig运行在Hadoop上,是对大型数据集进行分析和评估的平台。它简化了使用Hadoop进行数据分析的要求,提供了一个高层次的、面向领域的抽象语言:PigLatin。通过PigLatin,数据工程师可以将复杂且相互关联的数据分析任务编码为Pig操作上的数据流脚本,通过将该脚本转换为MapReduce任务链,在Hadoop上执行。和Hive一样,Pig降低了对大型数据集进行分析和评估的门槛。
<qq_31641743> 在 上传 | 大小:31744

[Hadoop] Apache Hadoop---Ranger.docx

说明:Apache Ranger提供一个集中式安全管理框架, 并解决授权和审计。它可以对Hadoop生态的组件如HDFS、Yarn、Hive、Hbase等进行细粒度的数据访问控制。通过操作Ranger控制台,管理员可以轻松的通过配置策略来控制用户访问权限。
<qq_31641743> 在 上传 | 大小:200704

[Hadoop] Apache Hadoop---Sentry.docx

说明:Apache Sentry是Cloudera公司发布的一个Hadoop开源组件,截止目前还是Apache的孵化项目,它提供了细粒度级、基于角色的授权以及多租户的管理模式。Sentry当前可以和Hive/Hcatalog、Apache Solr 和Cloudera Impala集成,未来会扩展到其他的Hadoop组件,例如HDFS和HBase。
<qq_31641743> 在 上传 | 大小:211968

[Hadoop] Apache Hadoop---Solr.docx

说明:Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
<qq_31641743> 在 上传 | 大小:611328

[spark] Apache Hadoop---Spark.docx

说明:Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UCBerkeleyAMPlab(加州大学伯克利分校的AMP实验室)所开源的类HadoopMapReduce的通用并行框架,Spark,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark是一种与Hadoop相似的开源集群计算环境,但是两者之
<qq_31641743> 在 上传 | 大小:507904

[Hadoop] Apache Hadoop---Sqoop.docx

说明:Sqoop是SQL-to-Hadoop的缩写,是Hadoop的周边工具,它的主要作用是在结构化数据存储与Hadoop之间进行数据交换。Sqoop可以将一个关系型数据库(例如MySQL、Oracle、PostgreSQL等)中的数据导入Hadoop的HDFS、Hive中,也可以将HDFS、Hive中的数据导入关系型数据库中。Sqoop充分利用了Hadoop的优点,整个数据导入导出过程都是用MapReduce实现并行化,同时,该过程中的大部分步骤自动执行,非常方便。
<qq_31641743> 在 上传 | 大小:1048576
« 1 2 ... .49 .50 .51 .52 .53 154.55 .56 .57 .58 .59 ... 1438 »