您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第1266页

« 1 2 ... .61 .62 .63 .64 .65 1266.67 .68 .69 .70 .71 ... 1438 »

[spark] 使用sparkR和sparklyr进行大数据建模案例文档

说明: 使用sparkR和sparklyr进行大数据建模案例文档,其中包括了对飞机航班、出租车等数据的建模分析与可视化,具有非常好的参考意义。数据和源码可以通过文档中的链接很方便的下载。
<yepeng2007fei> 在 上传 | 大小:13631488

[Hadoop] ZooKeeper-分布式过程协同技术详解

说明: ZooKeeper-分布式过程协同技术详解 Pdf 383页 完整高清版
<niousogntao> 在 上传 | 大小:4194304

[Hadoop] Druid实时大数据分析原理

说明: Druid是一个用于大数据实时查询和分析的高容错、高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。尤其是当发生代码部署、机器故障以及其他产品系统遇到宕机等情况时,Druid仍能够保持100%正常运行。创建Druid的最初意图主要是为了解决查询延迟问题,当时试图使用Hadoop来实现交互式查询分析,但是很难满足实时分析的需要。而Druid提供了以交互方式访问数据的能力,并权衡了查询的灵活性和性能而采取了特殊的存储格式。
<ghostlucas> 在 上传 | 大小:34603008

[Hadoop] lab38综合实战-搜索引擎

说明: 《大数据实验手册》实验38-综合实战-搜索引擎 包含CreateIndex和Demo
<e15273> 在 上传 | 大小:332800

[Hadoop] KETTLE学习指导文档

说明: KETTLE学习指导文档 教你如何使用spoon进行ETL数据清洗
<vip923803855> 在 上传 | 大小:2097152

[kafka] Kafka_The Definitive Guide_Real-Time Data and Stream Processing at Scale

说明: Kafka_The Definitive Guide_Real-Time Data and Stream Processing at Scale, 2017年新书,值得一看,欢迎下载!
<qq_22973943> 在 上传 | 大小:4194304

[spark] spark-第一个spark程序worldCount

说明: spark-第一个spark程序worldCount,spark-第一个spark程序worldCount
<sh20104510> 在 上传 | 大小:2048

[Hive] CDH550@hive存储格式和HQL材料

说明: CDH550下的hive的存储格式介绍和HQL的详细说明。一般数据存储模式主要有三种,1)行存储;2)列存储;3)混合存储。 1)行存储模式就是:把一整行存在一起,包含所有的列,这是最常见的模式。这种结构能很好的适应动态的查询
<zdz131148> 在 上传 | 大小:1048576

[Hive] CDH550@hive安装部署

说明: cdh5.5.0下的hive的安装部署详细操作。hive的安装其实有两部分组成,一个是Server端、一个是客户端,所谓服务端其实就是Hive管理Meta的那个Hive,服务端可以装在任何节点上,当hive服务并发量不高时推荐部署在数据节点上,并发量高时推荐单独部署在若干台机器
<zdz131148> 在 上传 | 大小:91136

[Hive] CDH550@hive 使用及操作说明

说明: cdh5.5.0下的hive的使用和操作介绍。hive作为数据SQL解析引擎,分析、处理数据;Hadoop提供的分布式文件系统(HDFS)作为数据文件的存储介质;Zookeeper作为分布式协调服务器存在,用于管理集群中各节点状态
<zdz131148> 在 上传 | 大小:232448

[Hadoop] hadoop 伪分布式环境配置

说明: hadoop伪分布式环境配置教程 已亲测,按步骤执行,完胜!且有详细的原理解释
<sinat_33057743> 在 上传 | 大小:174080

[Hadoop] 基于mapreduce的并行算法的设计 课件

说明: 一份基于mapreduce的并行算法的设计的课件,介绍了算法的原理以及几种实现
<qq_30395513> 在 上传 | 大小:892928
« 1 2 ... .61 .62 .63 .64 .65 1266.67 .68 .69 .70 .71 ... 1438 »