您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第1241页

« 1 2 ... .36 .37 .38 .39 .40 1241.42 .43 .44 .45 .46 ... 1412 »

[算法与数据结构] 08-17年暗数据高质量论文

说明: 暗数据是大数据中的“垃圾”资源。但是垃圾只是放错位置的资源。如何管理暗数据将在未来必然得到关注
<lightyear416> 上传 | 大小:4mb

[Hadoop] 大数据分析与挖掘

说明: 数据为王”的时代,大数据将带来一次全新的革命,将改变众多企业的命运。在大数据时代的背景下,R语言作为一种迅速兴起的数据挖掘和可视化工具软件,由于其功能强大、简洁易用,正越来越多的成为数据挖掘项目的实施基础。在数据挖掘和可视化的教学中,如果缺少相应的实际训练,是很难掌握好工具和理论的。本课程理论联系实际,通过具体案例贯穿所有的理论知识。针对游戏、医疗、汽车行业等不同领域应用问题,介绍数据挖掘及可视化的各个技术细节,通过实际的案例演练,让学员真正体验数据挖掘及可视化的强大魅力
<cjw13860421089> 上传 | 大小:5mb

[spark] 使用sparkR和sparklyr进行大数据建模案例文档

说明: 使用sparkR和sparklyr进行大数据建模案例文档,其中包括了对飞机航班、出租车等数据的建模分析与可视化,具有非常好的参考意义。数据和源码可以通过文档中的链接很方便的下载。
<yepeng2007fei> 上传 | 大小:13mb

[Hadoop] ZooKeeper-分布式过程协同技术详解

说明: ZooKeeper-分布式过程协同技术详解 Pdf 383页 完整高清版
<niousogntao> 上传 | 大小:4mb

[Hadoop] Druid实时大数据分析原理

说明: Druid是一个用于大数据实时查询和分析的高容错、高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。尤其是当发生代码部署、机器故障以及其他产品系统遇到宕机等情况时,Druid仍能够保持100%正常运行。创建Druid的最初意图主要是为了解决查询延迟问题,当时试图使用Hadoop来实现交互式查询分析,但是很难满足实时分析的需要。而Druid提供了以交互方式访问数据的能力,并权衡了查询的灵活性和性能而采取了特殊的存储格式。
<ghostlucas> 上传 | 大小:33mb

[Hadoop] lab38综合实战-搜索引擎

说明: 《大数据实验手册》实验38-综合实战-搜索引擎 包含CreateIndex和Demo
<e15273> 上传 | 大小:325kb

[Hadoop] KETTLE学习指导文档

说明: KETTLE学习指导文档 教你如何使用spoon进行ETL数据清洗
<vip923803855> 上传 | 大小:2mb

[kafka] Kafka_The Definitive Guide_Real-Time Data and Stream Processing at Scale

说明: Kafka_The Definitive Guide_Real-Time Data and Stream Processing at Scale, 2017年新书,值得一看,欢迎下载!
<qq_22973943> 上传 | 大小:4mb

[spark] spark-第一个spark程序worldCount

说明: spark-第一个spark程序worldCount,spark-第一个spark程序worldCount
<sh20104510> 上传 | 大小:2kb

[Hive] CDH550@hive存储格式和HQL材料

说明: CDH550下的hive的存储格式介绍和HQL的详细说明。一般数据存储模式主要有三种,1)行存储;2)列存储;3)混合存储。 1)行存储模式就是:把一整行存在一起,包含所有的列,这是最常见的模式。这种结构能很好的适应动态的查询
<zdz131148> 上传 | 大小:1mb

[Hive] CDH550@hive安装部署

说明: cdh5.5.0下的hive的安装部署详细操作。hive的安装其实有两部分组成,一个是Server端、一个是客户端,所谓服务端其实就是Hive管理Meta的那个Hive,服务端可以装在任何节点上,当hive服务并发量不高时推荐部署在数据节点上,并发量高时推荐单独部署在若干台机器
<zdz131148> 上传 | 大小:89kb

[Hive] CDH550@hive 使用及操作说明

说明: cdh5.5.0下的hive的使用和操作介绍。hive作为数据SQL解析引擎,分析、处理数据;Hadoop提供的分布式文件系统(HDFS)作为数据文件的存储介质;Zookeeper作为分布式协调服务器存在,用于管理集群中各节点状态
<zdz131148> 上传 | 大小:227kb
« 1 2 ... .36 .37 .38 .39 .40 1241.42 .43 .44 .45 .46 ... 1412 »