您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第251页

« 1 2 ... .46 .47 .48 .49 .50 251.52 .53 .54 .55 .56 ... 1412 »

[spark] 1 DeltaLake-iteblog.pdf

说明:spark delta 官方文档介绍
<sambast> 上传 | 大小:15mb

[spark] Delta-Lake_Michael_Armbrust_BayAreaMeetup-iteblog.pdf

说明:2Making-Apache-Spark-Better-with-Delta-Lake_Michael_Armbrust_BayAreaMeetup-iteblog
<sambast> 上传 | 大小:5mb

[spark] 4Simplify-and-Scale-Data-Engineering-Pipelines-with-Delta-Lake_iteblog.pdf

说明:4Simplify-and-Scale-Data-Engineering-Pipelines-with-Delta-Lake_iteblog
<sambast> 上传 | 大小:4mb

[Hadoop] apache-hadoop-3.1.0-winutils-master.7z

说明:Hadoop3.1.2在Windows上部署时,需要替换的文件,参考博客:https://blog.csdn.net/lianghecai52171314/article/details/103221424
<lianghecai52171314> 上传 | 大小:591kb

[算法与数据结构] douban源码加ppt .zip

说明:豆瓣源码
<qq_41922468> 上传 | 大小:5mb

[算法与数据结构] quantiles.pdf

说明:近似分位数计算的论文原文,Space-Efficient Online Computation of Quantile Summaries。是spark中dataframe的分位数计算的原理
<voidfaceless> 上传 | 大小:249kb

[Hadoop] 1.hadoop完全分布式配置步骤

说明:本人自己整理的hadoop完全分布式步骤,完全行得通。
<weixin_43307695> 上传 | 大小:9kb

[Hbase] hbase维护操作手册.docx

说明:(一)HBase数据库简介 Hbase是apache hadoop的数据库,能够对大数据提供随机、实时的读写访问功能,具有开源、分布式、可扩展以及面向列存储的特点。Hbase是由Chang等人基于Google的bigtable开发而成,其存储逻辑看起来就像一张很大的表,并且它的数据列可以根据需要动态的增加。
<xsfhchang> 上传 | 大小:49kb

[Hadoop] Impala维护操作手册.docx

说明:(一)Impala集群维护简介 PetImpalaabase集群主从节点启动的服务略有不同,其中主节点启动服务主要有: 资源管理 Hadoop服务 Hive服务 Impala zookeeper-server hadoop-hdfs-namenode hive-metastore petabase-state-store hadoop-0.20-mapreduce-jobtracker hive-server2 Impala-catalog hadoop-0
<xsfhchang> 上传 | 大小:202kb

[Hadoop] MapReduce读取单词个数.rar

说明:maven 项目操作MapReduce读取单词案例,运行方式:通过maven 生成jar 包, 上传到hadoop 服务器,通过hadoop jar 生成的jar包 运行,无需上传参数
<l576754326> 上传 | 大小:3kb

[算法与数据结构] SPSS教程+中文使用手册.rar

说明:讲解SPSS各项操作,指导实际项目操作。采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。
<baidu_33297091> 上传 | 大小:34mb

[算法与数据结构] zongshu.rar

说明:几篇聚类综述论文,中文近几年时间,大数据时代的到来促使机器学习技术 飞速发展。聚类分析作为传统机器学习算法中常用方 法之一,由于其实用、简单和高效的特性而广受青睐,它 已成功应用于许多领域,如:文档聚类[1-2]、市场细分[3-4]、 图像分割[5-7]、特征学习[8-9]等。聚类也是数据挖掘中一个 重要的概念[10],其核心是寻找数据对象中隐藏的有价值 的信息。
<qq_43625281> 上传 | 大小:12mb
« 1 2 ... .46 .47 .48 .49 .50 251.52 .53 .54 .55 .56 ... 1412 »