您好,欢迎光临本网站![请登录][注册会员]  

大数据下载,spark下载列表 第25页

« 1 2 ... 20 21 22 23 24 2526 27 28 29 30 ... 202 »

[spark] PeMS部分公共数据集下载

说明:2019年1月1日~2019年3月31日之间,d07区的数据,数据格式为TXT格式。文档为百度文库的分享链接,打开下载即可。
<u010948546> 在 上传 | 大小:67

[spark] 上海二手房价数据.csv

说明:获取整理的2019年10月份上海市各小区二手房价数据带地理坐标,可用于数据分析,学习,地图大数据可视化分析。
<cchenhhang> 在 上传 | 大小:510976

[spark] 数据预处理笔记.pdf

说明:此PDF是个人的学习笔记,一共是100多页,内涵源码,涉及到了数据预处理一些常见的处理。由于个人时间、能力有限,所以笔记做的不是特别的好,还望口下留情
<Jiajikang_jjk> 在 上传 | 大小:6291456

[spark] kylin简介核心概念工作机制

说明:Apache kylin的核心概念 Apache kylin的工作机制 Apache kylin的架构及核心组件 构建cube的维度和度量
<longwenyanlan> 在 上传 | 大小:2097152

[spark] 北京市昌平区poi数据.rar

说明:北京市poi数据下载 传统的地理信息采集方法需要地图测绘人员采用精密的测绘仪器去获取一个兴趣点的经纬度,然后再标记下来。正因为POI的采集是一个非常费时费事的工作,对一个地理信息系统来说,POI的数量在一定程度代表着整个系统的价值。 每个POI包含四方面信息,名称、类别、经度、纬度,全面的POI讯息是丰富导航地图的必备资讯,及时的POI兴趣点能提醒用户路况的分支及周边建筑的详尽信息,也能方便导航中查到你所需要的各个地方,选择最为便捷和通畅的道路来进行路径规划,因此,导航地图POI多少
<friendl> 在 上传 | 大小:794624

[spark] 系统架构师.docx

说明:系统架构师系统架构设计师是一个最终确认和评估系统需求,给出开发规范,搭建系统实现的核心构架,并澄清技术细节、扫清主要难点的技术人员。 系统架构设计师考试合格人员能够根据...
<q543539666> 在 上传 | 大小:13312

[spark] 亚马逊商品数据.xls

说明:大数据数据集,用于数据挖掘和大数据练习用的数据集,这个使亚马逊网站的商品数据。适用于初学者学习数据挖掘作为数据源用。
<sunlightluo> 在 上传 | 大小:614400

[spark] 001ec949ff42134ee74106.jpg

说明:用来做图像识别的素材,情感分析和颜色分析的时候使用,用来做图像识别的素材,情感分析和颜色分析的时候使用。用来做图像识别的素材,情感分析和颜色分析的时候使用
<liangyichen01> 在 上传 | 大小:74752

[spark] Spark SQL源码概览.pdf

说明:Spark SQL 包含 3 个子项目:Core、Catalyst、Hive。其中 Catalyst 是核心的查询优化引 擎,独立于 Spark 平台;Spark SQL Core 封装 Catalyst,向应用程序提供 SparkSession、Dataset、 DataFrame 等 API(DataFrame 是 Dataset[Row]的别名);Spark SQL Hive 则提供操作 Hive 的 接口。本文主要关注查询执行过程,不涉及 Hive。
<godmayknow> 在 上传 | 大小:376832

[spark] UCI数据集(多种格式).zip

说明:UCI数据集是一个常用的机器学习标准测试数据集,本资源含有数据集(.txt、.data、.m)如下; Aggregation Blood Cancer D31 Ecoli Glass Iris Jain Robotnavigation Seeds Sprial Vowel Vehicle watermelon_4 Wine 等等数据集
<qq_40563761> 在 上传 | 大小:8388608

[spark] spark-2.3.0-bin-hadoop277-without-hive.tgz

说明:spark2.3.0 without hive 编译版本,用于Hive on Spark 环境搭建 ./dev/make-distribution.sh --name "hadoop277-without-hive" --tgz "-Pyarn,hadoop-provided,hadoop-2.7,parquet-provided,orc-provided" -Dhadoop.version=2.7.7
<ghl0451> 在 上传 | 大小:133169152

[spark] kettle - JOB循环 , 用于kettle失败后重试 !

说明:kettle - JOB循环 , 用于kettle失败后重试 ! 具体内容请下载查看!这里不多做解析 ! kettle - JOB循环 , 用于kettle失败后重试 ! 具体内容请下载查看!这里不多做解析 !
<weixin_43125677> 在 上传 | 大小:11264
« 1 2 ... 20 21 22 23 24 2526 27 28 29 30 ... 202 »