您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第176页

« 1 2 ... .71 .72 .73 .74 .75 176.77 .78 .79 .80 .81 ... 1412 »

[Hadoop] 美国ncdc官网气象数据集1943至1944年数据

说明:对于学习大数据的最好的数据集,数据简单,但是网络上只有少数几年的数据,规模不大,本人直接从美国ncdc官网爬下来的(每次只能上传220,所以需要分批上传)
<neo_lee> 上传 | 大小:137mb

[Hadoop] 美国ncdc官网气象数据集1945至1947年数据

说明:对于学习大数据的最好的数据集,数据简单,但是网络上只有少数几年的数据,规模不大,本人直接从美国ncdc官网爬下来的(每次只能上传220,所以需要分批上传)
<neo_lee> 上传 | 大小:200mb

[Hadoop] HDFS构架设计和读写流程.docx

说明:HDFS构架设计和读写流程
<sinat_32778829> 上传 | 大小:166kb

[spark] 数据质量评估框架.pdf

说明:数据治理 资产盘点 监控质量标准。数据治理 资产盘点 监控质量标准 数据治理 资产盘点 监控质量标准
<mingjuezhe> 上传 | 大小:253kb

[Hadoop] azkaban-3.59.zip

说明:azkaban-3.5.9 编译好的项目包 包含:azkaban-db-0.1.0-SNAPSHOT.tar.gz、azkaban-exec-server-0.1.0-SNAPSHOT.tar.gz、azkaban-solo-server-0.1.0-SNAPSHOT.tar.gz、azkaban-web-server-0.1.0-SNAPSHOT.tar.gz 自己亲测有效
<wangxuelei036> 上传 | 大小:56mb

[Hive] kettle8.2连接hive驱动包.zip

说明:hive,jdbc,kettle,驱动包, kettle8.2连接hive驱动包: hive-jdbc-1.1.0-cdh5.14.2.jar
<yingjay519> 上传 | 大小:28mb

[算法与数据结构] 通用全量抽取.rar

说明:使用kettle实现的通用全量抽取,需要抽取的表配置到文本文件中。数据库连接需要自己情况重新配置调整,考虑到通用性,表结构创建需要自己提前在目标数据库中创建
<u010238780> 上传 | 大小:268kb

[Hadoop] sqoop导出数据到mysql故障处理---完整检查日志方法总结.txt

说明:sqoop问题处理通用办法,首先详细描绘了一个sqoop实际问题得处理过程,然后延申到完整得hadoop日志得处理过程。非常具体实用。
<ggaosong> 上传 | 大小:19kb

[Hadoop] 调度系统-----azkaban任务环境配置使用说明.txt

说明:描述真实大数据集群下,azkaban调度得运维实践步骤。 特别是azkaban重启后得一些坑,例如executor在mysql中得元数据记录处理。启动步骤。
<ggaosong> 上传 | 大小:4kb

[spark] kudu-spark2_2.11-1.8.0.jar

说明:spark操作kudu所依赖的官方jar包 写入,建表,删除表等。。
<weixin_39347555> 上传 | 大小:9mb

[Hive] hive-win-bin.zip

说明:hive高版本中已经没有提供windows下的运行脚本了,使用Cygwin有些问题,配置经常出现正反斜杠的问题,资源为hive的windows下的运行脚本,下载覆盖bin目录就可以了,也可以根据自己需要选择脚本添加到bin目录中,如果执行覆盖操作,请先备份。
<trayvontang> 上传 | 大小:47kb

[Hadoop] CentOS6.5+Ambari+HDP安装配置.docx

说明:CentOS 6.5 安装Ambari,Apache Ambari是一个基于Web的支持Apache Hadoop集群的供应、管理和监控的开源工具,Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。提供Web UI进行可视化的集群管理,简化了大数据平台的安装、使用难度。
<qq_34639682> 上传 | 大小:2mb
« 1 2 ... .71 .72 .73 .74 .75 176.77 .78 .79 .80 .81 ... 1412 »