您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第170页

« 1 2 ... .65 .66 .67 .68 .69 170.71 .72 .73 .74 .75 ... 1412 »

[Hadoop] msvcr120.dll

说明:hadoop-eclipse-plugin.jar,解决如何在window下操作hadoop问题
<m0_37657725> 上传 | 大小:941kb

[Hadoop] log4j.properties

说明:在window平台打印出在linux下hadoo的日志信息,便于差错,进行代码修改
<m0_37657725> 上传 | 大小:375byte

[Hadoop] hdfs1073.pdf

说明:HDFS-1073 Design Document, Transaction IDs 2 1.1 Persistent Transaction IDs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Non-namespace transactions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
<m0_37657725> 上传 | 大小:189kb

[spark] 百度数据工厂在流式数据处理的应用与实践

说明:百度数据工厂整合了各种解决方案,目的就是提供一个一站式的数据处理平台。 百度数据工厂最原先用 Hive 引擎,进行离线批量数据分析和 PB 级别的查询,处理一些核心报表数据。但是在推广过程中发现,用户其实还是有复杂分析、实时处理、数据挖掘的请求,现在则以 Spark 为基础做了统一的一个计算引擎,以前 Hive 的一套也完全融入到 Spark 里来;包括多种提交方式;安全管理等等。最后形成一套完整的成品。
<longlongriver> 上传 | 大小:718kb

[Hadoop] Linux下Hadoop2.7.3集群环境的搭建.docx

说明:本文旨在提供最基本的,可以用于在生产环境进行Hadoop、HDFS分布式环境的搭建,对自己是个总结和整理,也能方便新人学习使用。
<kjdw2> 上传 | 大小:1mb

[Hadoop] hadoop安装和配置.docx

说明:本文hadoop的版本为hadoop-2.2.0,java jdk1.7版本
<kjdw2> 上传 | 大小:196kb

[Hadoop] hadoop学习---运行第一个hadoop实例.docx

说明:hadoop学习---运行第一个hadoop实例。hadoop环境搭建好后,运行第wordcount示例
<kjdw2> 上传 | 大小:204kb

[Hadoop] Hadoop-plugin-eclipse-2.6.5.zip

说明:Hadoop2.6.5-eclipse-plugin是Hadoop2.6.5关于eclipse的插件
<weixin_40743261> 上传 | 大小:30mb

[Hadoop] Airflow使用指南【About云整理】.pdf

说明:About云整理的Airflow使用指南 1. 如何安装和配置 Airflow? 2. 如何通过 Airflow UI 监控 data pipeline (管道)并对其进行故障排除 3. 什么是 Airflow Platform ? 4. Airflow 是如何进行数据分析,追踪数据,调试数据流的? 5. Airflow 命令行接口的基本操作有哪些?www.aboutyun.com活到老学到老 以下是一些将触发一些任务实例的命令。在运行以下命令时,您应该能够在 example bash
<bj278595437> 上传 | 大小:2mb

[kafka] kafka_2.12-1.0.2.tgz

说明:We build for multiple versions of Scala. This only matters if you are using Scala and you want a version built for the same Scala version you use. Otherwise any version should work (2.11 is recommended).
<qiaorh11> 上传 | 大小:42mb

[kafka] Kafka Streams 实战 - 源码.zip

说明:Kafka Streams是Kafka提供的一个用于构建流式处理程序的Java库,它与Storm、Spark等流式处理框架不同,是一个仅依赖于Kafka的Java库,而不是一个流式处理框架。除Kafka之外,Kafka Streams不需要额外的流式处理集群,提供了轻量级、易用的流式处理API。
<qiaorh11> 上传 | 大小:44mb

[算法与数据结构] 分类技术---二分网络上的链路预测(数据挖掘上机)

说明:数据挖掘的上机实验,包括文档和代码,是用c++实现的,用于电影推荐。 本实验通过6040个用户对3952部电影的100多万条评价,利用基于网络结构的链路预测算法,使用二分法模型,将用户和产品看成抽象的节点,把用户对产品的选择关系构建成二部图,以此预测用户潜在喜爱的电影,将排序靠前的电影推荐给该用户,并预测其准确性。
<qys27182812> 上传 | 大小:9mb
« 1 2 ... .65 .66 .67 .68 .69 170.71 .72 .73 .74 .75 ... 1412 »