您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第1236页

« 1 2 ... .31 .32 .33 .34 .35 1236.37 .38 .39 .40 .41 ... 1438 »

[Hadoop] 爬虫功能实现

说明: 1)通过爬取深度的检测,来屏蔽掉深度过深的连接地址。 2)通过多线程,提升爬虫的并发处理速度。
<qq_40967964> 在 上传 | 大小:306176

[算法与数据结构] EM算法进行图像分割

说明: 最大期望算法 EM(expectation-maximization)算法主要是用于在不完全数据的情况下计算最大似然估计。在EM算法正式提出以来,人们对EM算法的性质有更加深入的研究。EM算法在数理统计,数据挖掘,机器学习以及模式识别等领域有广泛的应用。
<mengyingyingstar> 在 上传 | 大小:1024

[Hadoop] Hadoop-10-years

说明: hadoop架构十年发展与应用实践 hadoop架构十年发展与应用实践 hadoop架构十年发展与应用实践
<kudingcha5279> 在 上传 | 大小:2097152

[Hadoop] kafka_2.11-1.0.0.tar.gz

说明: Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。
<jimme2> 在 上传 | 大小:49283072

[spark] Spark 垃圾邮件分类

说明: 基于Spark mlib 的垃圾邮件分类 实现文档 使用Scala实现
<whoami_zy> 在 上传 | 大小:289792

[kafka] Kafka设计解析

说明: 针对kafka设计原理作了深入的解析,通过该文档可以了解kafka的设计理念和原理。
<lp5563226> 在 上传 | 大小:3145728

[算法与数据结构] 轨迹大数据处理关键技术研究综述

说明: 轨迹大数据处理关键技术研究综述ppt,根据“轨迹大数据:数据处理关键技术研究综述”,软件学报上的一篇文章整理而来,包括轨迹数据概述、轨迹数据预处理、轨迹索引与检索、轨迹数据挖掘、轨迹数据隐私保护、轨迹数据处理新技术及总结
<csdn_wujian> 在 上传 | 大小:3145728

[spark] learning-spark-streaming

说明: Structured Streaming 是一个可拓展,容错的,基于Spark SQL执行引擎的流处理引擎。使用小量的静态数据模拟流处理。伴随流数据的到来,Spark SQL引擎会逐渐连续处理数据并且更新结果到最终的Table中。你可以在Spark SQL上引擎上使用DataSet/DataFrame API处理流数据的聚集,事件窗口,和流与批次的连接操作等。最后Structured Streaming 系统快速,稳定,端到端的恰好一次保证,支持容错的处理。
<winterfellduke> 在 上传 | 大小:6291456

[算法与数据结构] 大数据时代 如何预见未来的生活和自己

说明: 未来世界中,我们的预测将更准确,涉及更多个人信息,因此,个人生活和公共环境都会发生重大变化。未来更多领域的信息会置于阳光下,确实堪称‘赤裸裸的未来’。
<the_twilight> 在 上传 | 大小:40894464

[Hive] impala hive jdbc所依赖全部jar包

说明: impala_jdbc_2.5.41.1061(最新) hive_jdbc_2.5.19.1053(最新) 均包含英文使用说明文档,兼容绝大多数的hive/impala版本 该资源来自cloudera,仅用于分享知识,学习和交流,请勿用于商业用途
<norhtstorm> 在 上传 | 大小:31457280

[Hadoop] 高级大数据工程师面试题库

说明: 里面涵盖多种大数据面试题。供进行大数据面试的同学和进行相关学习的同学参考。
<m0_37125796> 在 上传 | 大小:484352

[算法与数据结构] 网页排序算法PageRank论文(Larry Page)

说明: 谷歌搜索引擎网页排序算法,PageRank(拉里·佩奇和谢尔盖·布林)算法。
<cavout> 在 上传 | 大小:231424
« 1 2 ... .31 .32 .33 .34 .35 1236.37 .38 .39 .40 .41 ... 1438 »