您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第988页

« 1 2 ... .83 .84 .85 .86 .87 988.89 .90 .91 .92 .93 ... 1438 »

[算法与数据结构] 中国成品油定价模型

说明: 好像是大二那会参加数学建模比赛写的,记不得了,关于成品油定价机制的
<leitouguan8655> 在 上传 | 大小:233472

[Hadoop] 基于Hadoop、Spark及Flink大规模数据分析的性能评价

说明: 针对目前缺少大型数据分析框架间的横向比较问题,使用有代表性的大数据工作负载,对Hadoop、Spark和Flink进行性能和可扩展性等因素的比较评价。此外,通过调整工作负载的一些主要参数,例如HDFS块大小、输入数据大小、互连网络或线程配置等,描述了这些框架的行为模式特征。实验结果分析表明,对于非排序的基准测试程序,使用Spark或Flink替代Hadoop,分别带来平均77%和70%执行时间的降低。整体上,Spark的性能结果最好;而Flink通过使用的显式迭代程序,极大提高了迭代算法的性能
<qq_28339273> 在 上传 | 大小:2097152

[Hadoop] 基于Hadoop个性化推荐算法设计与实现

说明: 为了提升个性化推荐系统的大数据处理能力,选择基于用户聚类协同过滤的个性化推荐算法,并在Hadoop平台下实现算法的分布式并行化.离线状态下对用户物品矩阵降维,对用户进行聚类得到类别信息列表,对用户在类簇内进行推荐,并在相似度计算内引入物品贡献权重,最后对算法实现并行化得到推荐结果,实现基于用户聚类的分布式协同过滤推荐算法.最后对推荐结果进行测试分析,证明分布式个性化推荐有更好的推荐准确性和实时性.
<qq_28339273> 在 上传 | 大小:368640

[Hadoop] 基于Hadoop的Apriori算法研究与优化

说明: 为解决传统数据挖掘算法在大量数据处理时面临的内存占用、计算性能等方面的问题,基于Hadoop平台,应用HBase文件存储系统对海量数据分布式存储以及Map Reduce框架进行分布式计算,实现Apriori经典数据挖掘算法。通过对已实现的Apriori算法进行优化,引入FIS-IS算法思想,从数据库扫描次数和容量消减方向进行改进。提出针对数据本身进行频繁预选项生成方法与对于频繁预选项剪枝步骤进行分组检索的优化方法。实验结果验证了改进算法对算法运行具有良好的优化效果。
<qq_28339273> 在 上传 | 大小:1048576

[Hadoop] Hadoop大数据平台安全问题和解决方案的综述

说明: 大数据时代的到来,更强的计算机和更成熟的大数据平台工具让企业从海量数据中挖掘数据价值成为了可能,尤其是基于Hadoop的大数据平台,甚至利用廉价的商业硬件处理TB、PB级别的数据.在最初Hadoop大数据平台落地建设的过程中,往往功能先行,而忽略了安全的管控策略,直到2009年Yahoo团队提出了基于Kerberos的身份验证方案,才带动了Hadoop大数据平台安全管控工作的全面开展.本文介绍了Hadoop大数据平台的基本历程,描述了2009年之前Hadoop大数据平台存在的传统安全问题,并尝
<qq_28339273> 在 上传 | 大小:1015808

[Hadoop] 基于Hadoop的FP-Growth关联规则并行改进算法

说明: 大数据环境下,传统的串行FP-Growth算法在处理海量数据时,占用内存过大、频繁项多,适用于大数据情况的PFP(parallel FP-Growth)算法存在数据量增大无法处理的缺陷。针对这些问题,提出了基于Hadoop的负载均衡数据分割FP-Growth并行算法。在Hadoop平台下,使用负载均衡和数据分割相结合的方式对原始事务数据集分片实现并行化。实验证明,基于Hadoop的负载均衡数据分割FP-Growth并行算法在处理数据量和效率上有所提高。
<qq_28339273> 在 上传 | 大小:515072

[算法与数据结构] 基于二分类Logistic模型的高一学生文理科分科预测

说明: 同样也是上学时候做的一个小实验,现在看看写的挺渣的,不过算是很用心了,思路还算完整
<leitouguan8655> 在 上传 | 大小:210944

[spark] pySpark与MySQL集成

说明: pySpark与MySQL集成,pySpark与MySQL集成,pySpark与MySQL集成
<leitouguan8655> 在 上传 | 大小:57671680

[算法与数据结构] 验证码识别

说明: 背景较浅,数字可以是各种颜色,有斜行贯穿整个验证码的情况,这种验证码识别准确率可以达到99%
<leitouguan8655> 在 上传 | 大小:15728640

[Hbase] hbase备份和数据恢复

说明: hbase备份和数据恢复,hbase与hive的互导,hbase和hdfs互导。
<dongjing991> 在 上传 | 大小:810

[Hadoop] hadoop2.7.6 x64 win10的本地文件

说明: hadoop2.7.6在win10下,使用vs2017编译的本地库,包括hdfs.dll,hadoop.dll,winutils.exe等文件。
<cntpro> 在 上传 | 大小:1048576

[kafka] Apache Kafka 1.0 Cookbook

说明: Over 100 practical recipes on using distributed enterprise messaging to handle real-time data the first half of this cookbook is about programming; this is introductory material for those with no previous knowledge of Apache Kafka. As the book progr
<ghchen> 在 上传 | 大小:4194304
« 1 2 ... .83 .84 .85 .86 .87 988.89 .90 .91 .92 .93 ... 1438 »