您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第998页

« 1 2 ... .93 .94 .95 .96 .97 998.99 .00 .01 .02 .03 ... 1438 »

[Hadoop] 零基础(Cloudera_CDH)入门线路指导

说明: cloudera(CDH) 官网介绍:安装包、离线包该 如何下载、官方文档等介绍 问题导读: 1. 如何进入 cloudera 官网? 2. 如何下载 CM 、CDH 离线包? 3. 如何找到 CM 的在线安装包? 4.cloudera 在哪可以找到? 进入官网: 主页: http://www.cloudera.com/content/cloudera/en/home.html 进入下载区域: 进入主页,我们会看到 download,点击 download
<u011582920> 在 上传 | 大小:2097152

[kafka] Kafka读数工具

说明: 一款简单易操作的kafka读取数据的工具,使用方法内附有详细说明。lib中加入系列化的jar包,启动kafka-tool.bat,选择并填写好序列化方式以及kafka的信息即可以使用。
<turnhopesliu> 在 上传 | 大小:19922944

[算法与数据结构] 中压配电网小电流故障在线定位系统的研究与实现_邓宏怀

说明: 中压配电网小电流故障在线定位系统的研究与实现;共享文档
<prisnow> 在 上传 | 大小:835584

[Hbase] HBase3.0参考指南

说明: HBase3.0参考指南 This is the official reference guide for the HBase version it ships with. Herein you will find either the definitive documentation on an HBase topic as of its standing when the referenced HBase version shipped, or it will point to the l
<u011582920> 在 上传 | 大小:12582912

[算法与数据结构] fast-unfolding社团聚类算法Python代码包

说明: fast-folding算法是复杂网络当中进行社团划分简单高效也是应用最广泛的算法,代码包可以直接通过Python进行安装使用。
<weixin_38616618> 在 上传 | 大小:23552

[算法与数据结构] 【2018新书】写给计算机科学的离散数学(Discrete Mathematics for Computer Science)

说明: 【2018新书】写给计算机科学的离散数学(Discrete Mathematics for Computer Science)
<zhoujianjun2> 在 上传 | 大小:19922944

[spark] 基于Spark技术的网络大数据分析平台搭建与应用

说明: 搭建基于Spark技术的网络大数据分析平台,对信令进行分析和处理,提升了分析效率。通过现网实际数据验证,该平台具有高效和可扩展性强的特点,未来可适用范围较广。
<qq_28339273> 在 上传 | 大小:478208

[spark] 基于Spark的并行遗传算法在状态方程构建中的应用

说明: 对状态方程参数的确定问题,提出了基于Spark的变化搜索空间的并行遗传算法。把参数确定问题转化为函数最优化问题,可以使用遗传算法求解。通过将遗传算法与Spark相结合,加快算法的计算速度。在此基础上开发了基于Spark的并行遗传算法程序,数值实验表明算法可以用来解决状态方程中参数的确定问题,且实验所得结果的精度只与实验数据的精度有关。同时实验数据表明并行的遗传算法不仅可以加快计算速度还可以提高结果的精度和稳定性。
<qq_28339273> 在 上传 | 大小:537600

[spark] 基于Spark的大数据挖掘技术的研究

说明: Spark在实际的工业生产和实践中已经获得了广泛的应用,但是由于其诞生的时间较晚,版本更新速度慢。现阶段,使用Spark框架在某些具体的大数据场景中能对其挖掘,就要结合原有的模块改写部分功能,发挥其应有的作用。解决大数据挖掘问题的同时,Spark框架由于功能性不足,如进行机器学习库的时候的MLlib里面解决关联新问题的分布式机器学习算法还有不足之处。故此,该文就Spark大数据挖掘技术开展深入的研究,希望能为该领域研究提供参考。
<qq_28339273> 在 上传 | 大小:1048576

[spark] 一种大数据交互式挖掘框架与实现

说明: 在传统的数据挖掘过程中,用户需根据专业知识对数据进行预处理,为模型设定参数后构建模型,通过评估指标判断模型是否可行。该过程的不便性体现在模型以黑盒的方式构建,用户不可见其中间过程,模型产生的结果也不易被理解。在海量数据的环境下,传统数据挖掘过程在预处理时异常数据的定位和模型生成后知识的表达方面都有不便。为了解决传统数据挖掘过程存在的问题,本文提出了一种大数据环境下的交互式数据挖掘框架。该框架使交互贯穿整个数据挖掘的过程,使得用户可以轻松定位异常输入源数据,参与模型训练过程,对模型生成的结果溯源
<qq_28339273> 在 上传 | 大小:3145728

[spark] 并行计算框架Spark的自适应缓存管理策略

说明: 并行计算框架Spark缺乏有效缓存选择机制,不能自动识别并缓存高重用度数据;缓存替换算法采用LRU,度量方法不够细致,影响任务的执行效率.本文提出一种Spark框架自适应缓存管理策略(Self-Adaptive Cache Management,SACM),包括缓存自动选择算法(Selection)、并行缓存清理算法(Parallel Cache Cleanup,PCC)和权重缓存替换算法(Lowest Weight Replacement,LWR).其中,缓存自动选择算法通过分析任务的DAG
<qq_28339273> 在 上传 | 大小:1048576

[spark] Apache Spark:大数据处理统一引擎

说明: Spark的通用性有几个重要的好处。(1)应用程序更容易开发,因为它们使用统一的API。(2)结合处理任务更有效;而先前的系统需要将数据写入存储以将其传递给另一个引擎,Spark可以在相同的数据(通常在存储器中)上运行不同的功能。(3)Spark启用了以前系统无法实现的新应用程序。自2010年发布以来,Spark已经发展为活跃的开源项目或大数据处理。
<qq_28339273> 在 上传 | 大小:69632
« 1 2 ... .93 .94 .95 .96 .97 998.99 .00 .01 .02 .03 ... 1438 »