您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第1318页

« 1 2 ... .13 .14 .15 .16 .17 1318.19 .20 .21 .22 .23 ... 1412 »

[Storm] storm学习资料

说明: storm学习进阶资料,适合入门学习,进阶实操。低延迟。都说了是实时计算系统了,延迟是一定要低的。 高性能。性能不高就是浪费机器,浪费机器是要受批评的哦。 分布式。系统都是为应用场景而生的,如果你的应用场景、你的数据和计算单机就能搞定,那么不用考虑这些复杂的问题了。我们所说的是单机搞不定的情况。 可扩展。伴随着业务的发展,我们的数据量、计算量可能会越来越大,所以希望这个系统是可扩展的。 容错。这是分布式系统中通用问题。一个节点挂了不能影响我的应用。
<aa5305123> 上传 | 大小:16mb

[Hadoop] Google三大论文英文原版+中文版

说明: 《Google file system》:论述了怎样借助普通机器有效的存储海量的大数据; 《Google MapReduce》:论述了怎样快速计算海量的数据; 《Google BigTable》:论述了怎样实现海量数据的快速查询;
<q748893892> 上传 | 大小:3mb

[Hadoop] Google_MapReduce论文中文版

说明: 谷歌在03到06年间连续发表了三篇很有影响力的文章,分别是03年SOSP的GFS,04年OSDI的MapReduce,和06年OSDI的BigTable。SOSP和OSDI都是操作系统领域的顶级会议,在计算机学会推荐会议里属于A类。SOSP在单数年举办,而OSDI在双数年举办。
<q748893892> 上传 | 大小:491kb

[算法与数据结构] python cookbook中文版

说明: 一本适用于初学者入门的python书,本书介绍python应用在各个领域中的使用技巧和方法,其主题涵盖了数据结构和算法。
<lilulilu220723> 上传 | 大小:29mb

[算法与数据结构] ETL的主要步骤

说明: ETL(Extract Transform Loading, 数据抽取转化装载规则)是负责完成是数据源数据向数据仓库数 据的转化的过程。是实施数据仓库中最重要的步骤。可以形象的说,ETL 的角色相当于砖石修葺成房 子的过程。在数据仓库系统设计中最难的部分是用户需求分析和模型设计,那么工作量最大的就是 ETL 规则的设计和实施了,它要占到整个数据仓库设计工作量的60%-70%,甚至更多。 下面是本人对ETL 的几个重要步骤理解,和大家分享! 一、ODS 区的数据采集: 最主要作用为了尽量减少对业
<luyangbai> 上传 | 大小:104kb

[算法与数据结构] BI项目中ETL设计与思考

说明: ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节。通常情况下,在BI项目中ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败
<luyangbai> 上传 | 大小:16kb

[Hadoop] SolrJ6.3.0

说明: 放了SolrJ6.3.0所有web工程下的Jar包。solr-solrj6.3.0.jar等。放了SolrJ6.3.0所有web工程下的Jar包。放了SolrJ6.3.0所有web工程下的Jar包。
<shuaigexiaobo> 上传 | 大小:8mb

[spark] talend实时数据处理demo及配置

说明: 该文档为 Talend Big Data Insights Cookbook, 主要介绍了talend 处理实时数据的场景及配置, IDE需要到官网下载Real-Time Big Data Platform(非开源版本), 由于国内访问官方网站比较慢, 所以通过这个平台进行分享.
<zjut222> 上传 | 大小:8mb

[Hadoop] 中国邮政大数据Hadoop平台投标文件_技术部分

说明: 中国邮政集团已深刻认识到数据战略对企业运营以及企业未来发展方向的重要性。物流与速递行业的本质是邮务,核心是数据,载体是平台,关键是客户体验,发展趋势是互联网与邮政的深度融合,要提升大数据贡献度。因此,要深化互联网思维理念,稳步推进互联网金融产品和服务模式创新,积极利用移动互联网、大数据等新技术新手段,沉着应对冲击和挑战,实现传统金融与互联网金融的融合发展。做好海量异构数据的专业化整合集成、关联共享、安全防护和维护管理,深度挖掘数据内含的巨大价值,探索邮政业务创新,实现数据资源的综合应用、深度应
<keardy> 上传 | 大小:20mb

[spark] zeppelin_docs

说明: zeppelin source for documents.zeppelin source for documents.zeppelin source for documents.zeppelin source for documents.
<qingsongjiang1> 上传 | 大小:2mb

[算法与数据结构] 马氏链模型

说明: 现实世界中有很多这样的现象:某一系统在已知现在情况的条件下,系统未来时刻 的情况只与现在有关,而与过去的历史无直接关系。描述这类随机现象的数学模型称 为马氏模型。
<qq_19528953> 上传 | 大小:158kb

[算法与数据结构] introduction to data mining instructors solution manual

说明: 数据挖掘导论课后习题参考答案。introduction to data mining instructors solution manual. Pang-Ning Tan, Michael Steinbach, Vipin kumar
<howard_m> 上传 | 大小:1mb
« 1 2 ... .13 .14 .15 .16 .17 1318.19 .20 .21 .22 .23 ... 1412 »