您好,欢迎光临本网站![请登录][注册会员]  

大数据下载列表 第893页

« 1 2 ... .88 .89 .90 .91 .92 893.94 .95 .96 .97 .98 ... 1412 »

[Hadoop] 智慧城市规划内容

说明: 智慧城市建设设计方案,包括对平台建设、数据资源、网络、应用等内容的描述
<ustcsh104> 上传 | 大小:125kb

[kafka] rocketmq安装部署过程(4.0.0版本)

说明: rocketmq安装部署过程(4.0.0版本) 很详细的讲述了rocketmq的安装过程。
<e_wsq> 上传 | 大小:983kb

[kafka] RocketMQ集群安装部署

说明: RocketMQ集群安装部署 一步一步讲述RocketMQ的安装部署和测试过程。
<e_wsq> 上传 | 大小:676kb

[kafka] jafka集群安装与部署

说明: jafka集群安装与部署 讲述jafka的整个安装和测试过程。
<e_wsq> 上传 | 大小:360kb

[Hadoop] hadoop常用脚本

说明: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 [1] Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应
<zhangsirm> 上传 | 大小:15kb

[spark] spark讲义总结1

说明: 用scala编写 底层是基于actor模式的akka框架 代码结构简洁 基于DAG(有向无环图)的执行引擎 减少了计算时数据频繁读写到磁盘的开销 **DAG有向无环图 : spark设计之初就考虑了 大量连续计算的需求 允许在对数据处理时 经由许多步算子 按序计算来实现处理 这些处理 是一个图的结构 但是要注意的是 图有向但是不能形成环 防止死循环 这样的有向无环的处理过程就称之为Spark的DAG有向无环图。
<aaron_peter> 上传 | 大小:34kb

[Storm] storm讲义总结

说明: Storm是一个开源的分布式实时计算系统,可以简单、可靠的处理大量的数据流。 Storm有很多使用场景:如实时分析,在线机器学习,持续计算,分布式RPC,ETL等等。 Storm支持水平扩展,具有高容错性,保证每个消息都会得到处理,而且处理速度很快(在一个小集群中,每个结点每秒可以处理数以百万计的消息)。 Storm的部署和运维都很便捷,而且更为重要的是可以使用任意编程语言来开发应用。
<aaron_peter> 上传 | 大小:58kb

[Hive] Hive总结讲义

说明: ive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
<aaron_peter> 上传 | 大小:22kb

[Hbase] HBASE讲义文档

说明: 基于hadoop的数据库工具 来源于google的一片论文BigTable 后来由Apache做了开源实现 就是HBase 是一种 NoSQL 非关系型的数据库 不符合关系型数据库的范式 适合存储 半结构化 非结构化 的数据 适合存储 稀疏的数据 空的数据不占用空间 面向列(族)进行存储 提供实时增删改查的能力 是一种真正的数据库 可以存储海量数据 性能也很强大 可以实现上亿条记录的毫秒级别的查询 但是不能提供严格的事务控制 只能在行级别保证事务 是一个高可靠性 高性能 面向列 可伸缩的分布式
<aaron_peter> 上传 | 大小:23kb

[Hadoop] hadoop讲义

说明: 2004年,开发一款搜索引擎,nutch。nutch基于Lucence实现的搜索引擎,能够从互联网上抓取网页数据。抓取来的海量数据的存储问题。但是,这些海量数据都是非结构化数据,不能存在关系型数据库里。如果连数据的存储和管理都解决不了的话,就谈不上后续为用户提供搜索服务,包括通过算法去优化检索速度
<aaron_peter> 上传 | 大小:4mb

[Hadoop] flume学习总结3

说明: flume是分布式的,可靠的,用于从不同的来源有效收集 聚集 和 移动 大量的日志数据用以集中式的数据存储的系统。 是apache的一个顶级项目
<aaron_peter> 上传 | 大小:855kb

[Hadoop] flume学习总结1

说明: flume是分布式的,可靠的,用于从不同的来源有效收集 聚集 和 移动 大量的日志数据用以集中式的数据存储的系统。 是apache的一个顶级项目
<aaron_peter> 上传 | 大小:169kb
« 1 2 ... .88 .89 .90 .91 .92 893.94 .95 .96 .97 .98 ... 1412 »