大数据下载列表第893页

[kafka] rocketmq安装部署过程（4.0.0版本）

说明： rocketmq安装部署过程（4.0.0版本）很详细的讲述了rocketmq的安装过程。
<e_wsq> 上传 | 大小：983kb

[kafka] RocketMQ集群安装部署

说明： RocketMQ集群安装部署一步一步讲述RocketMQ的安装部署和测试过程。
<e_wsq> 上传 | 大小：676kb

[kafka] jafka集群安装与部署

说明： jafka集群安装与部署讲述jafka的整个安装和测试过程。
<e_wsq> 上传 | 大小：360kb

说明： Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。 [1] Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应
<zhangsirm> 上传 | 大小：15kb

[spark] spark讲义总结1

说明：用scala编写底层是基于actor模式的akka框架代码结构简洁基于DAG(有向无环图)的执行引擎减少了计算时数据频繁读写到磁盘的开销 **DAG有向无环图： spark设计之初就考虑了大量连续计算的需求允许在对数据处理时经由许多步算子按序计算来实现处理这些处理是一个图的结构但是要注意的是图有向但是不能形成环防止死循环这样的有向无环的处理过程就称之为Spark的DAG有向无环图。
<aaron_peter> 上传 | 大小：34kb

[Storm] storm讲义总结

说明： Storm是一个开源的分布式实时计算系统，可以简单、可靠的处理大量的数据流。 Storm有很多使用场景：如实时分析，在线机器学习，持续计算，分布式RPC，ETL等等。 Storm支持水平扩展，具有高容错性，保证每个消息都会得到处理，而且处理速度很快(在一个小集群中，每个结点每秒可以处理数以百万计的消息)。 Storm的部署和运维都很便捷，而且更为重要的是可以使用任意编程语言来开发应用。
<aaron_peter> 上传 | 大小：58kb

[Hive] Hive总结讲义

说明： ive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。
<aaron_peter> 上传 | 大小：22kb

[Hbase] HBASE讲义文档

说明：基于hadoop的数据库工具来源于google的一片论文BigTable 后来由Apache做了开源实现就是HBase 是一种 NoSQL 非关系型的数据库不符合关系型数据库的范式适合存储半结构化非结构化的数据适合存储稀疏的数据空的数据不占用空间面向列(族)进行存储提供实时增删改查的能力是一种真正的数据库可以存储海量数据性能也很强大可以实现上亿条记录的毫秒级别的查询但是不能提供严格的事务控制只能在行级别保证事务是一个高可靠性高性能面向列可伸缩的分布式
<aaron_peter> 上传 | 大小：23kb