搜索资源 - Hadoop分布式文件系统 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - Hadoop分布式文件系统

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

hbase-2.2.6-bin.tar.gz
hbase-2.2.6-bin.tar.gz HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个
所属分类：Hbase
- 发布日期：2020-10-28
- 文件大小：220200960
- 提供者：qq_45059457

hbase Hell 命令大全.xlsx
HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
所属分类：群集服务
- 发布日期：2020-11-04
- 文件大小：10240
- 提供者：qq_45059457

spark-2.0.2客户端
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎,Spark 是一种与 Hadoop 相似的开源集群计算环境,尽管创建 Spark 是为了支持分布式数据集上的迭代作业，但是实际上它是对 Hadoop 的补充，可以在 Hadoop 文件系统中并行运行
所属分类：spark
- 发布日期：2020-11-20
- 文件大小：204472320
- 提供者：weixin_43173093

07hadoop的安装&hdfs集群的配置与测试——好程序
hadoop单机安装与测试 1•Local (Standalone) Mode（单节点的本地模式）Linux的文件系统就是hadoop的存储系统运行在单个的jvm环境，它使用linux的文件系统，适用于开发、测试、调试环境运行案例 2•Pseudo-Distributed Mode（伪分布式模式，其实也是在一台机器上）做自己搭一下（最后）熟悉hdfs shell hdfs dfs -help 3•Fully-Distributed Mode（分布在多个节点上，每个节点上都在运行）
所属分类：其它
- 发布日期：2021-01-07
- 文件大小：1048576
- 提供者：weixin_38544781

Spark学习笔记—Spark计算模型
一.弹性分布式数据集-RDD RDD是Spark核心数据结构，它是逻辑集的实体，在集群中多台机器之间进行数据分区，通过对多台机器上RDD分区的控制，能够减少数据的重排(data Shuffling)。Spark通过partitionBy运算符对原始RDD进行数据再分配从而创建一个新的RDD。通过RDD之间的依赖关系形成了Spark的调度顺序。 1.RDD的几种创建方式： (1).从hadoop文件系统输入创建如HDFS，也可以是其他与hadoop兼容的持久化存储系统如Hive，Hbase创建。
所属分类：其它
- 发布日期：2021-01-07
- 文件大小：89088
- 提供者：weixin_38562026

Scala基础(11) 运行基本流程及RDD
Spark和Hadoop的比较 MapReduce Spark 数据存储结构：磁盘HDFS文件系统的split 使用内存构建弹性分布式数据集RDD，对数据进行运算和cache 编程范式：Map+Reduce DAG：Transformation+Action 计算中间结果写入磁盘，IO及序列化、反序列化代价大计算中间结果在内存中维护，存取速度比磁盘高几个数量级 Task以进程方式维护需要数秒时间才能够启动任务 Task以线程方式对于小数据集读取能够达到亚秒级的延
所属分类：其它
- 发布日期：2021-01-07
- 文件大小：84992
- 提供者：weixin_38579899

Spark入门（Python版）
Hadoop是对大数据集进行分布式计算的标准工具，这也是为什么当你穿过机场时能看到”大数据(BigData)”广告的原因。它已经成为大数据的操作系统，提供了包括工具和技巧在内的丰富生态系统，允许使用相对便宜的商业硬件集群进行超级计算机级别的计算。2003和2004年，两个来自Google的观点使Hadoop成为可能：一个分布式存储框架(Google文件系统)，在Hadoop中被实现为HDFS；一个分布式计算框架(MapReduce)。这两个观点成为过去十年规模分析（scalinganalytic
所属分类：其它
- 发布日期：2021-02-26
- 文件大小：245760
- 提供者：weixin_38721252

大数据和区块链之间的比较分析
大数据和区块链两者之间有个共同的关键词：分布式，代表了一种从技术权威垄断到去中心化的转变。大数据，需要应对海量化和快增长的存储，这要求底层硬件架构和文件系统在性价比上要大大高于传统技术，能够弹性扩张存储容量。谷歌的GFS和Hadoop的HDFS奠定了大数据存储技术的基础。另外，大数据对存储技术提出的另一个挑战是多种数据格式的适应能力，因此现在大数据底层的存储层不只是HDFS，还有HBase和Kudu等存储架构。区块链，是比特币的底层技术架构，它在本质上是一种去中心化的分布式账本。区块链技术作为一
所属分类：其它
- 发布日期：2021-02-25
- 文件大小：237568
- 提供者：weixin_38518668

Hbase架构与原理
HBase是ApacheHadoop中的一个子项目，Hbase依托于Hadoop的HDFS作为最基本存储基础单元，通过使用hadoop的DFS工具就可以看到这些这些数据存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作HBase是ApacheHadoop的数据库，能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的，分布式的，多版本的，面向列的存储模型。它存储的是松散型数据。上图是hadoop的生态系统描述，had
所属分类：其它
- 发布日期：2021-02-25
- 文件大小：517120
- 提供者：weixin_38557980

几种主要的非关系型数据库
文章主要介绍了Hbase、Hadoop、Redis、MongodDB、Neo4j这几种主要的非关系型数据库，希望对您有帮助。本文来自CSDN，由火龙果软件Linda编辑、推荐。列式存储以流的方式在列中存储所有的数据。对于任何记录，索引都可以快速地获取列上的数据；列式存储支持行检索，但这需要从每个列获取匹配的列值，并重新组成行。HBase（HadoopDatabase）是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。H
所属分类：其它
- 发布日期：2021-02-24
- 文件大小：291840
- 提供者：weixin_38713061

Spark入门（Python版）
Hadoop是对大数据集进行分布式计算的标准工具，这也是为什么当你穿过机场时能看到”大数据(BigData)”广告的原因。它已经成为大数据的操作系统，提供了包括工具和技巧在内的丰富生态系统，允许使用相对便宜的商业硬件集群进行超级计算机级别的计算。2003和2004年，两个来自Google的观点使Hadoop成为可能：一个分布式存储框架(Google文件系统)，在Hadoop中被实现为HDFS；一个分布式计算框架(MapReduce)。这两个观点成为过去十年规模分析（scalinganalytic
所属分类：其它
- 发布日期：2021-02-02
- 文件大小：245760
- 提供者：weixin_38733367

Hypertable简介(一个C++的Bigtable开源实现)
随着互联网技术的发展，尤其是云计算平台的出现，分布式应用程序需要处理大量的数据(PB级)。在一个或多个云计算平台中(成千上万的计算主机)，如何保证数据的有效存储和组织，为应用提供高效和可靠的访问接口，并且保持良好的伸缩性和可扩展性，成为云计算平台需要解决的关键问题之一。分布式并行文件系统，为云计算平台解决了海量数据存储问题，并且提供了统一的文件系统命令空间，如GFS、Hadoop HDFS、KFS等，在此基础上，Hypertable实现了分布式结构化的数据组织，Hypertable可以对海量的结
所属分类：其它
- 发布日期：2021-01-31
- 文件大小：1048576
- 提供者：weixin_38701640

Hypertable简介(一个C++的Bigtable开源实现)
随着互联网技术的发展，尤其是云计算平台的出现，分布式应用程序需要处理大量的数据(PB级)。在一个或多个云计算平台中(成千上万的计算主机)，如何保证数据的有效存储和组织，为应用提供高效和可靠的访问接口，并且保持良好的伸缩性和可扩展性，成为云计算平台需要解决的关键问题之一。分布式并行文件系统，为云计算平台解决了海量数据存储问题，并且提供了统一的文件系统命令空间，如GFS、Hadoop HDFS、KFS等，在此基础上，Hypertable实现了分布式结构化的数据组织，Hypertable可以对海量的结
所属分类：其它
- 发布日期：2021-01-31
- 文件大小：1048576
- 提供者：weixin_38500117

Hypertable简介(一个C++的Bigtable开源实现)
随着互联网技术的发展，尤其是云计算平台的出现，分布式应用程序需要处理大量的数据(PB级)。在一个或多个云计算平台中(成千上万的计算主机)，如何保证数据的有效存储和组织，为应用提供高效和可靠的访问接口，并且保持良好的伸缩性和可扩展性，成为云计算平台需要解决的关键问题之一。分布式并行文件系统，为云计算平台解决了海量数据存储问题，并且提供了统一的文件系统命令空间，如GFS、Hadoop HDFS、KFS等，在此基础上，Hypertable实现了分布式结构化的数据组织，Hypertable可以对海量的结
所属分类：其它
- 发布日期：2021-01-31
- 文件大小：1048576
- 提供者：weixin_38570519

大数据和区块链之间的比较分析
大数据和区块链两者之间有个共同的关键词：分布式，代表了一种从技术权威垄断到去中心化的转变。大数据，需要应对海量化和快增长的存储，这要求底层硬件架构和文件系统在性价比上要大大高于传统技术，能够弹性扩张存储容量。谷歌的GFS和Hadoop的HDFS奠定了大数据存储技术的基础。另外，大数据对存储技术提出的另一个挑战是多种数据格式的适应能力，因此现在大数据底层的存储层不只是HDFS，还有HBase和Kudu等存储架构。区块链，是比特币的底层技术架构，它在本质上是一种去中心化的分布式账本。区块
所属分类：其它
- 发布日期：2021-01-29
- 文件大小：237568
- 提供者：weixin_38663544

Hbase架构与原理
HBase是ApacheHadoop中的一个子项目，Hbase依托于Hadoop的HDFS作为最基本存储基础单元，通过使用hadoop的DFS工具就可以看到这些这些数据存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作HBase是ApacheHadoop的数据库，能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的，分布式的，多版本的，面向列的存储模型。它存储的是松散型数据。上图是hadoop的生态系统描述，had
所属分类：其它
- 发布日期：2021-01-27
- 文件大小：517120
- 提供者：weixin_38599545

详解HBase架构原理
HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价的PCServer上搭建大规模结构化存储集群。 HBase是GoogleBigTable的开源实现，与GoogleBigTable利用GFS作为其文件存储系统类似，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MapReduce来处理BigTable中的海量数据，HBase同样利用Hadoop
所属分类：其它
- 发布日期：2021-01-27
- 文件大小：385024
- 提供者：weixin_38502693

【1】HDFS概述
1. HDFS产出背景及定义（1）产生背景随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。（2）定义 HDFS（Hadoop Distributed File System），它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。 HDFS的
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：543744
- 提供者：weixin_38710198

基于分布式深度网络的网络舆情分析方法研究与实现
针对网络舆情监督系统中快速识别分析的需求，文中基于分布式计算、深度神经网络等技术，实现深度置信神经网络（DBN）的分布式部署与并行化训练。在训练数据的存储上，设计基于Hadoop的HDFS文件存储系统。在模型训练时，依据DBN网络中玻尔兹曼机（RBN）节点的独立性，设计模型的并行化训练结构。文中搭建7个计算节点的分布式计算环境进行仿真试验，仿真结果表明，在该环境下相同参数的DBN网络训练时间可以优化至单计算节点环境的1/6。此外，训练时间的降低与计算节点数的增加并非正相关，在实际的分布式计算环境
所属分类：其它
- 发布日期：2021-01-12
- 文件大小：1048576
- 提供者：weixin_38647039

hbase shell基础和常用命令详解
HBase是Google Bigtable的开源实现，它利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。 1. 简介 HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现，它利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBase中
所属分类：其它
- 发布日期：2021-01-10
- 文件大小：101376
- 提供者：weixin_38717896

« 1 2 ... 26 27 28 29 30 3132 33 »