您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. hbase-2.2.6-bin.tar.gz

  2. hbase-2.2.6-bin.tar.gz HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个
  3. 所属分类:Hbase

    • 发布日期:2020-10-28
    • 文件大小:220200960
    • 提供者:qq_45059457
  1. hbase Hell 命令大全.xlsx

  2. HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
  3. 所属分类:群集服务

    • 发布日期:2020-11-04
    • 文件大小:10240
    • 提供者:qq_45059457
  1. spark-2.0.2客户端

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎,Spark 是一种与 Hadoop 相似的开源集群计算环境,尽管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行
  3. 所属分类:spark

    • 发布日期:2020-11-20
    • 文件大小:204472320
    • 提供者:weixin_43173093
  1. 07hadoop的安装&hdfs集群的配置与测试——好程序

  2. hadoop单机安装与测试 1•Local (Standalone) Mode(单节点的本地模式)Linux的文件系统就是hadoop的存储系统运行在单个的jvm环境,它使用linux的文件系统,适用于开发、测试、调试环境 运行案例 2•Pseudo-Distributed Mode(伪分布式模式,其实也是在一台机器上) 做自己搭一下(最后) 熟悉hdfs shell hdfs dfs -help 3•Fully-Distributed Mode(分布在多个节点上,每个节点上都在运行)
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:1048576
    • 提供者:weixin_38544781
  1. Spark学习笔记—Spark计算模型

  2. 一.弹性分布式数据集-RDD RDD是Spark核心数据结构,它是逻辑集的实体,在集群中多台机器之间进行数据分区,通过对多台机器上RDD分区的控制,能够减少数据的重排(data Shuffling)。Spark通过partitionBy运算符对原始RDD进行数据再分配从而创建一个新的RDD。通过RDD之间的依赖关系形成了Spark的调度顺序。 1.RDD的几种创建方式: (1).从hadoop文件系统输入创建如HDFS,也可以是其他与hadoop兼容的持久化存储系统如Hive,Hbase创建。
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:89088
    • 提供者:weixin_38562026
  1. Scala基础(11) 运行基本流程及RDD

  2. Spark和Hadoop的比较 MapReduce Spark 数据存储结构:磁盘HDFS文件系统的split 使用内存构建弹性分布式数据集RDD,对数据进行运算和cache 编程范式:Map+Reduce DAG:Transformation+Action 计算中间结果写入磁盘,IO及序列化、反序列化代价大 计算中间结果在内存中维护,存取速度比磁盘高几个数量级 Task以进程方式维护 需要数秒时间才能够启动任务 Task以线程方式 对于小数据集读取能够达到亚秒级的延
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:84992
    • 提供者:weixin_38579899
  1. Spark入门(Python版)

  2. Hadoop是对大数据集进行分布式计算的标准工具,这也是为什么当你穿过机场时能看到”大数据(BigData)”广告的原因。它已经成为大数据的操作系统,提供了包括工具和技巧在内的丰富生态系统,允许使用相对便宜的商业硬件集群进行超级计算机级别的计算。2003和2004年,两个来自Google的观点使Hadoop成为可能:一个分布式存储框架(Google文件系统),在Hadoop中被实现为HDFS;一个分布式计算框架(MapReduce)。这两个观点成为过去十年规模分析(scalinganalytic
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:245760
    • 提供者:weixin_38721252
  1. 大数据和区块链之间的比较分析

  2. 大数据和区块链两者之间有个共同的关键词:分布式,代表了一种从技术权威垄断到去中心化的转变。大数据,需要应对海量化和快增长的存储,这要求底层硬件架构和文件系统在性价比上要大大高于传统技术,能够弹性扩张存储容量。谷歌的GFS和Hadoop的HDFS奠定了大数据存储技术的基础。另外,大数据对存储技术提出的另一个挑战是多种数据格式的适应能力,因此现在大数据底层的存储层不只是HDFS,还有HBase和Kudu等存储架构。区块链,是比特币的底层技术架构,它在本质上是一种去中心化的分布式账本。区块链技术作为一
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:237568
    • 提供者:weixin_38518668
  1. Hbase架构与原理

  2. HBase是ApacheHadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作HBase是ApacheHadoop的数据库,能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的,分布式的,多版本的,面向列的存储模型。它存储的是松散型数据。上图是hadoop的生态系统描述,had
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:517120
    • 提供者:weixin_38557980
  1. 几种主要的非关系型数据库

  2. 文章主要介绍了Hbase、Hadoop、Redis、MongodDB、Neo4j这几种主要的非关系型数据库,希望对您有帮助。本文来自CSDN,由火龙果软件Linda编辑、推荐。列式存储以流的方式在列中存储所有的数据。对于任何记录,索引都可以快速地获取列上的数据;列式存储支持行检索,但这需要从每个列获取匹配的列值,并重新组成行。HBase(HadoopDatabase)是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。H
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:291840
    • 提供者:weixin_38713061
  1. Spark入门(Python版)

  2. Hadoop是对大数据集进行分布式计算的标准工具,这也是为什么当你穿过机场时能看到”大数据(BigData)”广告的原因。它已经成为大数据的操作系统,提供了包括工具和技巧在内的丰富生态系统,允许使用相对便宜的商业硬件集群进行超级计算机级别的计算。2003和2004年,两个来自Google的观点使Hadoop成为可能:一个分布式存储框架(Google文件系统),在Hadoop中被实现为HDFS;一个分布式计算框架(MapReduce)。这两个观点成为过去十年规模分析(scalinganalytic
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:245760
    • 提供者:weixin_38733367
  1. Hypertable简介(一个C++的Bigtable开源实现)

  2. 随着互联网技术的发展,尤其是云计算平台的出现,分布式应用程序需要处理大量的数据(PB级)。在一个或多个云计算平台中(成千上万的计算主机),如何保证数据的有效存储和组织,为应用提供高效和可靠的访问接口,并且保持良好的伸缩性和可扩展性,成为云计算平台需要解决的关键问题之一。分布式并行文件系统,为云计算平台解决了海量数据存储问题,并且提供了统一的文件系统命令空间,如GFS、Hadoop HDFS、KFS等,在此基础上,Hypertable实现了分布式结构化的数据组织,Hypertable可以对海量的结
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:1048576
    • 提供者:weixin_38701640
  1. Hypertable简介(一个C++的Bigtable开源实现)

  2. 随着互联网技术的发展,尤其是云计算平台的出现,分布式应用程序需要处理大量的数据(PB级)。在一个或多个云计算平台中(成千上万的计算主机),如何保证数据的有效存储和组织,为应用提供高效和可靠的访问接口,并且保持良好的伸缩性和可扩展性,成为云计算平台需要解决的关键问题之一。分布式并行文件系统,为云计算平台解决了海量数据存储问题,并且提供了统一的文件系统命令空间,如GFS、Hadoop HDFS、KFS等,在此基础上,Hypertable实现了分布式结构化的数据组织,Hypertable可以对海量的结
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:1048576
    • 提供者:weixin_38500117
  1. Hypertable简介(一个C++的Bigtable开源实现)

  2. 随着互联网技术的发展,尤其是云计算平台的出现,分布式应用程序需要处理大量的数据(PB级)。在一个或多个云计算平台中(成千上万的计算主机),如何保证数据的有效存储和组织,为应用提供高效和可靠的访问接口,并且保持良好的伸缩性和可扩展性,成为云计算平台需要解决的关键问题之一。分布式并行文件系统,为云计算平台解决了海量数据存储问题,并且提供了统一的文件系统命令空间,如GFS、Hadoop HDFS、KFS等,在此基础上,Hypertable实现了分布式结构化的数据组织,Hypertable可以对海量的结
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:1048576
    • 提供者:weixin_38570519
  1. 大数据和区块链之间的比较分析

  2. 大数据和区块链两者之间有个共同的关键词:分布式,代表了一种从技术权威垄断到去中心化的转变。 大数据,需要应对海量化和快增长的存储,这要求底层硬件架构和文件系统在性价比上要大大高于传统技术,能够弹性扩张存储容量。谷歌的GFS和Hadoop的HDFS奠定了大数据存储技术的基础。另外,大数据对存储技术提出的另一个挑战是多种数据格式的适应能力,因此现在大数据底层的存储层不只是HDFS,还有HBase和Kudu等存储架构。 区块链,是比特币的底层技术架构,它在本质上是一种去中心化的分布式账本。区块
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:237568
    • 提供者:weixin_38663544
  1. Hbase架构与原理

  2. HBase是ApacheHadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作HBase是ApacheHadoop的数据库,能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的,分布式的,多版本的,面向列的存储模型。它存储的是松散型数据。上图是hadoop的生态系统描述,had
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:517120
    • 提供者:weixin_38599545
  1. 详解HBase架构原理

  2. HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价的PCServer上搭建大规模结构化存储集群。 HBase是GoogleBigTable的开源实现,与GoogleBigTable利用GFS作为其文件存储系统类似,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理BigTable中的海量数据,HBase同样利用Hadoop
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:385024
    • 提供者:weixin_38502693
  1. 【1】HDFS概述

  2. 1. HDFS产出背景及定义 (1)产生背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。 (2)定义 HDFS(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。 HDFS的
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:543744
    • 提供者:weixin_38710198
  1. 基于分布式深度网络的网络舆情分析方法研究与实现

  2. 针对网络舆情监督系统中快速识别分析的需求,文中基于分布式计算、深度神经网络等技术,实现深度置信神经网络(DBN)的分布式部署与并行化训练。在训练数据的存储上,设计基于Hadoop的HDFS文件存储系统。在模型训练时,依据DBN网络中玻尔兹曼机(RBN)节点的独立性,设计模型的并行化训练结构。文中搭建7个计算节点的分布式计算环境进行仿真试验,仿真结果表明,在该环境下相同参数的DBN网络训练时间可以优化至单计算节点环境的1/6。此外,训练时间的降低与计算节点数的增加并非正相关,在实际的分布式计算环境
  3. 所属分类:其它

    • 发布日期:2021-01-12
    • 文件大小:1048576
    • 提供者:weixin_38647039
  1. hbase shell基础和常用命令详解

  2. HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。 1. 简介 HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable:一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中
  3. 所属分类:其它

    • 发布日期:2021-01-10
    • 文件大小:101376
    • 提供者:weixin_38717896
« 1 2 ... 26 27 28 29 30 3132 33 »